Метод k-медиан

Метод $k$ -медиан[1][2] — применяемая в статистике и машинном обучении вариация метода $k$ -средних для задач кластеризации, где для определения центроида кластера вместо среднего вычисляется медиана. Такой подход соответствует минимизации ошибки по всем кластерам в метрике с 1-нормой, вместо метрики с 2-нормой, используемой в стандартном методе $k$ -средних.

Задача определения $k$ -медиан состоит в поиске таких $k$ центров, что сформированные по ним кластеры будут наиболее «компактными». Формально, при заданных точках данных $x_{i}$ , $k$ центров $c_{j}$ должны быть выбраны так, чтобы минимизировать сумму расстояний от каждой $x_{i}$ до ближайшего $c_{j}$ .

Метод иногда работает лучше, чем метод $k$ -средних, где минимизируется сумма квадратов расстояний. Критерий суммы расстояний широко используется для транспортных задач[3].

Ещё альтернатива — метод $k$ -медоидов, в котором ищут оптимальный медоид, а не медиану кластера (медоид является одной из точек данных, в то время как медианы таковыми быть не обязаны).

Ссылки

A. K. Jain and R. C. Dubes, Algorithms for Clustering Data: Prentice-Hall, 1981.
P. S. Bradley, O. L. Mangasarian, and W. N. Street, "Clustering via Concave Minimization, " in Advances in Neural Information Processing Systems, vol. 9, M. C. Mozer, M. I. Jordan, and T. Petsche, Eds. Cambridge, MA: MIT Press, 1997, pp. 368—374.
http://www.aladdin.cs.cmu.edu/reu/mini_probes/papers/facilitylocation.ppt

Среднее значение
Математика	Среднее степенное (взвешенное) Среднее гармоническое взвешенное Среднее геометрическое взвешенное Среднее арифметическое взвешенное Среднее квадратическое Среднее кубическое Скользящая средняя Среднее арифметико-геометрическое Среднее значение функции Среднее Колмогорова
Геометрия	Геометрический центр Барицентр
Теория вероятностей и математическая статистика	Винзоризованное среднее Выборочное среднее Математическое ожидание Медиана Мода Среднеквадратическое отклонение Среднее усечённое Условное математическое ожидание
Информационные технологии	Медоид Метод k-медиан
Теоремы	Первая теорема о среднем Вторая теорема о среднем Неравенство между средним арифметическим и средним геометрическим
Другое	Показатели центра распределения

Машинное обучение и data mining
Задачи	Задача классификации Обучение без учителя Обучение с частичным привлечением учителя Регрессионный анализ AutoML Ассоциативные правила Выделение признаков Обучение признакам Обучение ранжированию Грамматический вывод Онлайновое обучение
Обучение с учителем	Метод k-ближайших соседей Наивный байесовский классификатор Дерево решений Метод опорных векторов Линейная регрессия Логистическая регрессия Перцептрон Ансамбли моделей Бэггинг Бустинг Random forest Метод релевантных векторов
Кластерный анализ	Метод k-средних Метод нечёткой кластеризации Иерархическая кластеризация EM-алгоритм BIRCH CURE DBSCAN OPTICS Mean-shift
Снижение размерности	Факторный анализ Метод главных компонент CCA ICA LDA Неотрицательное матричное разложение t-SNE
Структурное прогнозирование	Графовая вероятностная модель Байесовская сеть Скрытая марковская модель CRF
Выявление аномалий	Метод k-ближайших соседей Локальный уровень выброса
Графовые вероятностные модели	Байесовская сеть Марковская сеть Скрытая марковская модель
Нейронные сети	Ограниченная машина Больцмана Самоорганизующаяся карта Функция активации Сигмоида Softmax Радиально-базисная функция Метод обратного распространения ошибки Глубокое обучение Многослойный перцептрон Рекуррентная нейронная сеть Долгая краткосрочная память Управляемый рекуррентный блок Свёрточная нейронная сеть U-Net Автокодировщик
Обучение с подкреплением	Марковский процесс Уравнение Беллмана Жадный алгоритм Q-обучение SARSA Temporal difference (TD)
Теория	Теория Вапника — Червоненкиса Дилемма смещения–дисперсии Теория вычислительного обучения Минимизация эмпирического риска Оккамово обучение PAC learning Статистическая теория обучения
Журналы и конференции	NeurIPS ICML ML JMLR ArXiv:cs.LG

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.