Метод Нелдера — Мида
Метод Нелдера — Мида, также известный как метод деформируемого многогранника и симплекс-метод, — метод безусловной оптимизации функции от нескольких переменных, не использующий производной (точнее — градиентов) функции, а поэтому легко применим к негладким и/или зашумлённым функциям.
Последовательные симплексы в методе Нелдера-Мида для функции Розенброка (вверху) и функции Химмельблау (внизу) | |
- Не путать с «симплекс-методом» из линейного программирования — методом оптимизации линейной системы с ограничениями.
Суть метода заключается в последовательном перемещении и деформировании симплекса вокруг точки экстремума.
Метод находит локальный экстремум и может «застрять» в одном из них. Если всё же требуется найти глобальный экстремум, можно пробовать выбирать другой начальный симплекс. Более развитый подход к исключению локальных экстремумов предлагается в алгоритмах, основанных на методе Монте-Карло, а также в эволюционных алгоритмах.
Алгоритм
Пусть требуется найти безусловный минимум функции n переменных . Предполагается, что серьёзных ограничений на область определения функции нет, то есть функция определена во всех встречающихся точках.
Параметрами метода являются:
- коэффициент отражения , обычно выбирается равным .
- коэффициент сжатия , обычно выбирается равным .
- коэффициент растяжения , обычно выбирается равным .
- «Подготовка». Вначале выбирается точка , образующие симплекс n-мерного пространства. В этих точках вычисляются значения функции: .
- «Сортировка». Из вершин симплекса выбираем три точки: с наибольшим (из выбранных) значением функции , со следующим по величине значением и с наименьшим значением функции . Целью дальнейших манипуляций будет уменьшение по крайней мере .
- Найдём центр тяжести всех точек, за исключением : . Вычислять не обязательно.
- «Отражение». Отразим точку относительно с коэффициентом (при это будет центральная симметрия, в общем случае — гомотетия), получим точку и вычислим в ней функцию: . Координаты новой точки вычисляются по формуле:
- .
- Далее смотрим, насколько нам удалось уменьшить функцию, ищем место в ряду .
- Если , то направление выбрано удачное и можно попробовать увеличить шаг. Производим «растяжение». Новая точка и значение функции .
- Если , то можно расширить симплекс до этой точки: присваиваем точке значение и заканчиваем итерацию (на шаг 9).
- Если , то переместились слишком далеко: присваиваем точке значение и заканчиваем итерацию (на шаг 9).
- Если , то выбор точки неплохой (новая лучше двух прежних). Присваиваем точке значение и переходим на шаг 9.
- Если , то меняем местами значения и . Также нужно поменять местами значения и . После этого идём на шаг 6.
- Если , то просто идём на следующий шаг 6.
- В результате (возможно, после переобозначения) .
- Если , то направление выбрано удачное и можно попробовать увеличить шаг. Производим «растяжение». Новая точка и значение функции .
- «Сжатие». Строим точку и вычисляем в ней значение .
- Если , то присваиваем точке значение и идём на шаг 9.
- Если , то первоначальные точки оказались самыми удачными. Делаем «глобальное сжатие» симплекса — гомотетию к точке с наименьшим значением :
- , .
- Последний шаг — проверка сходимости. Может выполняться по-разному, например, оценкой дисперсии набора точек. Суть проверки заключается в том, чтобы проверить взаимную близость полученных вершин симплекса, что предполагает и близость их к искомому минимуму. Если требуемая точность ещё не достигнута, можно продолжить итерации с шага 2.
Источники
- КУРС «Многомерная оптимизация». Лекция 10. Метод Нелдера — Мида на сайте Института дистанционного обучения ИНТУИТ. Подробное описание, есть иллюстрации.
- Метод Нелдера-Мида. Краткий алгоритм.
- Список ссылок на численные методы
- J. A. Nelder and R. Mead, Computer Journal, 1965, vol. 7, p. 308—313 (англ.).