Гессиан функции

Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.

Для функции , дважды дифференцируемой в точке

или

где (или ) и функция задана на -мерном вещественном пространстве (или комплексном пространстве ) с координатами (или ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы см. ниже.

Матрица Гессе

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

Определитель этой матрицы называется определителем Гессе, или просто гессианом.

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симметрия матрицы Гессе

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

Это можно также записать как

В этом случае матрица Гессе симметрична.

Критические точки функции

Если градиент (её векторная производная) равен нулю в некоторой точке , то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то  — точка локального минимума функции ,
  • если гессиан отрицательно определён, то  — точка локального максимума функции ,
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден , то  — седловая точка функции .

Вариации и обобщения

Вектор-функции

Если  — вектор-функция, то есть

то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из матриц Гессе:

При данный тензор вырождается в обычную матрицу Гессе.

Окаймлённый гессиан

При решении задачи нахождения условного экстремума функции с ограничениями

где , , для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа , который будет иметь вид[2]

Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют и такие, что и

для , то в точке функция имеет строгий условный минимум. Если же

для , то в точке функция имеет строгий условный максимум[3].

История

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

См. также

Примечания

  1. Гессиан
  2. Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I. Iowa State (7 октября 2004).
  3. Neudecker, Heinz. Matrix Differential Calculus with Applications in Statistics and Econometrics / Heinz Neudecker, Jan R. Magnus. — New York : John Wiley & Sons, 1988. — P. 136. — ISBN 978-0-471-91516-4.

Ссылки

  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.