Теорема Карунена — Лоэва
Важным принципиальным вопросом теории дискретизации является вопрос об объёме дискретного описания сигналов, то есть о количестве базисных функций, используемых для представления:
- .
Чтобы найти оптимальный базис, нужно определить класс сигналов, для которого он отыскивается, а также задать точность восстановления для этого класса. При статистическом подходе к описанию сигналов оптимальным — мерным базисом для представления отдельных реализаций сигналов обычно считается базис, при котором норма ошибки, усредненная по ансамблю реализаций, минимальна. В этом случае необходимые и достаточные условия минимума нормы ошибки представления сигнала в виде суммы базисных функций определяет теорема Карунена-Лоэва.
Популярная формулировка
Минимальное значение нормы ошибки представления сигналов на интервале протяженностью достигается при использовании в качестве базиса собственных функций оператора, ядром которого является корреляционная функция сигналов :
- ,
соответствующих наибольшим собственным значениям. При этом норма ошибки равна:
- .
Применение
В теории случайных процессов теорема Карунена-Лоэва (названа в честь Кари Карунена и Мишеля Лоэва) — представление случайного процесса в виде бесконечной линейной комбинации ортогональных функций, аналогичное представлению рядов Фурье — последовательному представлению функций на ограниченном интервале. В отличие от рядов Фурье, где коэффициенты являются действительными числами и базис представления состоит из синусоидальных функций (то есть, из функций синус и косинус с разными частотами), коэффициенты в теореме Карунена-Лоэва — случайные переменные, и базис представления зависит от процесса. Ортогональные базисные функции, использованные в этом представлении, определяет функция ковариации процесса. Если мы рассматриваем стохастический процесс как случайную функцию F, то есть процесс, в котором функция на интервале [a, b] принимает значение F, то эта теорема может рассматриваться как случайное ортонормальное разложение F.
Центрированный случайный процесс {Xt}t ∈ [a, b] (где центрирование означает, что математические ожидания E(Xt) существуют и равны нулю для всех значений параметра t из [a, b]), удовлетворяющий техническому условию непрерывности, допускает разложение следующего вида:
где Zk — взаимнонекоррелированые случайные величины и функции ek — непрерывные вещественные функции на [a, b], ортогональные в L² [a, b]. В случае нецентрированного процесса имеет место аналогичное разложение, получаемое разложением функции математического ожидания в базисе ek.
Если процесс гауссовский, то случайные величины Zk — тоже гауссовские и являются независимыми. Этот результат обобщает преобразования Карунена-Лоэва. Важным примером центрированного случайного процесса на интервале [0,1] является винеровский процесс, и теорема Карунена-Лоэва может быть использована для получения канонического ортогонального представления. В этом случае разложение состоит из синусоидальных функций.
Приведенные выше разложения в также известны как разложения или декомпозиция Карунена-Лоэва (эмпирическая версия, то есть, с коэффициентами из исходных числовых данных), как анализ главных компонент, собственное ортогональное разложение или преобразование Хотеллинга.
Формулировка
Сформулируем результат в терминах комплекснозначных стохастических процессов. Результаты могут быть применены к вещественнозначным процессам без модификаций, вспоминая, что число, комплексно-сопряженное с действительным числом, совпадает с ним самим.
Для случайных элементов X и Y скалярное произведение определяется формулой
где * обозначает операцию комплексного сопряжения.
Статистики второго порядка
Скалярное произведение корректно определено, если как , так и имеют конечные вторые моменты, или, что то же самое, если они оба квадратично интегрируемы. Отметим, что скалярное произведение связано с ковариацией и корреляцией. В частности, для случайных переменных со средним нулевым значением, ковариация и скалярное произведение совпадают. Функция автоковариации
Если процесс {Xt}t центрированный, то
для всех t. Таким образом, автоковариация KXX равна автокорреляции RXX:
Отметим, что если {Xt}t центрированный и t1, ≤ t2, …, ≤ tN являются точками на интервале [a, b], следовательно
Формулировка теоремы
Теорема. Рассмотрим центрированный случайный процесс , индексированный на интервале с ковариационной функцией . Предположим, что ковариационная функция непрерывна по совокупности переменных . Тогда — положительно определенное ядро, и по теореме Мерсера интегральный оператор в (близкой к мере Лебега на ) имеет ортонормированный базис из собственных векторов. Пусть являются собственными векторами , соответствующими ненулевым собственным значениям и
Тогда — центрированные ортогональные случайные величины и
ряд сходится в среднем квадратичном, а также равномерно по . Кроме того
где собственное значение, соответствующее собственному вектору .
Суммы Коши
В формулировке теоремы интеграл в определении можно понимать как предел в среднем сумм Коши случайных величин
где
Особый случай: гауссовское распределение
Так как предел в среднем квадратичном из совместно гауссовских случайных величин является гауссовским и совместно гауссовские случайные (центрированные) величины независимы тогда и только тогда, когда они являются ортогональными, мы можем также заключить:
Теорема. Случайные величины имеют гауссовское распределение и являются независимыми, если первоначальный процесс {Xt}t тоже является гауссовским.
В гауссовском случае, поскольку случайные величины являются независимыми, мы можем быть уверены в том, что:
почти наверное.
Отметим, что обобщая теорему Мерсера, мы можем заменить интервал другими компактными пространствами , а меру Лебега на — борелевской мерой с носителем в .
Винеровский процесс
Винеровский процесс в теории случайных процессов — это математическая модель броуновского движения или случайного блуждания с непрерывным временем. Здесь мы определяем его как центрированный гауссовский процесс B(t) с ковариационной функцией
Легко видеть, что собственные векторы ковариации равны
а соответствующие собственные значения
Это позволяет получить нам следующее представление винеровского процесса:
Теорема. Существует последовательность {Wi}i независимых гауссовких случайных величин с нулевым средним и единичной дисперсией такая, что
Сходимость является равномерной по t в норме L² так, что
равномерно по t.
Использование
Было высказано мнение, что в проекте SETI следует использовать преобразования Карунена-Лоэва для обнаружения сигналов с очень широким спектром. Аналогично, в системах адаптивной оптики иногда используют функции Карунена-Лоэва для восстановления информации о фазе фронта волны. (Dai 1996, JOSA A).
См. также
- Метод главных компонент
- Нейронная сеть Кохонена
- Полиномиальный хаос
Ссылки
- И. И. Гихман, А. В. Скороход, Введение в теорию случайных процессов (недоступная ссылка).- М.: Наука, 1965.
- B. Simon, Functional Integration and Quantum Physics, Academic Press, 1979
- K. Karhunen, Kari, Uber lineare Methoden in der Wahrscheinlichkeitsrechnung, Ann. Acad. Sci. Fennicae. Ser. A. I. Math.-Phys., 1947, No. 37, 1-79
- М. Лоев, Теория вероятностей, — М.: ИЛ, 1962.
- G. Dai, Modal wave-front reconstruction with Zernike polynomials and Karhunen-Loeve functions, JOSA A, 13, 6, 1996
Примечания
- Введение в цифровую обработку изображений, 1979, с. 68.
- Теория сигналов, 1974, с. 115.
Литература
- Ярославский Л. П. Введение в цифровую обработку изображений. — М.: Советское радио, 1979. — 312 с.
- Френкс Л. Теория сигналов. — М.: Советское радио, 1974. — 399 с.