Псевдообратная матрица
Псевдообра́тная ма́трица — обобщение понятия обратной матрицы в линейной алгебре. Псевдообратная матрица к матрице обозначается .
Впервые концепцию псевдообратных интегрирующих операторов в 1903 году представил Фредгольм. Наиболее известно псевдообращение Мура — Пенроуза, которое было независимо описано Элиакимом Муром в 1920 году и Роджером Пенроузом в 1955 году; утверждение о существовании и единственности для любой матрицы над действительными и комплексными числами псевдообратной матрицы носит название теоремы Мура — Пенроуза.
Обобщённое обращение (англ. generalized inverse) — псевдообращение, удовлетворяющее более строгим условиям. Псевдообращение можно понимать как решение задачи наилучшей аппроксимации (по методу наименьших квадратов с предельным вариантом регуляризации) для соответствующей системы линейных уравнений. Псевдообратная матрица может быть вычислена с помощью сингулярного разложения матрицы.
Определение
называется псевдообратной матрицей для матрицы , если она удовлетворяет следующим критериям:
- ;
- ( является слабым обращением в мультипликативной полугруппе);
- (это означает, что — эрмитова матрица);
- ( — тоже эрмитова матрица).
Здесь — эрмитово сопряжённая матрица M (для матриц над полем действительных чисел ).
Существует эквивалентный способ задания псевдообратной матрицы через предел обратных (регуляризация Тихонова):
- ,
где — единичная матрица. Этот предел существует, даже если и не определены.
Свойства
- Псевдообращение инволютивно (то есть эта операция обратна самой себе):
- .
- Псевдообращение коммутирует с транспонированием, сопряжением и эрмитовым сопряжением:
- ,
,
.
- ,
- Псевдообратное произведение матрицы на скаляр равно соответствующему произведению матрицы на обратное число :
- , для .
- Если псевдообратная матрица для уже известна, она может быть использована для вычисления :
- .
- Аналогично, если матрица уже известна:
- .
Особые случаи
Если столбцы матрицы линейно независимы, тогда матрица обратима. В таком случае псевдообратная матрица задаётся формулой:
- .
Это эквивалентно тому, что в первой части определения через предел убирается слагаемое с . Отсюда следует что в этом случае — левая обратная матрица для : .
Если строки матрицы линейно независимы, тогда матрица обратима. В таком случае псевдообратная матрица задаётся формулой:
- .
Это эквивалентно тому, что во второй части определения через предел полагаем . Отсюда следует, что в этом случае — правая обратная матрица для A: .
Если и столбцы, и строки линейно независимы (что верно для квадратных невырожденных матриц), то псевдообращение совпадает с обращением:
- .
Если и таковы, что произведение определено и:
- либо ,
- либо ,
- либо столбцы линейно независимы и строки линейно независимы,
тогда
- .
Псевдообращение можно применять и к скалярам, и к векторам. Это подразумевает, что они рассматриваются как матрицы соответствующей размерности. Псевдообратный к скаляру — ноль, если — ноль, и обратный к в противном случае:
Псевдообратный для нулевого вектора — транспонированый нулевой вектор. Псевдообратный для ненулевого вектора — сопряжённый транспонированный вектор, делённый на квадрат своей длины:
Для доказательства достаточно проверить, что эти величины удовлетворяют определению псевдообратных.
Происхождение
Если существует, то из равенства:
следует
что порождает понятие псевдообращения
- .
Вычисление
Пусть — ранг матрицы размера . Тогда может быть представлена как , где B — матрица размера с линейно независимыми столбцами и — матрица размера с линейно независимыми строками. Тогда:
- .
Если имеет полнострочный ранг, то есть , тогда в качестве может быть выбрана единичная матрица и формула сокращается до . Аналогично, если имеет полностолбцовый ранг, то есть, , то .
Простейший вычислительный путь получения псевдообратной матрицы — использовать сингулярное разложение.
Если — сингулярное разложение , тогда . Для диагональной матрицы, такой как , псевдообратная получается из неё заменой каждого ненулевого элемента на диагонали на обратный к нему.
Существуют оптимизированые подходы вычисления псевдообратной для блочных матриц.
Иногда объём расчётов по нахождению псевдообратной матрицы можно сократить, если известна псевдообратная для некоторой аналогичной матрицы. В частности, если аналогичная матрица отличается от начальной на один изменённый, добавленный или удалённый столбец или строку — существуют накопительные алгоритмы, которые могут использовать взаимосвязь между матрицами.
Применение
Псевдообращение тесно связано с методом наименьших квадратов (МНК) для системы линейных уравнений.
В этом методе задача решения данной системы заменяется задачей минимизации квадрата евклидовой нормы невязки . На практике МНК обычно используют когда исходная система несовместна, однако ниже мы рассмотрим случай когда эта система совместна.
Общее решение неоднородной системы представимо как сумма частного решения неоднородной системы и общего решения соответствующей однородной системы .
Лемма: Если существует, тогда общее решение всегда представимо как сумма псевдообратного решения неоднородной системы и решения однородной системы:
Доказательство:
.
Здесь вектор произвольный (с точностью до размерности). В двух других членах есть псевдообратная матрица . Переписав её в форме , приведём выражение к форме:
Первый член — псевдообратное решение. В терминах метода наименьших квадратов — это , дающее минимальную евклидову норму для невязки. Следующий член даёт решение однородной системы , потому что — оператор проектирования на образ оператора и, соответственно, — оператор проектирования на ядро оператора .
Литература
- ↑ Э. Х. Мур (E. H. Moore): On the reciprocal of the general algebraic matrix. Bulletin of the American Mathematical Society 26, 394—395 (1920) http://www.ams.org/bull/1920-26-09/S0002-9904-1920-03322-7/S0002-9904-1920-03322-7.pdf
- ↑ Роджер Пенроуз: A generalized inverse for matrices. Proceedings of the Cambridge Philosophical Society 51, 406—413 (1955)
- ↑ Роджер Пенроуз: On best approximate solution of linear matrix equations. Proceedings of the Cambridge Philosophical Society 52, 17-19 (1956)
- ↑ Алберт А.: Регрессия, псевдоинверсия и рекуррентное оценивание. перев. с англ. Москва, «Наука», 224 с.(1977)
- ↑ Беклемишев Д. В.: Дополнительные главы линейной алгебры. Москва, Наука. (1983)