Участник:Василий Ломакин/Псевдообратная матрица
Материал из MachineLearning.
Псевдообратные матрицы — обобощение обратных матриц в математике и, в частности, в линейной алгебре.
Псевдообратная матрица к матрице обозначается
. Наиболее известно псевдообращение Мура — Пенроуза, которое было независимо описано Э. Х. Муром и Роджером Пенроузом.
Концепцию псевдообратных интегрирующих операторов в 1903 году представил Фредгольм.
Термин «обобщенное обращение» иногда используется как синоним для псевдообращения.
Псевдообращение можно понимать как наилучшую апроксимацию (по методу наименьших квадратов) решения соответствующей системы линейных уравнений (см. далее в применении). Псевдообращение определено для любых матриц над действительными и комплексными числами.
Псевдообратная матрица может быть вычислена с помощью собственного представления матрицы.
Содержание[убрать] |
Определение
называется псевдообратной матрицей для матрицы
, если она удовлетворяет следующим критериям:
-
-
(
является слабым обращением в мультипликативной полугруппе);
-
(это означает, что
— эрмитова матрица);
-
(
- тоже эрмитова матрица).
Здесь - эрмитова сопряжённая матрица M. Для матриц над полем действительных чисел
.
Существует эквивалентный способ задания псевдообратной матрицы через предел обратных:
(смотрите регуляризация Тихонова). Этот предел существует, даже если
и
не определены.
Свойства
- Псевдообращение обратимо, более того, эта операция обратна самой себе:
.
- Псевдообращение нулевой матрицы равно транспонированию.
- Псевдообращение комутирует с транспонированием, сопряжением и эрмитовым сопряжением:
,
,
- Псевдообратное произведения матрицы
на скаляр
равно соответствующему произведению матрицы
на обратное число
:
, для
≠ 0.
- Если псевдообратная матрица для
уже известна, она может быть использовано для вычисления
:
.
- Аналогично, если матрица
уже известна:
.
Особые случаи
- Если столбцы матрицы
линейно независимы, тогда матрица
обратима. В таком случае псевдообратная матрица задаётся формулой
Это эквивалентно тому, что в первой части определения через предел убирается слагаемое с
. Отсюда следует что
- левая обратная матрица для A:
.
- Если строки матрицы
линейно независимы, тогда матрица
обратима. В таком случае псевдообратная матрица задаётся формулой
Это эквивалентно тому, что во второй части определения через предел убирается слагаемое с
. Отсюда следует, что
— правая обратная матрица для A:
.
- Если и столбцы и строки линейно независимы (что верно для квадратных невырожденных матриц), псевдообращение равно обращению:
- Если A и B таковы, что произведение
определено, и
- либо
,
- либо
,
- либо столбцы
линейно независимы и строки
линейно независимы,
- либо
- тогда
.
- Псевдообращение можно применять и к скалярам, и к векторам. Это подразумевает, что их будут считать матрицами. Псевдообратный к скаляру
— ноль, если
— ноль, и обратный к
в противном случае:
- Псевдообратный для нулевого вектора - транспонированый нулевой вектор. Псевдообратный для иного вектора - сопряжённый транспонированный вектор, делённый на квадрат своей длины:
Для доказательства достаточно проверить, что эти величины удовлетворяют определению псевдообратных.
Происхождение
Если
существует, то
что порождает понятие псевдообращения
.
Вычисление
Пусть k - ранг матрицы A размера
. Тогда A может быть представлена как
, где B — матрица размера
и C — матрица размера
. Тогда
Если A имеет полнострочный ранг, то есть k = m, тогда в качестве B может быть выбрана единичная матрица и формула сокращается до
. Аналогично, если A имеет полностолбцовый ранг, то есть, k = n, имеем
Простейший вычислительный путь получения псевдообратной матрицы — использование собственного представления матрицы (СПМ).
Если
— собственное представление A, тогда
Для диагональной матрицы, такой как
, псевдообратная вычисляется обращением каждого ненулевого элемента на диагонали.
Существуют оптимизированые подходы для вычисления псевдоинверсии блочных матриц.
Если псевдоинверсия известна для некой матрицы и нужно найти псевдоинверсию для аналогичной матрицы, иногда она может быть вычислена с помощью специальных алгоритмов, требующих меньшего количества расчётов. В частности, если аналогичная матрица отличается от начальной на один изменённый, добавленный или удалённый столбец или строку — существуют накопительные алгоритмы, которые могут использовать взаимосвязь между матрицами.
Применение
Псевдоинверсия реализирует решение метода наименьших квадратов для системы линейных уравнений.
При этом для данной системы
ищется вектор
, котрый минимизирует невязку
, где
обозначает евклидову норму.
Общее решение неоднородной системы
представимо как сумма частного решения неоднородной системы и общего решения соответствующей однородной системы
.
Лемма: Если
существует, тогда решение
всегда представимо как сумма решения псевдообратного решения неоднородной системы и решения однородной системы:
Доказательство:
.
Здесь вектор
случаен (с точностью до размерности). В двух других членах есть псевдообратная матрица
. Переписав её в форме
, приведём выражение к форме:
Первый член — псевдообратное решение. В терминах метода наименьших квадратов — это наилучшее приближение к настоящему решению. Это значит, что корректирующий член имеет минимальную евклидову норму. Следующий член даёт решение однородной системы
, потому что
— оператор проектирования на ядро оператора A, тогда как
— оператор проектирования на образ оператора A.
- Псевдообращение обратимо, более того, эта операция обратна самой себе: