Метод настройки с возвращениями
Материал из MachineLearning.
На практике встречаются ситуации, когда линейная модель регрессии представляется необоснованной, но предложить адекватную нелинейную модель также не удается. Тогда в качестве альтернативы строится модель вида
-
,
-
где - некоторые преобразования исходных признаков, в общем случае нелинейные. Задача состоит в том, чтобы одновременно подобрать и коэффициенты линейной модели
, и неизвестные одномерные преобразования
, при которых достигается минимум квадратичного функционала RSS – остаточная сумма квадратов.
Суть метода заключается в том, что в линейную модель добавляются нелинейные преобразования исходных признаков. Другими словами метод настройки с возвращениями (backfitting) совмещает многомерную линейную регрессию и одномерное сглаживание. Таким образом, нелинейная задача сводится к решению последовательности линейных задач.
Содержание[убрать] |
Обозначения
Дана выборка ;
– длина выборки.
При этом
;
– число независимых переменных.
Значение целевой зависимости для -го объекта
.
Метод настройки с возвращениями (backfitting)
Метод настройки с возвращениями основан на итерационном повторении двух шагов:
- На первом шаге фиксируются функции
, и методами многомерной линейной регрессии вычисляются коэффициенты
.
- На втором шаге фиксируются коэффициенты
и все функции
кроме одной
, которая настраивается методами одномерной непараметрической регрессии. На втором шаге решается задача минимизации функционала
-
.
-
Здесь коэффициенты и функции
фиксированы и не зависят от
. Благодаря этому настройка
сводится к стандартной задаче наименьших квадратов с обучающей выборкой
. Для ее решения годятся любые одномерные методы: ядерное сглаживание, сплайны, полиномиальная или Фурье-аппроксимация. Для ядерного сглаживания с фиксированной шириной окна этап настройки функции
фактически отсутствует; чтобы вычислять значения
по формуле Надарая-Ватсона, достаточно просто запомнить выборку
.
После настройки всех функций происходит возврат к первому шагу, и снова решается задача многомерной линейной регрессии для определения
. Отсюда происходит и название метода – настройка с возвращениями (backfitting).
Схема алгоритма настройки с возвращениями (backfitting)
Входные параметры:
-
– матрица «объекты-признаки»;
-
– вектор ответов;
Выход:
-
– вектор коэффициентов линейной комбинации.
1: нулевое приближение: 2: повторять |
Проблемы
- Выбор признака
на шаге 4. Правильней, наверное, выбирать признак, для которого функционал RSS (Остаточная сумма квадратов) больше.
- Выбор ширины окна
при ядерном сглаживании на шаге 7.
- Критерий останова на шаге 8.
Проблемы 1)-3) можно решить, воспользовавшись анализом регрессионных остатков.
История
Метод настройки с возвращениями (backfitting) предложен Хасти и Тибширани в 1986 году.
Литература
- Воронцов К.В. Лекции по алгоритмам восстановления регрессии. — 2007.
- Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning. — 2001. — 533 с.
См. также
- Статистический анализ данных (курс лекций, К.В.Воронцов)
- Непараметрическая регрессия
- Ядерное сглаживание