Формула Надарая-Ватсона
Материал из MachineLearning.
Строка 14: | Строка 14: | ||
==Обоснование формулы== | ==Обоснование формулы== | ||
- | Строгим обоснованием формулы служит следующая теорема : <br /> | + | Строгим обоснованием формулы в одномерном случае служит следующая теорема : <br /> |
'''Теорема''' Пусть выполнены условия : <br /> | '''Теорема''' Пусть выполнены условия : <br /> | ||
1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br /> | 1) выборка <tex>$X^l = (x_i,y_i)^l_{i=1}$</tex> получена случайно и независимо из распределения <tex>p(x,y)</tex> <br /> | ||
Строка 26: | Строка 26: | ||
1) К. В. Воронцов, [[Машинное обучение (курс лекций, К.В.Воронцов)|Лекции по алгоритмам восстановления регрессии]], 2009<br /> | 1) К. В. Воронцов, [[Машинное обучение (курс лекций, К.В.Воронцов)|Лекции по алгоритмам восстановления регрессии]], 2009<br /> | ||
2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993. <br /> | 2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993. <br /> | ||
+ | |||
+ | [[Категория:Машинное обучение|Регресионный анализ]] |
Версия 16:37, 6 января 2010
![]() | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |
Формула Надарая-Ватсона используется для решения задачи непараметрического восстановления регрессии.
Содержание[убрать] |
Постановка задачи
Пусть задано пространство объектов и множество возможных ответов
. Существует неизвестная зависимость
, значения которой известны только на объектах обучающией выборки
. Требуется построить алгоритм
, аппроксимирующий неизвестную зависимость
. Предполагается, что на множестве
задана метрика
.
Формула Надарая-Ватсона
Для вычисления при
, воспользуемся методом наименьших квадратов:
, где
- это вес i-ого объекта.
Веса разумно задать так, чтобы они убывали по мере увеличения расстояния
. Для этого можно ввести невозрастающую, гладкую, ограниченную функцию
, называемую ядром, и представить
в следующем виде :
, где
— ширина окна.
Приравняв нулю производную , и, выразив
,получаем формулу Надарая-Ватсона :
Обоснование формулы
Строгим обоснованием формулы в одномерном случае служит следующая теорема :
Теорема Пусть выполнены условия :
1) выборка получена случайно и независимо из распределения
2) ядро удовлетворяет ограничениям
и
3) восстанавливаемая зависимость, определяемая плотностью , удавлетворяет при любом
ограничению
4) последовательность такова, что
и
Тогда имеет место сходимость по вероятности : в любой точке
, в которой
и
непрерывны и
.
Литература
1) К. В. Воронцов, Лекции по алгоритмам восстановления регрессии, 2009
2) Хардле В. Прикладная непараметрическая регрессия. - М.: Мир, 1993.