Формула Надарая-Ватсона
Материал из MachineLearning.
(Новая: {{Задание|Kolesnikov|Константин Воронцов|8 января 2009}}) |
|||
Строка 1: | Строка 1: | ||
- | {{Задание|Kolesnikov| | + | {{Задание|Kolesnikov||8 января 2009}} |
+ | |||
+ | '''Формула Надарая-Ватсона''' используется для решения задачи непараметрического [[восстановления регрессии]]. | ||
+ | == Постановка задачи == | ||
+ | Пусть задано пространство объектов <tex>X</tex> и множество возможных ответов <tex>Y = \mathbb{R}</tex>. Существует неизвестная зависимость <tex>$y^*:X \rightarrow Y$</tex>, значения которой известны только на объектах обучающией выборки <tex>$ X^l = (x_i\ ,\ y_i)^l_{i=1},\ y_i = y^*(x_i) $</tex>. Требуется построить [[алгоритм]] <tex>a:\ X\rightarrow Y</tex>, аппроксимирующий неизвестную зависимость <tex>$y^*$</tex>. Предполагается, что на множестве <tex>X</tex> задана [[метрика]] <tex>\rho(x,x^')</tex>. | ||
+ | |||
+ | ==Формула Надарая-Ватсона== | ||
+ | Для вычисления <tex>$a(x) = \alpha$</tex> при <tex>$ \forall x \in X$</tex>, воспользуемся [[методом наименьших квадратов]]: <br /> | ||
+ | <tex>Q(\alpha;X^l) = \sum_{i=1}^l \omega_i(x)(\alpha-y_i)^2 \rightarrow min_{\alpha \in \mathbb{R}}</tex>, где <tex>\omega_i</tex> - это вес i-ого объекта. <br /> | ||
+ | Веса <tex>\omega_i</tex> разумно задать так, чтобы они убывали по мере увеличения расстояния <tex>\rho(x,x_i)</tex>. Для этого представим <tex>\omega_i</tex> в следующем виде : <br /> | ||
+ | <tex>\omega_i = K\left(\frac{\rho(x,x_i)}{h} \right )</tex> | ||
+ | |||
+ | |||
+ | ==Обоснование формулы== |
Версия 18:00, 3 января 2010
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |
Формула Надарая-Ватсона используется для решения задачи непараметрического восстановления регрессии.
Постановка задачи
Пусть задано пространство объектов и множество возможных ответов . Существует неизвестная зависимость , значения которой известны только на объектах обучающией выборки . Требуется построить алгоритм , аппроксимирующий неизвестную зависимость . Предполагается, что на множестве задана метрика .
Формула Надарая-Ватсона
Для вычисления при , воспользуемся методом наименьших квадратов:
, где - это вес i-ого объекта.
Веса разумно задать так, чтобы они убывали по мере увеличения расстояния . Для этого представим в следующем виде :