Критерий хи-квадрат
Материал из MachineLearning.
(→Ссылки) |
(→Определение) |
||
Строка 23: | Строка 23: | ||
<tex>E_j = np_j</tex> Ожидаемое число попаданий в j-ый интервал; | <tex>E_j = np_j</tex> Ожидаемое число попаданий в j-ый интервал; | ||
- | '''Статистика:''' <tex>\chi^2 = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex> | + | '''Статистика:''' <tex>\chi^2 = \sum_{i=1}^k \frac{ \left( n_j-E_j \right)^2}{E_j} \sim \chi_{k-1}^2</tex> - [[Распределение <tex>\chi^2</tex>|Распределение <tex>\chi^2</tex>|]] с k-1 степенью свободы. |
+ | |||
+ | Критерий <tex>\chi^2</tex> - наиболее часто используемый статистический критерй для проверки гипотезы <tex> H_0</tex>, что наблюдаемая случайная величина подчиняется некому теоретическому закону распределению. | ||
== Проверка гипотезы == | == Проверка гипотезы == |
Версия 10:31, 7 декабря 2008
|
Статья в настоящий момент дорабатывается. Венжега Андрей 00:08, 14 ноября 2008 (MSK) |
Определение
Пусть дана случайная величина X .
Гипотеза : с. в. X подчиняется закону распределения .
Для проверки гипотезы рассмотрим выборку, состоящую из n независимых наблюдений над с.в. X:
.
По выборке построим эмпирическое распределение с.в X. Сравнение эмпирического и теоретического распределения производится с помощью специально подобранной случайной величины — критерия согласия. Рассмотрим критерий согласия Пирсона (критерий ):
Гипотеза : Хn порождается функцией .
Разделим [a,b] на k непересекающихся интервалов ;
Пусть - количество наблюдений в j-м интервале: ;
- вероятность попадания наблюдения в j-ый интервал при выполнении гипотезы ;
Ожидаемое число попаданий в j-ый интервал;
Статистика: - [[Распределение |Распределение |]] с k-1 степенью свободы.
Критерий - наиболее часто используемый статистический критерй для проверки гипотезы , что наблюдаемая случайная величина подчиняется некому теоретическому закону распределению.
Проверка гипотезы
- гипотеза неслучайности
- гипотеза случайности
- гипотеза согласия