Критерий Фридмана

Материал из MachineLearning.

Перейти к: навигация, поиск

Критерий Фридмана является непараметрическим критерием, предназначенным для проверки однородности статистических даннных.

Содержание

Примеры задач

Пусть на некотором предприятии k подразделений выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, даёт ли использование одного оборудования лучший результат по сравнению с оборудованием других производителей.

Другой пример: предположим, существует k альтернативных агротехнических методов обработки полей. Для каждого такого метода составим выборку из обработанных им полей. Значение в выборке равно урожайности данного поля. Требуется определить, эквивалентны ли эти методы с точки зрения объёма собираемого урожая.

Описание критерия

Дано kn наблюдений x_{ij}, где 1 \le i \le n,\; 1 \le j \le k. Через H_0 обозначим гипотезу о равенстве средних для каждой из k групп:

H_0\,:\;\bar{x}_1=\ldots=\bar{x}_k.

Для каждого i, где 1 \le i \le n, упорядочим последовательность x_{i1}, x_{i2}, \ldots, x_{ik}. Ранг элемента x_{ij} внутри такой последовательности обозначим через r_{ij}. Очевидно, 1 \le r_{ij} \le k. Статистика критерия имеет вид

S = \frac{12n}{k(k+1)}\sum_{j=1}^k\left(\frac1n \sum_{i=1}^n r_{ij} - \frac{k+1}2\right).

Гипотеза H_0 принимается, если S < S_\alpha(n, k). Критические значения S_\alpha(n, k) находятся при помощи интерполяции табличных данных.

При n \ge 13,\: k \ge 20 применима аппроксимация

S_\alpha(n, k) = \chi^2_\alpha(k-1).

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.
  2. Friedman, Milton (December 1937). "The use of ranks to avoid the assumption of normality implicit in the analysis of variance". Journal of the American Statistical Association 32 (200): 675–701.

См. также

Ссылки