Метод LSD

Материал из MachineLearning.

(Различия между версиями)

Версия 22:20, 11 января 2009

Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference.

Метод LSD позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.

Пример использования

$X_i$ - цены на $i$ -ое лекарство в разных аптеках. Вопрос: какие лекарства взаимозаменяемы по цене? Делим лекарства на ценовые коридоры.

Описание критерия

Имеется $k$ выборок $x^{n_1}_1, . . . , x^{n_k}_k$ объемом $n_i$ ( $i=1,...,k$ ) каждая. Средние значения выборок обозначим через $\mu_i$ .

Дополнительные предположения

Выборки $x^{n_1}_1, . . . , x^{n_k}_k$ являются нормальными

Нулевая гипотеза

Метод LSD проверяет нулевую гипотезу $H_0$ о том, что средние значения всех $k$ выборок одинаковы.

$H_0: \mu_1 = \mu_2 = . . . = \mu_k$

Альтернативная гипотеза $H_1$ : существует, по крайней мере, две выборки $i$ и $j$ ( $i \neq j$ ) с несовпадающими средними значениями.

$H_1: \mu_i \neq \mu_j$ (для некоторых $i \neq j$ ).

Статистика метода LSD

Статистика метода LSD вычисляется в соответствии с соотношением:

$T = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}$ .

Здесь $S^2_{int}$ - внутригрупповая дисперсия:

$S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2$

Критическая область

Для статистики метода LSD критической областью при уровне значимости $\alpha$ является область

$\Omega_{\alpha}:\; T>t_{n-k,\alpha}$

где $t_{n-k,\alpha}$ - квантиль распределения Стьюдента.

Для всех $(i, i+1)$ проверяем гипотезу $\overline{X}_{i+1} = \overline{X}_{i}$ . Если нулевая гипотеза $H_0$ выполнена, тогда объединяем $X_i$ с $X_{i+1}$ .

Примечание

Это односторонний критерий.

История

Предложен в 70-х годах.

Литература

Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

Источник — «http://poligon.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_LSD»

Категории: Прикладная статистика | Статистические тесты

@@ Строка 1: / Строка 1: @@
 '''Метод LSD = Метод группирования  выборок с наименее значимой разницей = Least Significant difference'''.
-'''Метод LSD''' позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.
+'''Метод LSD''' позволяет проверять равенство [[среднее значение| средних значений]] нескольких [[выборка| выборок]]. При этом объемы выборок могут быть различными.
+== Пример использования ==
+<tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.
+Вопрос: какие лекарства взаимозаменяемы по цене?
+Делим лекарства на ценовые коридоры.
 == Описание критерия ==
@@ Строка 7: / Строка 12: @@
 === Дополнительные предположения ===
-* ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются нормальными''
+* ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются [[нормальная выборка| нормальными]]''
 === Нулевая гипотеза ===
-Метод LSD проверяет '''гипотезу <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.
+Метод LSD проверяет '''[[нулевая гипотеза| нулевую гипотезу]] <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.
 ::<tex>H_0: \mu_1 = \mu_2 =  . . . = \mu_k</tex>
 Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.
@@ Строка 16: / Строка 21: @@
 === Статистика метода LSD ===
-Статистика метода LSD вычисляется в соответствии с соотношением:
+[[Статистика (функция выборки)| Статистика]] метода LSD вычисляется в соответствии с соотношением:
 ::<tex>T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.
 Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:
@@ Строка 24: / Строка 29: @@
 Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]]  <tex>\alpha</tex> является область
 ::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>
-где <tex> t_{n-k,\alpha}</tex> - [[квантиль распределения Стьюдента]].
+где <tex> t_{n-k,\alpha}</tex> - [[квантиль]] [[распределение Стьюдента| распределения Стьюдента]].
 Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.
 === Примечание ===
-Это односторонний критерий.
+Это [[односторонний критерий]].
-== Пример ==
-<tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.
-Вопрос: какие лекарства взаимозаменяемы по цене?
-Делим лекарства на ценовые коридоры.
 == История ==
@@ Строка 52: / Строка 52: @@
 * [[Критерий Стьюдента]]
 * [[Гипотеза сдвига]]
+* [[Проверка статистических гипотез]]
+* [[Статистический анализ данных (курс лекций, К.В.Воронцов)]]
 == Ссылки ==
@@ Строка 60: / Строка 62: @@
 [[Категория: Прикладная статистика]]
+[[Категория: Статистические тесты]]