Метод LSD

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(уточнение)
(уточнение)
Строка 1: Строка 1:
'''Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference'''.
'''Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference'''.
-
'''Метод LSD''' позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.
+
'''Метод LSD''' позволяет проверять равенство [[среднее значение| средних значений]] нескольких [[выборка| выборок]]. При этом объемы выборок могут быть различными.
 +
 
 +
== Пример использования ==
 +
<tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.
 +
Вопрос: какие лекарства взаимозаменяемы по цене?
 +
Делим лекарства на ценовые коридоры.
== Описание критерия ==
== Описание критерия ==
Строка 7: Строка 12:
=== Дополнительные предположения ===
=== Дополнительные предположения ===
-
* ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются нормальными''
+
* ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются [[нормальная выборка| нормальными]]''
=== Нулевая гипотеза ===
=== Нулевая гипотеза ===
-
Метод LSD проверяет '''гипотезу <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.
+
Метод LSD проверяет '''[[нулевая гипотеза| нулевую гипотезу]] <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.
::<tex>H_0: \mu_1 = \mu_2 = . . . = \mu_k</tex>
::<tex>H_0: \mu_1 = \mu_2 = . . . = \mu_k</tex>
Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.
Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.
Строка 16: Строка 21:
=== Статистика метода LSD ===
=== Статистика метода LSD ===
-
Статистика метода LSD вычисляется в соответствии с соотношением:
+
[[Статистика (функция выборки)| Статистика]] метода LSD вычисляется в соответствии с соотношением:
::<tex>T = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.
::<tex>T = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.
Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:
Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:
Строка 24: Строка 29:
Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]] <tex>\alpha</tex> является область
Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]] <tex>\alpha</tex> является область
::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>
::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>
-
где <tex> t_{n-k,\alpha}</tex> - [[квантиль распределения Стьюдента]].
+
где <tex> t_{n-k,\alpha}</tex> - [[квантиль]] [[распределение Стьюдента| распределения Стьюдента]].
Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.
Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.
=== Примечание ===
=== Примечание ===
-
Это односторонний критерий.
+
Это [[односторонний критерий]].
-
 
+
-
== Пример ==
+
-
<tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.
+
-
Вопрос: какие лекарства взаимозаменяемы по цене?
+
-
Делим лекарства на ценовые коридоры.
+
== История ==
== История ==
Строка 52: Строка 52:
* [[Критерий Стьюдента]]
* [[Критерий Стьюдента]]
* [[Гипотеза сдвига]]
* [[Гипотеза сдвига]]
 +
* [[Проверка статистических гипотез]]
 +
* [[Статистический анализ данных (курс лекций, К.В.Воронцов)]]
== Ссылки ==
== Ссылки ==
Строка 60: Строка 62:
[[Категория: Прикладная статистика]]
[[Категория: Прикладная статистика]]
 +
[[Категория: Статистические тесты]]

Версия 22:20, 11 января 2009

Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference.

Метод LSD позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.

Содержание

Пример использования

 X_i - цены на i-ое лекарство в разных аптеках. Вопрос: какие лекарства взаимозаменяемы по цене? Делим лекарства на ценовые коридоры.

Описание критерия

Имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k объемом n_i (i=1,...,k ) каждая. Средние значения выборок обозначим через \mu_i.

Дополнительные предположения

Нулевая гипотеза

Метод LSD проверяет нулевую гипотезу H_0 о том, что средние значения всех k выборок одинаковы.

H_0: \mu_1 = \mu_2 =  . . . = \mu_k

Альтернативная гипотеза H_1: существует, по крайней мере, две выборки i и j (i \neq j) с несовпадающими средними значениями.

H_1: \mu_i  \neq \mu_j (для некоторых i \neq j).

Статистика метода LSD

Статистика метода LSD вычисляется в соответствии с соотношением:

T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}.

Здесь S^2_{int} - внутригрупповая дисперсия:

S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2

Критическая область

Для статистики метода LSD критической областью при уровне значимости \alpha является область

\Omega_{\alpha}:\; T>t_{n-k,\alpha}

где  t_{n-k,\alpha} - квантиль распределения Стьюдента.

Для всех (i, i+1) проверяем гипотезу \overline{X}_{i+1} = \overline{X}_{i}. Если нулевая гипотеза H_0 выполнена, тогда объединяем X_i с X_{i+1}.

Примечание

Это односторонний критерий.

История

Предложен в 70-х годах.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

Личные инструменты