Метод LSD

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: Метод группирования выборок с наименее значимой разницей. == Описание метода LSD == == Литература == == См....)
(уточнение)
Строка 1: Строка 1:
-
Метод группирования выборок с наименее значимой разницей.
+
'''Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference'''.
-
== Описание метода LSD ==
+
'''Метод LSD''' позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.
 +
 
 +
== Описание критерия ==
 +
Имеется <tex>k</tex> выборок <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> объемом <tex>n_i</tex> (<tex>i=1,...,k </tex>) каждая. Средние значения выборок обозначим через <tex>\mu_i</tex>.
 +
 
 +
=== Дополнительные предположения ===
 +
* ''Выборки <tex>x^{n_1}_1, . . . , x^{n_k}_k</tex> являются нормальными''
 +
 
 +
=== Нулевая гипотеза ===
 +
Метод LSD проверяет '''гипотезу <tex>H_0</tex>''' о том, что средние значения всех <tex>k</tex> выборок одинаковы.
 +
::<tex>H_0: \mu_1 = \mu_2 = . . . = \mu_k</tex>
 +
Альтернативная '''гипотеза <tex>H_1</tex>''': существует, по крайней мере, две выборки <tex>i</tex> и <tex>j</tex> (<tex>i \neq j</tex>) с несовпадающими средними значениями.
 +
::<tex>H_1: \mu_i \neq \mu_j</tex> (для некоторых <tex>i \neq j</tex>).
 +
 
 +
=== Статистика метода LSD ===
 +
Статистика метода LSD вычисляется в соответствии с соотношением:
 +
::<tex>T = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}</tex>.
 +
Здесь <tex>S^2_{int}</tex> - внутригрупповая дисперсия:
 +
::<tex>S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2</tex>
 +
 
 +
=== Критическая область ===
 +
Для статистики метода LSD [[критическая область| критической областью]] при [[Уровень значимости|уровне значимости]] <tex>\alpha</tex> является область
 +
::<tex>\Omega_{\alpha}:\; T>t_{n-k,\alpha}</tex>
 +
где <tex> t_{n-k,\alpha}</tex> - [[квантиль распределения Стьюдента]].
 +
 
 +
Для всех <tex>(i, i+1)</tex> проверяем гипотезу <tex>\overline{X}_{i+1} = \overline{X}_{i}</tex>. Если нулевая гипотеза <tex>H_0</tex> выполнена, тогда объединяем <tex>X_i</tex> с <tex>X_{i+1}</tex>.
 +
 
 +
=== Примечание ===
 +
Это односторонний критерий.
 +
 
 +
== Пример ==
 +
<tex> X_i </tex> - цены на <tex>i</tex>-ое лекарство в разных аптеках.
 +
Вопрос: какие лекарства взаимозаменяемы по цене?
 +
Делим лекарства на ценовые коридоры.
 +
 
 +
== История ==
 +
Предложен в 70-х годах.
== Литература ==
== Литература ==
 +
# {{книга
 +
|автор = Кобзарь А. И.
 +
|заглавие = Прикладная математическая статистика
 +
|издательство = М.: Физматлит
 +
|год = 2006
 +
|страниц = 816
 +
}}
== См. также ==
== См. также ==
 +
* [[Метод множественных сравнений Шеффе]]
 +
* [[Критерий Стьюдента]]
 +
* [[Гипотеза сдвига]]
== Ссылки ==
== Ссылки ==
 +
* [http://www.webpages.uidaho.edu/~brian/stat401ch9_02.pdf Fisher’s least significant difference (LSD)]
 +
* [http://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B3%D0%B8%D0%BF%D0%BE%D1%82%D0%B5%D0%B7%D0%B0 Википедия: Проверка статистических гипотез]
 +
* [http://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9 Википедия: Статистический критерий]
 +
* [http://www.statsoft.ru/home/textbook/glossary Электронный статистический словарь StatSoft]
-
{{Заготовка}}
+
[[Категория: Прикладная статистика]]
-
 
+
-
[[Категория: Параметрическая проверка гипотез]]
+

Версия 00:22, 10 января 2009

Метод LSD = Метод группирования выборок с наименее значимой разницей = Least Significant difference.

Метод LSD позволяет проверять равенство средних значений нескольких выборок. При этом объемы выборок могут быть различными.

Содержание

Описание критерия

Имеется k выборок x^{n_1}_1, . . . , x^{n_k}_k объемом n_i (i=1,...,k ) каждая. Средние значения выборок обозначим через \mu_i.

Дополнительные предположения

  • Выборки x^{n_1}_1, . . . , x^{n_k}_k являются нормальными

Нулевая гипотеза

Метод LSD проверяет гипотезу H_0 о том, что средние значения всех k выборок одинаковы.

H_0: \mu_1 = \mu_2 =  . . . = \mu_k

Альтернативная гипотеза H_1: существует, по крайней мере, две выборки i и j (i \neq j) с несовпадающими средними значениями.

H_1: \mu_i  \neq \mu_j (для некоторых i \neq j).

Статистика метода LSD

Статистика метода LSD вычисляется в соответствии с соотношением:

T  = \frac{\overline{X}_{i+1} - \overline{X}_{i}}{\sqrt{\frac{n_i + n_{i+1}}{n_i \cdot n_{i+1}} \cdot s^2_{int}}}.

Здесь S^2_{int} - внутригрупповая дисперсия:

S^2_{int}=\frac{1}{n-k}\sum_{i=1}^k\sum_{j=1}^{n_i}\bigl(x_{ij}-\overline{X}_i\bigr)^2

Критическая область

Для статистики метода LSD критической областью при уровне значимости \alpha является область

\Omega_{\alpha}:\; T>t_{n-k,\alpha}

где  t_{n-k,\alpha} - квантиль распределения Стьюдента.

Для всех (i, i+1) проверяем гипотезу \overline{X}_{i+1} = \overline{X}_{i}. Если нулевая гипотеза H_0 выполнена, тогда объединяем X_i с X_{i+1}.

Примечание

Это односторонний критерий.

Пример

 X_i - цены на i-ое лекарство в разных аптеках. Вопрос: какие лекарства взаимозаменяемы по цене? Делим лекарства на ценовые коридоры.

История

Предложен в 70-х годах.

Литература

  1. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 816 с.

См. также

Ссылки

Личные инструменты