Критерии однородности
Материал из MachineLearning.
![]() | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |
Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей. Рассмотрим такую классификацию критериев:
- Непараметрические (свободные от распределения) критерии однородности не предполагают присутствие какой-либо фундаментальной информации о законе распределения. Любое распределение можно описать параметром положения, характеризующим центр группирования случайных величин, и параметром масштаба, характеризующим степень рассеяния случайных величин относительно центра группирования. Когда закон распределения неизвестен, гипотезы о параметрах проверяются при помощи специальных критериев сдвига и масштаба. Также существуют двухвыборочные критерии согласия.
- Непараметрические критерии сдвига.
- Непараметрические критерии масштаба.
- Двухвыборочные критерии согласия.
- Если же принимаются какие-либо дополнительные предположения о законе распределения вероятностей, то можно применять
параметрические критерии однородности.
Содержание[убрать] |
Непараметрические критерии однородности
Непараметрические критерии сдвига
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
Пусть заданы две выборки
,взятые из неизвестных непрерывных распределений
и
соответственно.
Нулевая гипотеза:
Наиболее частая альтернативная гипотеза: .
Существует большое количество критериев, проверяющих эту гипотезу:
Ранговые критерии сдвига для двух выборок:
- Быстрый ранговый критерий [1]
- Критерий Уилкоксона-Манна-Уитни [1]
- Критерий Фишера-Йэйтса-Терри-Гёфдинга [1]
- Критерий Ван дер Вардена [1]
- Медианный критерий [1]
- Критерий Хаги [1]
- E-Критерий [1]
Ранговые критерии сдвига для нескольких (k>2) выборок:
- Критерий Краскела-Уоллиса [1]
- Критерий Ван дер Вардена [1]
- Медианный критерий [1]
- Критерий Левиса [1]
- Критерий Краузе [1]
- Критерий Пейджа [1]
- Критерий Вилкоксона-Вилкокс [1]
- Критерий Фишера-Йэйтса-Терри-Гёфдинга [1]
- Быстрый критерий Кенуя [1]
- Критерий Джонкхиера [1]
- Критерий Неменьи [1]
- Критерий Фридмена-Кендалла-Бэбингтона-Смита [1]
- Критерий Хеттманспергера [1]
- Критерий Андерсона-Каннемана-Шэча [1]
- Критерий со взвешенными ранжировками Даны Квейд [1]
- Критерий Кендалла-Эренберга [1]
- Критерий Ходжеса-Лемана-Сена [1]
Непараметрические критерии масштаба
Для двух выборок .
проверяется гипотеза о том, что они принадлежат одному и тому же распределению,
но с разным параметром масштаба.
Если плотность распределения первой выборки —
, а второй выборки —
, то нулевая гипотеза
.
Ранговые критерии масштаба для двух выборок:
- Критерий Ансари—Бредли [1]
- Критерий Зигеля-Тьюки [1]
- Критерий Кейпена [1]
- Критерий Клотца [1]
- Критерий Сэвиджа [1]
- Критерий Муда [1]
- Критерий Сукхатме [1]
- Критерий Сэндвика-Олсона [1]
- Критерий Камата [1]
- Комбинированный критерий Буша-Винда [1]
Ранговые критерии масштаба нескольких (k>2) выборок:
Двухвыборочные критерии согласия
- Критерий Лемана-Розенблатта
- Двухвыборочный критерий Колмогорова-Смирнова [1]
- Критерий Катценбайссера-Хакля [1]
- Двухвыборочный критерий Андерсона [1]
Параметрические критерии однородности
Сравнение параметров нормальных распределений
Сравнение двух средних значений
Имеются две выборки независимых случайных величин
Необходимо на основе выборочных данных установить наличие значимой разницы в средних двух совокупностей, из которых извлечены выборки.
Нулевая гипотеза: .
Альтернативы:
- Сравнение при известных дисперсиях осуществляется при помощи критерия Стьюдента.
- Сравнение при неизвестных равных дисперсиях осуществляется при помощи критерия Стьюдента.
- Сравнение при неизвестных неравных дисперсиях осуществляется при помощи модификаций критерия Стьюдента: критерий Кохрена-Кокса, Критерий Сатервайта, критерий Уэлча.
- Сравнение двух выборочных средних в связанных выборках осуществляется при помощи критерия Стьюдента.
- Критерий Уолша [1] позволяет проверять гипотезу о принадлежности одного наблюдения нормальному распределению, генерирующему выборку.
- Двухступентчатый двухвыборочный медианный критерий Волфа [1]
- Критерий Фишера для сравнения двух средних с одинаковыми дисперсиями. [1] Эквивалентен критерию Стьюдента и основан на связи между распределениями Стьюдента и Фишера.
- О параметрических и непараметрических критериях проверки гипотез об однородности средних и их мощности на сайте Новосибирского государственного технического университета
Сравнение нескольких средних значений
Имеются k выборок из нормально распределенной совокупности
Нулевая гипотеза
Альтернатива
- Модифицированный критерий Стьюдента [1] позволяет решать задачу в случае равных объемов выборок.
- Критерий стьюдентизированного размаха [1]
- Дисперсионный критерий [1]
- Критерий Полсона [1]
решает задачу отделения выборки с наибольшим средним значением от всех остальных.
- Критерий Тьюки (метод прямого сравнения) [1]
- Критерий "стьюдентизированного" максимума (обобщенный критерий Тьюки) [1]
- Критерий Шеффе [1]
- Критерий Стьюдента-Ньюмена-Кейлса [1]
- Критерий Дункана [1]
- Критерий Линка-Уоллеса [1]
Сравнение двух дисперсий
Для двух нормально распределенных случайных величин необходимо проверить гипотезу равенства дисперсий, опираясь на их выборочные оценки.
- Критерий Фишера
- Критерий Романовского [1]
- Критерий отношения размахов [1]
- Критерий стьюдентизированного размаха [1]
- Критерий Аризоно-Охты [1]
Сравнение нескольких дисперсий
Пусть - дисперсии выборок
Нулевая гипотеза
Альтернатива
- Критерий Бартлетта [1]
- Критерий Кокрена [1]
- Критерий Неймана-Пирсона [1]
- Критерий Блисса-Кохрана-Тьюки [1]
- Критерий Хартли [1]
- Критерий Кэдуэлла-Лесли-Брауна [1]
- Критерий Самиуддина [1]
Сравнение параметров экспоненциальных распределений
Сравнение двух параметров
Предположим, имеются две выборки из экспоненциальных распределений: т.е. из распределений с плотностями
. Здесь
- параметры распределений (средние значения). Иногда на практике (задачи анализа надежности объектов) используют параметр
- интенсивность отказов.
Сравнение нескольких (k>1) параметров
- Критерий Дэвида [1]
- Критерий максимального правдоподобия [1]
- Критерий Нагарсенкера [1]
- Критерий Чена [1]
- Комбинированный критерий Сингха [1]
Ссылки
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерии согласия