Критерии однородности
Материал из MachineLearning.
Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |
Критерии однородности - это критерии проверки гипотез о том, что две (или более) выборки взяты из одного распределения вероятностей. Рассмотрим такую классификацию критериев:
- Непараметрические (свободные от распределения) критерии однородности не предполагают присутствие какой-либо фундаментальной информации о законе распределения. Любое распределение можно описать параметром положения, характеризующим центр группирования случайных величин, и параметром масштаба, характеризующим степень рассеяния случайных величин относительно центра группирования. Когда закон распределения неизвестен, гипотезы о параметрах проверяются при помощи специальных критериев сдвига и масштаба. Также существуют двухвыборочные критерии согласия.
- Непараметрические критерии сдвига.
- Непараметрические критерии масштаба.
- Двухвыборочные критерии согласия.
- Если же принимаются какие-либо дополнительные предположения о законе распределения вероятностей, то можно применять
параметрические критерии однородности.
Содержание |
Непараметрические критерии однородности
Непараметрические критерии сдвига
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. Пусть заданы две выборки ,взятые из неизвестных непрерывных распределений и соответственно.
Нулевая гипотеза:
Наиболее частая альтернативная гипотеза: .
Существует большое количество критериев, проверяющих эту гипотезу:
Ранговые критерии сдвига для двух выборок:
- Быстрый ранговый критерий [1]
- Критерий Уилкоксона-Манна-Уитни [1]
- Критерий Фишера-Йэйтса-Терри-Гёфдинга [1]
- Критерий Ван дер Вардена [1]
- Медианный критерий [1]
- Критерий Хаги [1]
- E-Критерий [1]
Ранговые критерии сдвига для нескольких (k>2) выборок:
- Критерий Краскела-Уоллиса [1]
- Критерий Ван дер Вардена [1]
- Медианный критерий [1]
- Критерий Левиса [1]
- Критерий Краузе [1]
- Критерий Пейджа [1]
- Критерий Вилкоксона-Вилкокс [1]
- Критерий Фишера-Йэйтса-Терри-Гёфдинга [1]
- Быстрый критерий Кенуя [1]
- Критерий Джонкхиера [1]
- Критерий Неменьи [1]
- Критерий Фридмена-Кендалла-Бэбингтона-Смита [1]
- Критерий Хеттманспергера [1]
- Критерий Андерсона-Каннемана-Шэча [1]
- Критерий со взвешенными ранжировками Даны Квейд [1]
- Критерий Кендалла-Эренберга [1]
- Критерий Ходжеса-Лемана-Сена [1]
Непараметрические критерии масштаба
Для двух выборок . проверяется гипотеза о том, что они принадлежат одному и тому же распределению, но с разным параметром масштаба. Если плотность распределения первой выборки — , а второй выборки — , то нулевая гипотеза .
Ранговые критерии масштаба для двух выборок:
- Критерий Ансари—Бредли [1]
- Критерий Зигеля-Тьюки [1]
- Критерий Кейпена [1]
- Критерий Клотца [1]
- Критерий Сэвиджа [1]
- Критерий Муда [1]
- Критерий Сукхатме [1]
- Критерий Сэндвика-Олсона [1]
- Критерий Камата [1]
- Комбинированный критерий Буша-Винда [1]
Ранговые критерии масштаба нескольких (k>2) выборок:
Двухвыборочные критерии согласия
- Критерий Лемана-Розенблатта
- Двухвыборочный критерий Колмогорова-Смирнова [1]
- Критерий Катценбайссера-Хакля [1]
- Двухвыборочный критерий Андерсона [1]
Параметрические критерии однородности
Сравнение параметров нормальных распределений
Сравнение двух средних значений
Имеются две выборки независимых случайных величин Необходимо на основе выборочных данных установить наличие значимой разницы в средних двух совокупностей, из которых извлечены выборки.
Нулевая гипотеза: .
Альтернативы:
- Сравнение при известных дисперсиях осуществляется при помощи критерия Стьюдента.
- Сравнение при неизвестных равных дисперсиях осуществляется при помощи критерия Стьюдента.
- Сравнение при неизвестных неравных дисперсиях осуществляется при помощи модификаций критерия Стьюдента: критерий Кохрена-Кокса, Критерий Сатервайта, критерий Уэлча.
- Сравнение двух выборочных средних в связанных выборках осуществляется при помощи критерия Стьюдента.
- Критерий Уолша [1] позволяет проверять гипотезу о принадлежности одного наблюдения нормальному распределению, генерирующему выборку.
- Двухступентчатый двухвыборочный медианный критерий Волфа [1]
- Критерий Фишера для сравнения двух средних с одинаковыми дисперсиями. [1] Эквивалентен критерию Стьюдента и основан на связи между распределениями Стьюдента и Фишера.
Сравнение нескольких средних значений
Имеются k выборок из нормально распределенной совокупности
Нулевая гипотеза
Альтернатива
- Модифицированный критерий Стьюдента [1] позволяет решать задачу в случае равных объемов выборок.
- Критерий стьюдентизированного размаха [1]
- Дисперсионный критерий [1]
- Критерий Полсона [1]
решает задачу отделения выборки с наибольшим средним значением от всех остальных.
- Критерий Тьюки (метод прямого сравнения) [1]
- Критерий "стьюдентизированного" максимума (обобщенный критерий Тьюки) [1]
- Критерий Шеффе [1]
- Критерий Стьюдента-Ньюмена-Кейлса [1]
- Критерий Дункана [1]
- Критерий Линка-Уоллеса [1]
Сравнение двух дисперсий
Для двух нормально распределенных случайных величин необходимо проверить гипотезу равенства дисперсий, опираясь на их выборочные оценки.
- Критерий Фишера
- Критерий Романовского [1]
- Критерий отношения размахов [1]
- Критерий стьюдентизированного размаха [1]
- Критерий Аризоно-Охты [1]
Сравнение нескольких дисперсий
Пусть - дисперсии выборок
Нулевая гипотеза
Альтернатива
- Критерий Бартлетта [1]
- Критерий Кокрена [1]
- Критерий Неймана-Пирсона [1]
- Критерий Блисса-Кохрана-Тьюки [1]
- Критерий Хартли [1]
- Критерий Кэдуэлла-Лесли-Брауна [1]
- Критерий Самиуддина [1]
Сравнение параметров экспоненциальных распределений
Сравнение двух параметров
Предположим, имеются две выборки из экспоненциальных распределений: т.е. из распределений с плотностями . Здесь - параметры распределений (средние значения). Иногда на практике (задачи анализа надежности объектов) используют параметр - интенсивность отказов.
Сравнение нескольких (k>1) параметров
- Критерий Дэвида [1]
- Критерий максимального правдоподобия [1]
- Критерий Нагарсенкера [1]
- Критерий Чена [1]
- Комбинированный критерий Сингха [1]
Ссылки
Литература
- Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
- Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
См. также
- Проверка статистических гипотез — о методологии проверки статистических гипотез.
- Статистика (функция выборки)
- Критерии согласия