Участник:Riabenko/Песочница

Материал из MachineLearning.

< Участник:Riabenko(Различия между версиями)
Перейти к: навигация, поиск
м (Анализ поведения схожих критериев)
Текущая версия (23:34, 29 октября 2012) (править) (отменить)
м (Полностью удалено содержимое страницы)
 
(23 промежуточные версии не показаны)
Строка 1: Строка 1:
-
{{TOCright}}
 
-
= Оценки =
 
-
{|class = "standard sortable"
 
-
! class="unsortable"|№ п/п !! Студент !! Задание 1 (1 балл) !! Задание 2 (1 балл) !! Задание 3 (3 балла) !! Рецензировние задания 3 (1 балл) !! Сумма
 
-
|-
 
-
| align="center"|1 || Александров Я. || || || || ||
 
-
|-
 
-
| align="center"|2 || Артюхин С. || || || || ||
 
-
|-
 
-
| align="center"|3 || Бобрик К. || || || || ||
 
-
|-
 
-
| align="center"|4 || Гаврилюк К. || || || || ||
 
-
|-
 
-
| align="center"|5 || Елшин Д. || || || || ||
 
-
|-
 
-
| align="center"|6 || Ермушева А. || || || || ||
 
-
|-
 
-
| align="center"|7 || Зимовнов А.|| || || || ||
 
-
|-
 
-
| align="center"|8 || Игнатьев О. || || || || ||
 
-
|-
 
-
| align="center"|9 || Кириллов А. || || || || ||
 
-
|-
 
-
| align="center"|10 || Марченко Е.|| || || || ||
 
-
|-
 
-
| align="center"|11 || Матвеева Д. || || || || ||
 
-
|-
 
-
| align="center"|12 || Меркулова Т. || || || || ||
 
-
|-
 
-
| align="center"|13 || Некрасов К. || || || || ||
 
-
|-
 
-
| align="center"|14 || Новиков П. || || || || ||
 
-
|-
 
-
| align="center"|15 || Панов А. || || || || ||
 
-
|-
 
-
| align="center"|16 || Плященко Е. || || || || ||
 
-
|-
 
-
| align="center"|17 || Полежаев В. || || || || ||
 
-
|-
 
-
| align="center"|18 || Сабурова М. || || || || ||
 
-
|-
 
-
| align="center"|19 || Соколов Е.|| || || || ||
 
-
|-
 
-
| align="center"|20 || Фигурнов М. || || || || ||
 
-
|-
 
-
| align="center"|21 || Цупков С. || || || || ||
 
-
|-
 
-
| align="center"|22 || Шанин И. || || || || ||
 
-
|}
 
-
= Задание 1. Исследование свойств одномерных статистических критериев на модельных данных =
 
-
Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение
 
-
[[Достигаемый уровень значимости|достигаемого уровня значимости]] (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить [[Проверка статистических гипотез|проверку гипотезы]] при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
 
-
 
-
# график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
 
-
# график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
 
-
# график с эмпирическими оценками [[Мощность критерия|мощности]] одного или двух критериев для разных значений параметров.
 
-
 
-
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся <tex>k</tex> раз для каждого набора значений параметров, и в <tex>m</tex> из <tex>k</tex> случаев гипотеза была отвергнута на некотором фиксированном уровне значимости <tex>\alpha</tex> (примем <tex>\alpha=0.05</tex>), оценкой мощности будет отношение <tex>m/k.</tex>
 
-
 
-
Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и '''выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.)''', а также *.m-файл или R-скрипт, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
 
-
 
-
Задание принимается до '''четырнадцатого октября.'''
 
-
 
-
== Пример задания ==
 
-
Исследуем чувствительность классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]] при зашумлении выборок наблюдениями, взятыми из равномерного распределения.
 
-
 
-
<tex>x^n, \;\; x \sim 0.9\cdot N(\mu_1,1)+ 0.1\cdot U\left[-5+\mu_1,5+\mu_1\right]</tex>&nbsp;— выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-5+\mu_1,5+\mu_1\right]</tex> распределений с весами <tex>0.9</tex> и <tex>0.1</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>0.9</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). <br>
 
-
 
-
<tex>y^n, \;\; y \sim 0.9\cdot N(\mu_2,1)+ 0.1\cdot U\left[-5+\mu_2,5+\mu_2\right]</tex>&nbsp;— аналогичная выборка. <br>
 
-
 
-
<tex>H_0\,:\; \mathbb{E}(x)=\mathbb{E}(y), \;\; H_1\,:\; \mathbb{E}(x)\neq\mathbb{E}(y).</tex>
 
-
 
-
<tex>\mu_1=0, \;\; \mu_2=-2\,:\,0.01\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>
 
-
 
-
При каждом значении <tex>\mu_2</tex> выборки для разных значений <tex>n</tex> генерируются независимо.
 
-
<gallery widths="250px" heights="250px">
 
-
Изображение:Once_p.png|Значения достигаемого уровня значимости при однократной генерации выборок.
 
-
Изображение:3000_p.png|Значения достигаемого уровня значимости, усрёднённые по 3000 экспериментам.
 
-
Изображение:3000_pow.png|Значения эмпирических оценок мощности критерия при проведении 3000 экспериментов <tex>(\alpha=0.05).</tex>
 
-
</gallery>
 
-
 
-
Заметим, что однократная генерация выборок даёт достаточно нестабильные результаты, не позволяя точно оценить границы области, где нулевая гипотеза отклоняется, поэтому и необходимо усреднение по большому числу экспериментов.
 
-
 
-
Видно, что при достаточно большой разнице между средними и большом размере выборок наличие шума не мешает уверенно отклонять гипотезу однородности. Когда, наоборот, разница между средними невелика (меньше 0.2-0.5 в зависимости от размера выборок), мощность близка к нулю, а среднее значение достигаемого уровня значимости колеблется около 0.5, что логично, так как его распределение при справедливости нулевой гипотезы равномерно на <tex>[0,1]</tex>.
 
-
 
-
Чтобы оценить вклад зашумления выборок, оценим при всех значениях параметра мощность критерия и средний достигаемый уровень значимости на аналогичных выборках без шума и сравним результаты.
 
-
<gallery widths="500px" heights="250px">
 
-
Изображение:Diff_ps.png|Разность средних достигаемых уровней значимости на выборках без шума и с шумом.
 
-
Изображение:Diff_pows.png|Разность эмпирических оценок мощности на выборках без шума и с шумом.
 
-
</gallery>
 
-
 
-
Видно, что наличие шума всё меньше влияет на работу критерия с ростом объёма выборок и разницы между их средними. Тем не менее, в некоторых областях изменения параметров потеря мощности из-за 10% зашумления может составлять до 20%, а средний достигаемый уровень значимости может быть выше на 0.1.
 
-
 
-
Отметим, что приведённые количественные выводы справедливы только для шума рассматриваемой структуры.
 
-
== Задания==
 
-
=== Анализ поведения схожих критериев ===
 
-
Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого критерия.
 
-
 
-
* <tex>x^n, \;\; x \sim N(0,1),\;\;y^n, \;\; y \sim N(\mu,1);</tex> <br> <tex>H_0\,:</tex> средние двух выборок равны, <tex>\;H_1\,:</tex> средние двух выборок не равны; <br> <tex>\mu=-2\,:\,0.02\,:\,2;\;\; n=10\,:\,5\,:\,100.</tex>
 
-
::Студент: двухвыборочный [[критерий Стьюдента]] для независимых выборок и [[критерий Уилкоксона-Манна-Уитни]].
 
-
::Студент: [[критерий Уилкоксона-Манна-Уитни]] и [[медианный критерий]].
 
-
::Студент: [[критерий Уилкоксона-Манна-Уитни]] и двухвыборочный перестановочный критерий.
 
-
 
-
* <tex>x^n, \;\; x \sim p\cdot N(0,1)+ \left(1-p\right)\cdot U\left[-a,a\right]</tex>&nbsp;— выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(0,1)</tex> и равномерного <tex>U\left[-a,a\right]</tex> распределений с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации выборки используется случайный датчик&nbsp;— если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе&nbsp;— элемент, взятый из равномерного). <br> <tex> H_0\,:\; x \sim N(0,1), \;\;\; H_1\,:\; H_0 </tex> неверна; <br> <tex>n=10\,:\,5\,:\,100.</tex>
 
-
 
-
::Студент: [[критерий Шапиро-Уилка]] и [[критерий Колмогорова-Смирнова]], <tex>a=1, \;\; p=0\,:\,0.02\,:\,1</tex>
 
-
::Студент: [[критерий омега-квадрат]] и [[критерий Шапиро-Уилка]], <tex>a=2, \;\; p=0\,:\,0.02\,:\,1</tex>
 
-
::Студент: [[критерий хи-квадрат]] и [[критерий омега-квадрат]], <tex>p=0.1, \;\; a=0.5\,:\,0.1\,:\,5.</tex>
 
-
::Студент: [[критерий Колмогорова-Смирнова]] и [[критерий хи-квадрат]], <tex>p=0.25, \;\; a=0.5\,:\,0.1\,:\,5.</tex>
 

Текущая версия

Личные инструменты