м |
м |
(21 промежуточная версия не показана) |
Строка 1: |
Строка 1: |
- | {{TOCright}}
| |
- | = Оценки =
| |
- | {|class = "standard sortable"
| |
- | ! class="unsortable"|№ п/п !! Студент !! Задание 1 (1 балл) !! Задание 2 (1 балл) !! Задание 3 (3 балла) !! Рецензировние задания 3 (1 балл) !! Сумма
| |
- | |-
| |
- | | align="center"|1 || Александров Я. || || || || ||
| |
- | |-
| |
- | | align="center"|2 || Артюхин С. || || || || ||
| |
- | |-
| |
- | | align="center"|3 || Бобрик К. || || || || ||
| |
- | |-
| |
- | | align="center"|4 || Гаврилюк К. || || || || ||
| |
- | |-
| |
- | | align="center"|5 || Елшин Д. || || || || ||
| |
- | |-
| |
- | | align="center"|6 || Ермушева А. || || || || ||
| |
- | |-
| |
- | | align="center"|7 || Зимовнов А.|| || || || ||
| |
- | |-
| |
- | | align="center"|8 || Игнатьев О. || || || || ||
| |
- | |-
| |
- | | align="center"|9 || Кириллов А. || || || || ||
| |
- | |-
| |
- | | align="center"|10 || Марченко Е.|| || || || ||
| |
- | |-
| |
- | | align="center"|11 || Матвеева Д. || || || || ||
| |
- | |-
| |
- | | align="center"|12 || Меркулова Т. || || || || ||
| |
- | |-
| |
- | | align="center"|13 || Некрасов К. || || || || ||
| |
- | |-
| |
- | | align="center"|14 || Новиков П. || || || || ||
| |
- | |-
| |
- | | align="center"|15 || Панов А. || || || || ||
| |
- | |-
| |
- | | align="center"|16 || Плященко Е. || || || || ||
| |
- | |-
| |
- | | align="center"|17 || Полежаев В. || || || || ||
| |
- | |-
| |
- | | align="center"|18 || Сабурова М. || || || || ||
| |
- | |-
| |
- | | align="center"|19 || Соколов Е.|| || || || ||
| |
- | |-
| |
- | | align="center"|20 || Фигурнов М. || || || || ||
| |
- | |-
| |
- | | align="center"|21 || Цупков С. || || || || ||
| |
- | |-
| |
- | | align="center"|22 || Шанин И. || || || || ||
| |
- | |}
| |
| | | |
- | = Задание 1. Исследование свойств одномерных статистических критериев на модельных данных =
| |
- | Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение
| |
- | [[Достигаемый уровень значимости|достигаемого уровня значимости]] (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить [[Проверка статистических гипотез|проверку гипотезы]] при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
| |
- |
| |
- | # график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
| |
- | # график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
| |
- | # график с эмпирическими оценками [[Мощность критерия|мощности]] одного или двух критериев для разных значений параметров.
| |
- |
| |
- | В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся <tex>k</tex> раз для каждого набора значений параметров, и в <tex>m</tex> из <tex>k</tex> случаев гипотеза была отвергнута на некотором фиксированном уровне значимости <tex>\alpha</tex> (примем <tex>\alpha=0.05</tex>), оценкой мощности будет отношение <tex>m/k.</tex>
| |
- |
| |
- | Необходимо сдать: выполненный в LaTex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и '''выводами (объяснение полученных результатов моделирования, границы применимости критерия и т.д.)''', а также *.m-файл или R-скрипт, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
| |
- |
| |
- | Задание принимается до '''четырнадцатого октября.'''
| |
- |
| |
- | == Пример задания ==
| |
- | Исследуем чувствительность классического двухвыборочного [[Критерий Стьюдента|критерия Стьюдента]] для проверки гипотезы однородности против [[Гипотеза сдвига|альтернативы сдвига]] при зашумлении выборок наблюдениями, взятыми из равномерного распределения.
| |
- |
| |
- | <tex>x^n, \;\; x \sim 0.9\cdot N(\mu_1,1)+ 0.1\cdot U\left[-5+\mu_1,5+\mu_1\right]</tex> — выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-5+\mu_1,5+\mu_1\right]</tex> распределений с весами <tex>0.9</tex> и <tex>0.1</tex> соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит <tex>0.9</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). <br>
| |
- |
| |
- | <tex>y^n, \;\; y \sim 0.9\cdot N(\mu_2,1)+ 0.1\cdot U\left[-5+\mu_2,5+\mu_2\right]</tex> — аналогичная выборка. <br>
| |
- |
| |
- | <tex>H_0\,:\; \mathbb{E}(x)=\mathbb{E}(y), \;\; H_1\,:\; \mathbb{E}(x)\neq\mathbb{E}(y).</tex>
| |
- |
| |
- | <tex>\mu_1=0, \;\; \mu_2=-2\,:\,0.01\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- |
| |
- | При каждом значении <tex>\mu_2</tex> выборки для разных значений <tex>n</tex> генерируются независимо.
| |
- | <gallery widths="250px" heights="250px">
| |
- | Изображение:Once_p.png|Значения достигаемого уровня значимости при однократной генерации выборок.
| |
- | Изображение:3000_p.png|Значения достигаемого уровня значимости, усрёднённые по 3000 экспериментам.
| |
- | Изображение:3000_pow.png|Значения эмпирических оценок мощности критерия при проведении 3000 экспериментов <tex>(\alpha=0.05).</tex>
| |
- | </gallery>
| |
- |
| |
- | Заметим, что однократная генерация выборок даёт достаточно нестабильные результаты, не позволяя точно оценить границы области, где нулевая гипотеза отклоняется, поэтому и необходимо усреднение по большому числу экспериментов.
| |
- |
| |
- | Видно, что при достаточно большой разнице между средними и большом размере выборок наличие шума не мешает уверенно отклонять гипотезу однородности. Когда, наоборот, разница между средними невелика (меньше 0.2-0.5 в зависимости от размера выборок), мощность близка к нулю, а среднее значение достигаемого уровня значимости колеблется около 0.5, что логично, так как его распределение при справедливости нулевой гипотезы равномерно на <tex>[0,1]</tex>.
| |
- |
| |
- | Чтобы оценить вклад зашумления выборок, оценим при всех значениях параметра мощность критерия и средний достигаемый уровень значимости на аналогичных выборках без шума и сравним результаты.
| |
- | <gallery widths="500px" heights="250px">
| |
- | Изображение:Diff_ps.png|Разность средних достигаемых уровней значимости на выборках без шума и с шумом.
| |
- | Изображение:Diff_pows.png|Разность эмпирических оценок мощности на выборках без шума и с шумом.
| |
- | </gallery>
| |
- |
| |
- | Видно, что наличие шума всё меньше влияет на работу критерия с ростом объёма выборок и разницы между их средними. Тем не менее, в некоторых областях изменения параметров потеря мощности из-за 10% зашумления может составлять до 20%, а средний достигаемый уровень значимости может быть выше на 0.1.
| |
- |
| |
- | Отметим, что приведённые количественные выводы справедливы только для шума рассматриваемой структуры.
| |
- | == Задания==
| |
- | === Анализ поведения схожих критериев ===
| |
- | Требуется исследовать поведение указанной пары статистических критериев, подходящих для решения одной и той же задачи, сравнить мощность и достигаемые уровни значимости и сделать выводы о границах применимости критериев. Необходимо для каждого из критериев построить графики зависимости достигаемых уровней значимости и оценок мощностей от параметров, и показать, в каких областях изменения параметров предпочтительнее использовать тот или иной критерий. Для получения более гладких графиков рекомендуется применять оба критерия к одним и тем же выборкам, а не генерировать их отдельно для каждого критерия.
| |
- |
| |
- | * <tex>x^n, \;\; x \sim N(0,1),\;\;y^n, \;\; y \sim N(\mu,1);</tex> <br> <tex>H_0\,:</tex> средние двух выборок равны, <tex>\;H_1\,:</tex> средние двух выборок не равны; <br> <tex>\mu=-2\,:\,0.02\,:\,2;\;\; n=10\,:\,5\,:\,100.</tex>
| |
- | ::Студент: двухвыборочный [[критерий Стьюдента]] для независимых выборок и [[критерий Уилкоксона-Манна-Уитни]].
| |
- | ::Студент: [[критерий Уилкоксона-Манна-Уитни]] и [[медианный критерий]].
| |
- | ::Студент: [[критерий Уилкоксона-Манна-Уитни]] и двухвыборочный перестановочный критерий.
| |
- |
| |
- | * <tex>x^n, \;\; x \sim p\cdot N(0,1)+ \left(1-p\right)\cdot U\left[-a,a\right]</tex> — выборка длины <tex>n</tex> из смеси стандартного нормального <tex>N(0,1)</tex> и равномерного <tex>U\left[-a,a\right]</tex> распределений с весами <tex>p</tex> и <tex>1-p</tex> соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит <tex>p</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). <br> <tex> H_0\,:\; x \sim N(0,1), \;\;\; H_1\,:\; H_0 </tex> неверна; <br> <tex>n=10\,:\,5\,:\,100.</tex>
| |
- |
| |
- | ::Студент: [[критерий Шапиро-Уилка]] и [[критерий Колмогорова-Смирнова]], <tex>a=1, \;\; p=0\,:\,0.02\,:\,1</tex>
| |
- | ::Студент: [[критерий омега-квадрат]] и [[критерий Шапиро-Уилка]], <tex>a=2, \;\; p=0\,:\,0.02\,:\,1</tex>
| |
- | ::Студент: [[критерий хи-квадрат]] и [[критерий омега-квадрат]], <tex>p=0.1, \;\; a=0.5\,:\,0.1\,:\,5.</tex>
| |
- | ::Студент: [[критерий Колмогорова-Смирнова]] и [[критерий хи-квадрат]], <tex>p=0.25, \;\; a=0.5\,:\,0.1\,:\,5.</tex>
| |
- |
| |
- | *
| |
- |
| |
- | === Анализ устойчивости критериев к нарушению предположений ===
| |
- | Требуется исследовать поведение указанного критерия в условиях нарушения лежащих в его основе предположений. Оценить мощность и достигаемый уровень значимости критерия при различных значениях параметров, сделать выводы об устойчивости
| |
- | * Двухвыборочный [[критерий Стьюдента]] для независимых выборок, нарушение предположения о нормальности.
| |
- | <tex>x^n \sim p_1\cdot N(\mu_1,1)+ \left(1-p_1\right)\cdot U\left[-a+\mu_1,a+\mu_1\right]</tex> — выборка длины <tex>n</tex> из смеси нормального <tex>N(\mu_1,1)</tex> и равномерного <tex>U\left[-a+\mu_1,a+\mu_1\right]</tex> распределений с весами <tex>p_1</tex> и <tex>1-p_1</tex> соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит <tex>p_1</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного). <br>
| |
- | <tex>y^n \sim p_2\cdot N(\mu_2,1)+ \left(1-p_2\right)\cdot U\left[-a+\mu_2,a+\mu_2\right]</tex> — аналогичная выборка. <br>
| |
- | <tex>H_0\,:\; \mu_1=\mu_2, \;\; H_1\,:\; \mu_1\neq\mu_2;</tex> <br>
| |
- | <tex>\mu_1=0; \;\; \mu_2=-2\,:\,0.01\,:\,2.</tex> <br>
| |
- | ::Студент: <tex>p_1=0.8, \;\; p_2=1, \;\; a=1, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- | ::Студент: <tex>p_1=0.9, \;\; p_2=1, \;\; a=5, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- | ::Студент: <tex>p_1=p_2=0.8, \;\; a=1, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- | ::Студент: <tex>p_1=p_2=0.9, \;\; a=5, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- | ::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=1, \;\; n=150.</tex>
| |
- | ::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=5, \;\; n=100.</tex>
| |
- |
| |
- | * [[Критерий Фишера]] для проверки равенства дисперсий, нарушение предположения о нормальности.
| |
- | <tex>x^n, \;\; x \sim p_1\cdot N(0,\sigma_1^2)+ \left(1-p_1\right)\cdot U\left[-a,a\right]</tex> — выборка длины <tex>n</tex> из смеси нормального <tex>N(0,\sigma_1^2)</tex> и равномерного <tex>U[-a,a]</tex> распределений с весами <tex>p_1</tex> и <tex>1-p_1</tex> соответственно (при генерации выборки используется случайный датчик — если его значение не превосходит <tex>p_1</tex>, то добавляем в выборку элемент, взятый из нормального распределения, иначе — элемент, взятый из равномерного), <br>
| |
- | <tex>y^n,\;\; y \sim p_2\cdot N(0,\sigma_2^2)+ \left(1-p_2\right)\cdot U\left[-a,a\right]</tex> — аналогичная выборка,<br>
| |
- | <tex>H_0\,:\; var(x)=var(y), \;\; H_1\,:\; var(x)\neq var(y),</tex> <br>
| |
- | <tex>\sigma_1=2, \;\; \sigma_2=0.1\,:\,0.05\,:\,4.</tex> <br>
| |
- | ::Студент: <tex>p_1=p_2=0.8, \;\; a=2, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- | ::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=2, \;\; n=150.</tex>
| |
- | ::Студент: <tex>p_1=p_2=0\,:\,0.01\,:\,1, \;\; a=3, \;\; n=100.</tex>
| |
- |
| |
- | * Непараметрические критерии для проверки равенства дисперсий, нарушение предположения о равенстве медиан.
| |
- | <tex>x^n, \;\; x \sim N(0,1), \;\; y^n, \;\; y \sim N(\mu,\sigma^2);</tex> <br> <tex>H_0\,:</tex> дисперсии двух выборок равны, <tex>\;H_1\,:</tex> дисперсии двух выборок не равны.</tex>
| |
- | ::Студент: [[критерий Зигеля-Тьюки]], <tex>\mu=0\,:\,0.02\,:\,2, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=50.</tex>
| |
- | ::Студент: [[критерий Зигеля-Тьюки]], <tex>\mu=1, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>
| |
- | ::Студент: [[критерий Ансари-Бредли]], <tex>\mu=0\,:\,0.02\,:\,2, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=50.</tex>
| |
- | ::Студент: [[критерий Ансари-Бредли]], <tex>\mu=1, \;\; \sigma=0.1\,:\,0.05\,:\,2, \;\; n=15\,:\,5\,:\,200.</tex>
| |