Биномиальное распределение
Материал из MachineLearning.
(дополнение) |
(дополнение) |
||
Строка 60: | Строка 60: | ||
Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена: | Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена: | ||
+ | |||
+ | <center><tex>\sup_{-\infty\le x\le\infty}|F_n(x)-\Phi(x)|\le\frac{p^2+q^2}{\sqrt{npq}},</tex></center> | ||
+ | |||
+ | где <tex>F_n(x)</tex> - функция распределения случайной величины <tex>X'=\frac{X-np}{\sqrt{npq}}</tex>. На практике решение о том, насколько следует доверять нормальному приближению, принимают исходя из величины <tex>npq</tex>. Чем она больше, тем меньше будет погрешность приближения. | ||
+ | |||
+ | Заметим, что асимптотический результат не изменится, если заменить строгие неравенства на нестрогие и наоборот. Предельная вероятность от такой замены также не поменяется, так как нормальное распределение абсолютно непрерывно и вероятность принять любое конкретное значение для него равна нулю. Однако исходная вероятность от такой замены может измениться, что вносит в формулу некоторую неоднозначность. Для больших значений <tex>n</tex> изменение будет невелико, однако для небольших <tex>n</tex> это может внести дополнительную погрешность. | ||
+ | |||
+ | Для устранения этой неоднозначности, а также повышения точности приближения рекомендуется задавать интересующие события в виде интервалов с полуцелыми границами. При этом приближение получается точнее. Это связано с тем интуитивно понятным соображением, что аппроксимация кусочно-постоянной функции (функции распределения биномиального закона) с помощью непрерывной функции дает более точные приближения между точками разрыва, чем в этих точках. | ||
+ | |||
+ | ===Примеры=== | ||
Версия 14:44, 4 ноября 2009
Содержание[убрать] |
Определение
Биномиальное распределение - дискретное распределение вероятностей случайной величины , принимающей целочисленные значения
с вероятностями:
Данное распределение характеризуется двумя параметрами: целым числом , называемым числом испытаний, и вещественным числом
,
, называемом вероятностью успеха в одном испытании. Биномиальное распределение - одно из основных распределений вероятностей, связанных с последовательностью независимых испытаний. Если проводится серия из
независимых испытаний, в каждом из которых может произойти "успех" с вероятностью
, то случайная величина, равная числу успехов во всей серии, имеет указанное распределение. Эта величина также может быть представлена в виде суммы
независимых слагаемых, имеющих распределение Бернулли.
Основные свойства
- Математическое ожидание:
- Дисперсия:
- Асимметрия:
; при
распределение симметрично относительно центра
Асимптотические приближения при больших n
Если значения велики, то непосредственное вычисление вероятностей событий, связанных с данной случайной величиной, технически затруднительно.
В этих случаях можно использовать приближения биномиального распределения распределением Пуассона и нормальным (приближение Муавра-Лапласа).
Приближение Пуассона
Приближение распределением Пуассона применяется в ситуациях, когда значения большие, а значения
близки к нулю. При этом биномиальное распределение аппроксимируется распределением Пуассона с параметром
.
Строгая формулировка: если и
таким образом, что
, то
Более того, справедлива следующая оценка. Пусть - случайная величина, имеющая распределение Пуассона с параметром
.
Тогда для произвольного множества
справедливо неравенство:
Доказательство и обзор более точных результатов, касающихся точности данного приближения, можно найти в [1, гл. III, §12].
Нормальное приближение
Приближение нормальным распределением используется в ситуациях, когда , а
фиксировано. Это приближение можно рассматривать как частный случай центральной предельной теоремы, применение которой основано на представлении
в виде суммы
слагаемых. Приближение основано на том, что при указанных условиях распределение нормированной величины
близко к стандартному нормальному.
Локальная теорема Муавра-Лапласа
Данная теорема используется для приближенного вычисления вероятностей отдельных значений биномиального распределения. Она утверждает [1, гл. I, §6], что равномерно по всем значениям , таким что
, имеет место
где - плотность стандартного нормального распределения.
Интегральная теорема Муавра-Лапласа
На практике необходимость оценки вероятностей отдельных значений, которую дает локальная теорема Муавра-Лапласа, возникает не часто. Гораздо более важно оценивать вероятности событий, включающих в себя множество значений. Для этого используется интегральная теорема, которую можно сформулировать в следующем виде [1, гл. I, §6]:
где случайная величина имеет стандартное нормальное распределение
, и аппроксимирующая вероятность определяется по формуле
где - функция распределения стандартного нормального закона:
.
Есть ряд результатов, позволяющих оценить скорость сходимости. В [1, гл. I, §6] приводится следующий результат, являющийся частным случаем теоремы Берри-Эссеена:
где - функция распределения случайной величины
. На практике решение о том, насколько следует доверять нормальному приближению, принимают исходя из величины
. Чем она больше, тем меньше будет погрешность приближения.
Заметим, что асимптотический результат не изменится, если заменить строгие неравенства на нестрогие и наоборот. Предельная вероятность от такой замены также не поменяется, так как нормальное распределение абсолютно непрерывно и вероятность принять любое конкретное значение для него равна нулю. Однако исходная вероятность от такой замены может измениться, что вносит в формулу некоторую неоднозначность. Для больших значений изменение будет невелико, однако для небольших
это может внести дополнительную погрешность.
Для устранения этой неоднозначности, а также повышения точности приближения рекомендуется задавать интересующие события в виде интервалов с полуцелыми границами. При этом приближение получается точнее. Это связано с тем интуитивно понятным соображением, что аппроксимация кусочно-постоянной функции (функции распределения биномиального закона) с помощью непрерывной функции дает более точные приближения между точками разрыва, чем в этих точках.
Примеры
Литература
1. Ширяев А.Н. Вероятность. — М.: МЦНМО, 2004.
Ссылки
- Биномиальное распределение (Википедия)
- Binomial distribution (Wikipedia)