Значимость коэффициентов линейной регрессии
Материал из MachineLearning.
Валентина Федорова (Обсуждение | вклад)
(Новая: Проверка статистической '''значимости коэффициентов линейной регрессии''' заключается в проверке [[Ну...)
К следующему изменению →
Версия 17:15, 23 января 2009
Проверка статистической значимости коэффициентов линейной регрессии заключается в проверке гипотезы значимости или незначимости отличия оценок некоторых регрессионных коэффициентов от нуля. Если в результате проверки оказывается, что отличие оценки каких-то регрессионных коэффициентов от нуля не влияет на качество модели, то соответствующие предикторные переменные можно искличить из регрессионной модели.
Содержание[убрать] |
Обозначения
Введем обозначения:
- набор
предикторных переменных
- коэффициенты линейной регрессии.
– зависимая переменная (отклик)
Модель линейной регрессии имеет вид:
Пусть .Введём дополнительные обозначения:
Тогда .
Тогда .
Анализ структкры модели
Утверждение 1:
Если основные предположения многомерной линейной регрессии верны для , но МНК-оценка
построена только по
, то
- смещённая и несостоятельная оценка для
.
Утверждение 1 говорит о том, что если при построении модели регрессии мы недобрали признаков(предикторных переменных), то получим плохую МНК-оценку для параметров регрессии.
Утверждение 2:
Если основные предположения многомерной линейной регрессии верны для , но МНК-оценка
построена по
, то
- несмещённая и состоятельная оценка для
.
При этом .
В утверждении 2 говорится, что если в регрессионной модели присутствуют лишние признаки, то возрастают дисперсии полученных МНК-оценок.
Можно сделать вывод, что если не выполнять проверок на значимость предикторных переменных, то для получения хорошей МНК-оценки коэффициентов регрессии лучше взять предикторных переменных больше, нежели недобрать их.
Проверка значимости коэффициентов
Коэффициент линейной регрессии считается значимым, если его МНК-оценка отлична от нуля.
Опишем критерий Фишера проверки значимости коэффициентов линейной регрессии.
Нулевая гипотеза .
Нулевая гипотеза утверждает, что отклик не зависит от предикторных переменных
.
Статистика критерия:
имеет имеет распределение Фишера с и
степенями свободы. Тогда критической областью критерия является правый хвост распределения Фишера,
что соотвествует альтернативной гипотезе
.
Критерий (при уровне значимости ) против альтернативы
:
- если
, то нулевая гипотеза
отвергается в пользу альтернативы
;
- если
, то принимаем нулевую гипотезу
;
где есть
-квантиль распределения Фишера с
и
степенями свободы.
Литература
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с. стр.124-132
См. также
Ссылки
![]() | Статья в настоящий момент дорабатывается. Валентина Федорова 20:15, 23 января 2009 (MSK) |