Модель панельных данных с временны́ми эффектами

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Описание модели панельных данных с временны́ми эффектами)
 
Строка 9: Строка 9:
== Описание модели панельных данных с временны́ми эффектами ==
== Описание модели панельных данных с временны́ми эффектами ==
-
В введенных обозначениях '''модель панельных данных с с временны́ми эффектами ''' описывается уравнением
+
В введенных обозначениях '''модель панельных данных с временны́ми эффектами ''' описывается уравнением
{{eqno|1}}
{{eqno|1}}
::<tex> \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta </tex>
::<tex> \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta </tex>

Текущая версия

Модель панельных данных с временны́ми эффектами ( time-varying model for panel data) опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются эффектами. В данной модели эффекты объектов могут изменяться в каждый момент времени.

Содержание

Обозначения

Введем обозначения:

  •  i = 1,...,n – номера объектов, t = 1,...,T – моменты времени, k – число признаков.

Для каждого объекта в каждый момент времени известны:

  •  x_{it} – набор независимых переменных (вектор размерности k )
  •  y_{it} – зависимая переменная для экономической единицы i в момент времени t

Описание модели панельных данных с временны́ми эффектами

В введенных обозначениях модель панельных данных с временны́ми эффектами описывается уравнением

(1)
 \widehat{y}_{it} = \alpha_i + \gamma_t + x'_{it} \beta

Здесь \widehat{y}_{it} модельное значение зависимой переменной, соответствующее {y}_{it}. Величина \alpha_i выражает индивидуальный эффект объекта  i, не зависящий от времени t . Величина \gamma_t выражает зависимость индивидуального эффекта объекта  i от времени t ( будем считать, что всегда \gamma_1 = 1 ). При этом регрессоры  x_{it}  не содержат константу .

Параметры модели: \beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n), \gamma_t \in \mathbb{R} (i=2,...,T).

Понижение размерности. Исключение эффектов.

Для панельных данных типична ситуация, когда число объектов  n достаточно велико. Поэтому, применяя непосредственно метод наименьших квадратов к уравнению (1), при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты \alpha_i \cdot \gamma_t. При этом мы понижаем размерность задачи с (n+k+T-1) до  k .

Наиболее простой способ – переход в уравнении (1) к средним величинам по времени и по множеству объектов :

(2)
\overline{y_i}= \alpha_i + \overline{\gamma} + \overline{x'_i} \cdot \beta ,

где \overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\;  \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\;  \overline{\gamma} = \frac{1}{T} \sum_{t=1}^T \gamma_t;

(3)
\overline{y_t}= \overline{\alpha} + \gamma_t + \overline{x'_t} \cdot \beta ,

где \overline{y_t} = \frac{1}{n} \sum_{i=1}^n y_{it},\;  \overline{x_t} = \frac{1}{n} \sum_{i=1}^n x_{it},\;  \overline{\alpha} = \frac{1}{n} \sum_{i=1}^n \alpha_i

(4)
\overline{y}= \overline{\alpha} + \overline{\gamma} + \overline{x'} \cdot \beta ,

где \overline{y} = \frac{1}{nT} \sum_{i=1}^n \sum_{t=1}^T y_{it},\;  \overline{x} = \frac{1}{nT} \sum_{i=1}^n\sum_{t=1}^T x_{it},\;


Из (1),(2),(3),(4) получаем:

(5)
 \widehat{y}_{it} - \overline{y_i} - \overline{y_t} + \overline{y}= (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})' \cdot \beta .

Данная модель уже не зависит от эффектов \alpha_i \cdot \gamma_t.

Оценка параметров модели

Применяя обычный метод наименьших квадратов к уравнению (5), можно получить оценки

\widehat{\beta} = \left((x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i} - \overline{x_t} + \overline{x}) \cdot (y_{it} - \overline{y_i} - \overline{y_t} + \overline{y}).

Сравнение с другими моделями

Заметим, что если в рассмотренной модели все коэффициенты  \gamma_t = 1 (t = 1,...,T), то получим Модель панельных данных с фиксированными эффектами. На практике, чтобы понять, какая из этих двух моделей адекватнее, можно проверить гипотезу \mathbb{H}_0:\gamma_1 = ... = \gamma_T = 1 . Обычно для этого используют F-тест.

Проблемы

Для устойчивости данной модели необхоимо, чтобы значения \gamma_t изменялись плавно. Для этого используют регуляризацию:

\sum_{i=1}^n \sum_{t=1}^T( \widehat{y}_{it} - y_{it} )^2 + \lambda \sum_{t=2}^T( \gamma_t - \gamma_{t-1} )^2 \longrightarrow \underset{\alpha, \beta , \gamma} \min

Тогда, чем больше значение \lambda, тем более гладко изменяется  \gamma_t . Для выбора значения \lambda можно использовать метод скользящего контроля.

Литература

  1. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.

См. также

Ссылки


Статья в настоящий момент дорабатывается.
Валентина Федорова 23:52, 22 января 2009 (MSK)