Панельные данные

Панельные данные[1][2], или лонгитюдные данные[2] — используемые в социальных науках и эконометрике многомерные данные, получаемые серией измерений или наблюдений за несколько периодов времени для одних и тех же компаний или людей. Исследование, в котором используются панельные данные, называется панельным исследованием.

Пример

Сбалансированная панель
Человек Год Доход Возраст Пол
№ 120161300271
№ 120171600281
№ 120182000291
№ 220162000382
№ 220172300392
№ 220182400402
Несбалансированная панель
Человек Год Доход Возраст Пол
№ 120161600231
№ 120171500241
№ 220161900412
№ 220172000422
№ 220182100432
№ 320173300341

В приведенном примере показаны два набора данных, собранные в панельную структуру. Индивидуальные характеристики (доход, возраст, пол) собираются для разных людей и разных лет. В первом наборе данных два человека (№ 1, № 2) наблюдаются каждый год в течение трех лет (2016, 2017, 2018). Во втором наборе данных три человека (№ 1, № 2, № 3) наблюдаются два раза (человек № 1), три раза (человек № 2) и один раз (человек № 3), соответственно, за три года (2016, 2017, 2018); в частности, для человека № 1 отсутствуют данные по 2018 году, а для человек № 3 — по 2016 и 2018 году.

Сбалансированная панель[3] (первый пример) представляет собой набор данных, в котором каждый член группы (то есть человек) наблюдается каждый год. Следовательно, если сбалансированная панель содержит N единиц наблюдения и Т периодов, число наблюдений (n) в наборе данных обязательно составит п = N × T[4].

Несбалансированная панель[3] (второй набор данных в примере) представляет собой набор данных, в котором, по меньшей мере, один член группы не имеет данных по всем периодам. Поэтому, если несбалансированная панель содержит N единиц наблюдения и Т периодов, то число наблюдений (n) в наборе данных строго меньше их произведения: п < N × T[4].

Оба набора данных структурированы в длинном формате, в котором одна строка содержит одно наблюдение за один раз. Другим способом структурирования панельных данных является широкий формат, где одна строка представляет одну единицу наблюдения для всех моментов времени[5] (например, в широком формате будет только две (первый пример) или три (второй пример) строки данных, с дополнительными столбцами для каждой переменной времени (доход, возраст).

Примечания

  1. Ратникова Т. А. Введение в экономический анализ панельных данных // Экономический журнал ВЭШ. — 2006. № 2. С. 267-316.
  2. Денисова И. А. Выход старших возрастных когорт с рынка труда: анализ методами дожития // Население и экономика.. — 2017. Т. 1, № 1. С. 22-49.
  3. Грин У. Г. Эконометрический анализ / перевод с английского под научной редакцией С. С. Синельникова и М. Ю. Турунцевой. — Москва: Издательский дом «Дело» РАНХиГС, 2016. — Т. 1. — С. 423. — 760 с.
  4. Panel Data Econometrics: Theory (англ.) / edited by Tsionas M.. — Academic Press (an imprint of Elsevier), 2019. — P. 348. — 432 p.
  5. Andreß H.-J., Golsch K., Schmidt A. W. Applied Panel Data Analysis for Economic and Social Surveys (англ.). — Springer Science & Business Media, 2013. — P. 28. — 327 p.

Литература

  • Baltagi, Badi H. (2008). Econometric Analysis of Panel Data (Fourth ed.). Chichester: John Wiley & Sons. ISBN 978-0-470-51886-1.
  • Davies, A.; Lahiri, K. (1995). A New Framework for Testing Rationality and Measuring Aggregate Shocks Using Panel Data // Journal of Econometrics. 68 (1): 205–227. doi:10.1016/0304-4076(94)01649-K.
  • Davies, A.; Lahiri, K. (2000). "Re-examining the Rational Expectations Hypothesis Using Panel Data on Multi-Period Forecasts". Analysis of Panels and Limited Dependent Variable Models. Cambridge: Cambridge University Press. pp. 226–254. ISBN 0-521-63169-6.
  • Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. p. 2. ISBN 0-19-852484-6.
  • Frees, E. (2004). Longitudinal and Panel Data: Analysis and Applications in the Social Sciences. New York: Cambridge University Press. ISBN 0-521-82828-7.
  • Hsiao, Cheng (2003). Analysis of Panel Data (Second ed.). New York: Cambridge University Press. ISBN 0-521-52271-4.
  • Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. p. 2. ISBN 0-471-21487-6.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.