Панельные данные
Панельные данные[1][2], или лонгитюдные данные[2] — используемые в социальных науках и эконометрике многомерные данные, получаемые серией измерений или наблюдений за несколько периодов времени для одних и тех же компаний или людей. Исследование, в котором используются панельные данные, называется панельным исследованием.
Пример
Человек | Год | Доход | Возраст | Пол |
---|---|---|---|---|
№ 1 | 2016 | 1300 | 27 | 1 |
№ 1 | 2017 | 1600 | 28 | 1 |
№ 1 | 2018 | 2000 | 29 | 1 |
№ 2 | 2016 | 2000 | 38 | 2 |
№ 2 | 2017 | 2300 | 39 | 2 |
№ 2 | 2018 | 2400 | 40 | 2 |
Человек | Год | Доход | Возраст | Пол |
---|---|---|---|---|
№ 1 | 2016 | 1600 | 23 | 1 |
№ 1 | 2017 | 1500 | 24 | 1 |
№ 2 | 2016 | 1900 | 41 | 2 |
№ 2 | 2017 | 2000 | 42 | 2 |
№ 2 | 2018 | 2100 | 43 | 2 |
№ 3 | 2017 | 3300 | 34 | 1 |
В приведенном примере показаны два набора данных, собранные в панельную структуру. Индивидуальные характеристики (доход, возраст, пол) собираются для разных людей и разных лет. В первом наборе данных два человека (№ 1, № 2) наблюдаются каждый год в течение трех лет (2016, 2017, 2018). Во втором наборе данных три человека (№ 1, № 2, № 3) наблюдаются два раза (человек № 1), три раза (человек № 2) и один раз (человек № 3), соответственно, за три года (2016, 2017, 2018); в частности, для человека № 1 отсутствуют данные по 2018 году, а для человек № 3 — по 2016 и 2018 году.
Сбалансированная панель[3] (первый пример) представляет собой набор данных, в котором каждый член группы (то есть человек) наблюдается каждый год. Следовательно, если сбалансированная панель содержит N единиц наблюдения и Т периодов, число наблюдений (n) в наборе данных обязательно составит п = N × T[4].
Несбалансированная панель[3] (второй набор данных в примере) представляет собой набор данных, в котором, по меньшей мере, один член группы не имеет данных по всем периодам. Поэтому, если несбалансированная панель содержит N единиц наблюдения и Т периодов, то число наблюдений (n) в наборе данных строго меньше их произведения: п < N × T[4].
Оба набора данных структурированы в длинном формате, в котором одна строка содержит одно наблюдение за один раз. Другим способом структурирования панельных данных является широкий формат, где одна строка представляет одну единицу наблюдения для всех моментов времени[5] (например, в широком формате будет только две (первый пример) или три (второй пример) строки данных, с дополнительными столбцами для каждой переменной времени (доход, возраст).
Примечания
- Ратникова Т. А. Введение в экономический анализ панельных данных // Экономический журнал ВЭШ. — 2006. — № 2. — С. 267-316.
- Денисова И. А. Выход старших возрастных когорт с рынка труда: анализ методами дожития // Население и экономика.. — 2017. — Т. 1, № 1. — С. 22-49.
- Грин У. Г. Эконометрический анализ / перевод с английского под научной редакцией С. С. Синельникова и М. Ю. Турунцевой. — Москва: Издательский дом «Дело» РАНХиГС, 2016. — Т. 1. — С. 423. — 760 с.
- Panel Data Econometrics: Theory (англ.) / edited by Tsionas M.. — Academic Press (an imprint of Elsevier), 2019. — P. 348. — 432 p.
- Andreß H.-J., Golsch K., Schmidt A. W. Applied Panel Data Analysis for Economic and Social Surveys (англ.). — Springer Science & Business Media, 2013. — P. 28. — 327 p.
Литература
- Baltagi, Badi H. (2008). Econometric Analysis of Panel Data (Fourth ed.). Chichester: John Wiley & Sons. ISBN 978-0-470-51886-1.
- Davies, A.; Lahiri, K. (1995). A New Framework for Testing Rationality and Measuring Aggregate Shocks Using Panel Data // Journal of Econometrics. 68 (1): 205–227. doi:10.1016/0304-4076(94)01649-K.
- Davies, A.; Lahiri, K. (2000). "Re-examining the Rational Expectations Hypothesis Using Panel Data on Multi-Period Forecasts". Analysis of Panels and Limited Dependent Variable Models. Cambridge: Cambridge University Press. pp. 226–254. ISBN 0-521-63169-6.
- Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. p. 2. ISBN 0-19-852484-6.
- Frees, E. (2004). Longitudinal and Panel Data: Analysis and Applications in the Social Sciences. New York: Cambridge University Press. ISBN 0-521-82828-7.
- Hsiao, Cheng (2003). Analysis of Panel Data (Second ed.). New York: Cambridge University Press. ISBN 0-521-52271-4.
- Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. p. 2. ISBN 0-471-21487-6.