Фиктивная переменная
Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков, принимающих два значения, но и несколько возможных. В этом случае добавляются несколько фиктивных переменных. Фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой подвыборке. Последнее можно использовать для обнаружения структурных изменений.
Моделирование бинарной переменной
Пусть необходимо определить влияние некоторой качественной переменной z, принимающей два возможных значения. Обозначим эти возможные значения A и B для определенности. Тогда такой переменной можно поставить в соответствие следующую фиктивную переменную
Пусть исходная модель имеет вид
Если добавить переменную d в модель, то получим
Тогда при значимом коэффициенте при d получаем две модели для разных значений качественного признака, различающиеся на фиксированный сдвиг (разная константа):
Однако, качественный признак может влиять и на параметры зависимости от факторов x. В этом случае необходимо строить модель:
Таким образом, здесь в модели участвует не только переменная d, но и переменная dx. Это позволяет строить потенциально две разные модели для разных значений качественного признака:
Моделирование многозначного качественного признака
Пусть имеется признак, который принимает несколько возможных значений. Общее правило введения фиктивных переменных следующее: общее количество фиктивных переменных должно быть на единицу меньше количества возможных значений качественного признака, если в модели имеется константа. Это необходимо, чтобы не возникла проблема полной коллинеарности переменных.
Например, уровень образования: нет образования, среднее образование, высшее образование, ученая степень и т. д. В этом случае каждому уровню образования, кроме уровня «нет образования» можно поставить в соответствие некоторую фиктивную переменную.
Фиктивные переменные взаимодействия
Пусть в модели (например, средней заработной платы) участвуют две фиктивные переменные, отвечающие, например, за пол и наличие высшего образования. При обычном включении этих переменных в модель каждая из них дает определенный вклад в изменение коэффициентов модели. Однако, сумма эффектов пола и образования вообще говоря может быть не равна суммарному эффекту этих двух факторов, действующих одновременно. То есть наличие высшего образования у мужчин и у женщин вообще говоря по-разному может отражаться на доходе. Поэтому наряду с фиктивными переменными пола и образования можно использовать фиктивную переменную взаимодействия:
Таким образом, данная переменная равна 1, например, для мужчин с высшим образованием и равна нулю для всех остальных случаев (мужчин без высшего образования и женщин независимо от уровня образования).
См. также
Литература
- Gujarati, D. N. (2003). Basic econometrics. McGraw Hill. p. 1002.
- Draper, N. R., Smith, H. (1998) Applied Regression Analysis, Wiley (Chapter 14)
- Wooldridge, J. M. (2009). Introductory econometrics: a modern approach. Cengage Learning. p. 865.
- Suits, D. B. (1957). "Use of Dummy Variables in Regression Equations". Journal of the American Statistical Association. 52 (280): 548–551.
- Barreto, H., Howland, F. (2005). "Chapter 22: Dummy Dependent Variable Models". Introductory Econometrics: Using Monte Carlo Simulation with Microsoft Excel. Cambridge University Press.
- Maddala, G. S. (1992). Introduction to econometrics. Macmillan Pub. Co. p. 631.