Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика-методичка для заочников.doc
Скачиваний:
76
Добавлен:
18.11.2019
Размер:
5.91 Mб
Скачать

Ответы к тесту:

Номер задания

1

2

3

4

5

6

7

8

9

10

Номер ответа

2

3

1

1

2

2

1

1

3

1

5. Фиктивные переменные

5.1. Фиктивные и нефиктивные переменные в регрессии

В регрессионной модели в качестве объясняющих переменных (регрессоров) выступают количественные переменные, т.е. «непрерывные» области изменения (производительность труда, себестоимость продукции, национальный доход, уровень безработицы, размер зарплаты и т.д.). Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней (градаций). В частности, некоторые переменные могут принимать всего два значения или, в более общей ситуации, дискретное множество значений. Необходимость рассматривать такие переменные возникает довольно часто в тех случаях, когда требуется принимать во внимание какой-либо качественный признак. К. числу таких признаков можно отнести: пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т. п.

Качественные признаки могут существенно влиять на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или построении регрессионных моделей по неоднородным данным.

Но есть и другой подход, позволяющий оценивать влияние значений количественных переменных и уровней качественных признаков с помощью одного уравнения регрессии. Этот подход связан с введением так называемых фиктивных (манекенных) переменных или манекенов (dummy variables).

В качестве фиктивных переменных обычно используются дихотомические (бинарные, булевы) переменные, которые принимают всего два значения: «0» или «1» (например, значение такой переменной Z1 по фактору «пол»; Z1= 0 для работников-женщин и Z1= 1. В этом случае регрессионная модель, например, заработной платы примет вид:

Yi01 xi1+…+βpxip1zi1 +ε ,i=1,…,n,

zi1 =

1 , если i-й работник мужского пола;

0, если i-й работник женского пола.

(5.1)

Таким образом, принимая модель (1), мы считаем, что средняя заработная плата у мужчин на αi1= α1 выше, чем у женщин, при неизменных значениях других параметров модели. А проверяя гипотезу Н0: α1= 0, мы можем установить существенность влияния фактора «пол» на размер заработной платы работника.

Следует отметить, что в принципе качественное различие можно формализовать с помощью любой переменной, принимающей два разных значения, не обязательно «0» или «1». Однако в эконометрической практике почти всегда используются фиктивные переменные типа «0-1», так как при этом интерпретация полученных результатов выглядит наиболее просто. Так, если бы в модели (1) в качестве фиктивной выбрали переменную Z1, принимающую значения (для работников-мужчин) и (для работников-женщин), то коэффициент регрессии α1 при этой переменной равнялся бы 1/(4-1), т.е. одной трети среднего измерения заработной платы у мужчин.

Если рассматриваемый качественный признак имеет несколько (k) уровней (градаций), то возможно было бы ввести в регрессионную модель дискретную переменную, принимающую такое же количество значений. Но обычно так не поступают из-за трудности содержательной интерпретации соответствующих коэффициентов регрессии, а вводят (k-1) бинарных переменных.

В рассматриваемом примере для учета фактора образования можно было в регрессионную модель(1) ввести k-1=3-1=2 бинарные переменные Z21 и Z22:

Y i01 xi1+…+βpxip1zi121 Z21 + α22 Z22+ ε i , (5.2)

где zi21 = 1,если i-й работник имеет высшее образование;

0 во всех остальных случаях.

г де zi22 = 1, если i-й работник имеет среднее образование;

0 во всех остальных случаях.

Третьей бинарной переменной Z23 не требуется: если i-й работник имеет начальное образование, это будет отражено парой значений Zi21=0 и Zi22=0. Более того, вводить Z23 нельзя, так как при этом для любого i-го работника

Zi21+ Zi22+ Zi23 = 1, т. е. при суммировании элементов столбцов общей матрицы плана, соответствующих фиктивным переменным Zi21, Zi22, Zi23 мы получили бы столбец, состоящий из одних единиц. А так как в матрице (плана такой столбец из единиц уже есть, то это означало бы линейную зависимость значений (столбцов) общей матрицы плана X, т. е. нарушило бы предпосылку регрессионного анализа. Таким образом, мы оказались бы в условиях мультиколлинеарности в функциональной форме и как следствие – невозможности получения оценок методом наименьших квадратов.

Такая ситуация, когда сумма значений нескольких переменных, включенных в регрессию, равна постоянному числу (единице), получила название «dummy trap» или «ловушки». Чтобы избежать такие ловушки, число вводимых бинарных переменных должно быть на единицу меньше числа уровней (градаций) качественного признака.

Следует отметить не совсем удачный перевод на русский язык термина «dummy variables» как «фиктивная» переменная. Во-первых, в модели регрессионного анализа мы уже имеем фиктивную переменную X при коэффициенте β0, всегда равную единице. Во-вторых, и это главное – все процедуры регрессионного анализа (оценка параметров регрессионной модели, проверка значимости ее коэффициентов и т. п.) проводятся при включении фиктивных переменных так же, как и «обычных», количественных объясняющих переменных. «Фиктивность» же переменных Zi, состоит только в том, что они количественным образом описывают качественный признак.

В регрессионных моделях с временными рядами используется три основных вида фиктивных переменных:

1) Переменные-индикаторы принадлежности наблюдения к определенному периоду – для моделирования скачкообразных структурных сдвигов. Границы периода (моменты “скачков”) должны быть установлены из априорных соображений. Например, 1, если наблюдение принадлежит периоду 1941-45 гг. и 0 в противном случае. Это пример использования для моделирования временного структурного сдвига. Постоянный структурный сдвиг моделируется переменной равной 0 до определенного момента времени и 1 для всех наблюдений после этого момента времени.

2) Сезонные переменные – для моделирования сезонности. Сезонные переменные принимают разные значения в зависимости от того, какому месяцу или кварталу года или какому дню недели соответствует наблюдение.

3) Линейный временной тренд – для моделирования постепенных плавных структурных сдвигов. Эта фиктивная переменная показывает, какой промежуток времени прошел от некоторого “нулевого” момента времени до того момента, к которому относится данное наблюдение (координаты данного наблюдения на временной шкале). Если промежутки времени между последовательными наблюдениями одинаковы, то временной тренд можно составить из номеров наблюдений.

Временной тренд отличается от бинарных фиктивных переменных тем, что имеет смысл использовать его степени: t2 , t3 и т. д. Они помогают моделировать гладкий, но нелинейный тренд. (Бинарную переменную нет смысла возводить в степень, потому что в результате получится та же самая переменная.)

Можно также комбинировать указанные виды фиктивных переменных, создавая переменные “взаимодействия” соответствующих эффектов.

Комбинация рассмотренных фиктивных переменных позволяет моделировать еще один эффект – изменение наклона тренда с определенного момента. Помимо тренда в регрессию следует тогда ввести следующую переменную: в начале выборки до некоторого момента времени она равна 0, а вторая ее часть представляет собой временной тренд (1, 2, 3 и т. д. в случае одинаковых интервалов между наблюдениями).

Использование фиктивных переменных имеет следующие преимущества:

  1. Интервалы между наблюдениями не обязательно должны быть одинаковыми. В выборке могут быть пропущенные наблюдения.

  2. Коэффициенты при фиктивных переменных легко интерпретировать, они наглядно представляют структуру динамического процесса.

Для оценивания модели не приходится выходить за рамки классического метода наименьших квадратов.

Рассматриваемые выше регрессионные модели (1) и (2) отражали влияние качественного признака (фиктивных переменных) только на значения переменной Y, т. е. на свободный член уравнения регрессии. В более сложных моделях может быть отражена также зависимость фиктивных переменных на сами параметры при переменных регрессионной модели. Например, при наличии в модели объясняющих переменных – количественной Х1 и фиктивных Z11, Z12, Z21 , Zi22 , из которых Z11, Z12 влияют только на значение коэффициента при Х1, a Z21 , Zi22 – только на величину свободного члена уравнения, такая регрессионная модель примет вид:

(5.3)

Модели типа (3) используются, например, при исследовании зависимости объема потребления Y некоторого продукта от дохода потребителя X, когда одни качественные признаки (например, фактор сезонности) влияют лишь на количество потребляемого продукта (свободный член уравнения регрессии), а другие (например, уровень доходности домашнего хозяйства) – на параметр β1 при X, интерпретируемый как «склонность к потреблению».