Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика-методичка для заочников.doc
Скачиваний:
76
Добавлен:
18.11.2019
Размер:
5.91 Mб
Скачать

4.2. Лишняя переменная

Допустим, что истинная модель представляется в виде:

y = α + β1х11 (4.7)

а вы считаете, что ею является

y = α + β1х1 + β2х2 + и1 (4.8)

и рассчитываете оценку величины в1, используя неверную формулу вместо выражения Cоv(х1,у)/ Var(х1).

В целом проблемы смещения здесь нет, даже если b1, будет рассчитана неправильно. Величина Е(b1) остается равной β, но в общем оценка будет неэффективной. Она будет более неустойчивой, в смысле наличия большей дисперсии относительно β1, чем при правильном вычислении.

Это можно легко объяснить интуитивно. Истинная модель может быть записана и виде:

y = α + β1х1 + 0х2 + и (4.9)

Таким образом, если вы строите регрессионную зависимость у от х1 и х2, то b1 будет являться несмещённой оценкой величины β1, а b2 будет несмещённой оценкой нуля (при выполнении условий Гаусса–Маркова). Практически вы обнаруживаете для себя, что β2 равно нулю. Если бы вы заранее поняли, что β2 равно нулю, то могли 6ы использовать эту информацию для исключения х2 и применить парную регрессию, которая в данном случае является более эффективной

Утрата эффективности в связи со включением х2 в случае, когда она не должна была быть включена, зависит от корреляции между х1 и х2.

Дисперсия, в общем, окажется большей при множественной регрессии, и разница будет тем большей, чем ближе коэффициент корреляции к 1 или -1. Единственный исключением в связи с проблемой утраты эффективности является вариант, когда коэффициент корреляции точно равен нулю. В этом случае опенка в1, для множественной регрессии совпадает с оценкой для парной регрессии.

В выводе о несмещенности есть одно исключение, которое необходимо иметь в виду. Если величина х2 коррелируется с и, то коэффициенты регрессии будут в конечном счете смещенными. Если модель записать как уравнение (9), то это будет означать, что четвертое условие Гаусса–Маркова применительно к величине х2 не выполняется.

4.3. Замещающие переменные

Часто бывает, что вы не можете найти данных по переменной, которую хотелось бы включить уравнение регрессии. Некоторые переменные, относящиеся к социально-экономическому положению или к качеству образования, имеют такое расплывчатое определение, что их в принципе даже невозможно измерить. Другие могут поддаваться измерению, но оно требует столько времена и энергии, что на практике их приходится отбрасывать. Иногда вы можете быть расстроены тем, что пользуетесь какими-то данными, собранными другим человеком, в которых (с вашей точки зрении) опушена важная переменная.

Heзависимо от причины обычно бывает полезно вместо отсутствующей переменной использовать некоторый ее заменитель, а не пренебрегать ею совершенно. В качестве показателя общего социально-экономического положения вы можете использовать его заменитель – показатель дохода, если данные и нём имеются. В качестве показателя качества образования можно использовать отношение числа преподавателей и сотрудников к числу студентов или расходы на одного студента. Вместо переменной, опущенной в каком-либо обзоре, вы можете обратиться к другим, уже фактически собранным данным, если в них имеется подходящая замещающая переменная.

Имеются две причини для поиска такой переменной. Bo-первых, если вы просто опустите важную переменную, то регрессия может пострадать от смещения оценок, описанного в разделе 6.2, и статистическая проверка будет неполноценной. Вo-вторых, результаты оценки регрессии с включением замещающей переменной могут дать косвенную информацию о той переменной, которая замешена данной переменной.

Иногда случается, что вы используете замещающую переменную, не осознавая этого Вы полагаете, что у зависят от z, а в действительности эта величина зависит от х.

Если корреляция между величинами z и х незначительна, то результаты будут плохими, и вы поймёте, что тут что-то неладно. Но если корреляция тесная, то результаты окажутся удовлетворительными (коэффициент R2 будет близок к желаемому уровню и т.п.), и вы можете даже не подозревать, что полученное соотношение неверно.

Имеет ли это какое-то значение? Это, во-первых, зависит от того, с какой целый вы строите данную регрессию. Если целью оценивания регрессии является предсказание будущих значений величины у, то использование замещающей переменной не будет иметь большого значения при условии, конечно, что корреляция тесная и не является в то же время статистической счастливой случайностью. Однако если вы намерены использовать объясняющую переменную в качестве инструмента экономической политики для оказания влияния на поведение зависимой переменной, то последствия могут оказаться катастрофическими. Если только не будет функциональной связи между замещающей переменной и истинной объясняющей переменной, манипулированием замещающей переменной не окажет никакого влияния на зависимую переменную. Если мотивом построения регрессии является чисто научное любопытство, то исход будет столь же неудовлетворительным.

Непреднамеренное использование замещающих переменных особенно распространено при анализе временных рядов, в частности в макроэкономических моделях. Если истинная объясняющая переменная имеет временной тренд, то вы, вероятно, получите хорошую оценку формулы, если заменитe (преднамеренно или нет) ее на любую другую переменную с временным трендом. Даже если вы связываете приращения зависимой переменкой с приращениями объясняющей переменной, вы, вероятно, получите аналогичные результаты независимо от того, используется ли правильная объясняющая переменная или же замещающая переменная, поскольку макроэкономические переменные обычно изменяются взаимосвязано, в соответствии с экономический циклом.