книги / Эконометрика. Начальный курс
.pdfУпражнения |
101 |
|
Таблица 3.5 |
Переменная |
Описание |
T O T S P |
Общая площадь, кв.м |
P R IC E |
Цена квартиры, тыс. долл. |
R O O M S |
Количество жилых комнат |
L IV S P |
Жилая площадь, кв.м |
K I T S P |
Площадь кухни, кв.м |
D IS T |
Расстояние до центра, км |
M E T R D IS T |
Расстояние до ближайшей станции метро, мин |
W A L K |
1, если пешком от метро, 0 — иначе |
B R IC K |
1, если дом кирпичный, 0 — иначе |
T E L |
1, если есть телефон, 0 — иначе |
B A L |
1, если есть балкон или лоджия, 0 — иначе |
F LO O R |
0, если квртира находится на первом или последнем |
|
этаже, 1 — иначе |
а) Постройте модель стоимости квартиры (или стоимости квадрат ного метра жилой площади квартиры) в зависимости от имею щихся параметров.
б) Проверьте гипотезу, что модели для 1, 2, 3-4-комнатиых квартир различаются между собой, т. е. гипотезу, что рынок распадается на рынки однокомнатных, двухкомнатных и трех-четырехкомнат- ных квартир.
3.32. (автор — Arthur van Soest, Tilburg University)
Введение. Рассматриваемые здесь упражнения в значительной мере опираются на статью (Mankiw et al., 1992) и направлены на проверку по лученных там результатов (в первую очередь, с точки зрения здравого экономического смысла). В цитированной статье изучается расширен ный вариант модели экономического роста Солоу. Основным объектом, изучаемым в модели Солоу, является удельная величина валового вну треннего продукта (ВВП) в стационарном состоянии. Таким образом, модель объясняет различие в уровне благосостояния разных стран в долговременном плане. Обобщение модели Солоу в работе (Mankiw et al., 1992) состоит в том, что в отличие от первоначальной модели здесь допускаются инвестиции не только в физический, но и в человеческий капитал. Приведенный там эмпирический* анализ основан на межстрановых данных, взятых из работы (Summers, Heston, 1988). Мы также будем использовать эти данные.
102 |
Гл. 3 Модель множественной регрессии |
Обобщенная модель Солоу. Дадим краткое описание обобщенной моде ли Солоу, предложенной в работе (Mankiw et al., 1992). Исходная модель Солоу изложена во многих учебниках по макроэкономике (см., напри мер, (Romer, 2001)). Предполагается, что в каждый момент времени t производство задается производственной функцией Кобба-Дугласа с постоянной отдачей на масштаб:
Yt = K ?H ?(A tL t)l-> -0 .
где У —выпуск, К и Н — объем физического и человеческого капитала, соответственно, L —труд, а переменная А описывает уровень техноло гии. Предположение о постоянстве отдачи на масштаб позволяет опе рировать с удельными величинами (на единицу эффективного труда):
У = |
— |
h - J L |
|
A V |
h ~ A L ' |
Будем также считать, что выполнены следующие условия:
-фиксированные доли з*, з/, суммарного выпуска Y инвестируются
вфизический и человеческий капитал, соответственно;
L t = L0ent, где п —скорость роста населения;
- A t = A0eqi, где g —скорость роста технологического уровня;
-интенсивность амортизации б одинаковадля физического и чело веческого капитала.
Из этих предположений вытекает, что эволюция капитала описыва ется следующей системой дифференциальных уравнений:
kt = skyi ~ ( п + у + S)kt,
hi = si,yt — (n + g + 5)ht-
Стационарное состояние характеризуется условиями kt = h.t = 0.
3.32.1. Покажите, что в стационарном состоянии выполнено равенство
1nyt = -----— ^(alnsA. + 0 \n s h - (a + /?)ln(n + g + £)). |
(3.51) |
Равенство (3.51) устанавливает соотношение (в стационарном состоя нии) между благосостоянием страны, скоростью роста ее населения и интенсивностью инвестиций в физический и человеческий капитал.
Упражнения |
103 |
Следствием этого соотношения является то, что и в долговременном плане можно ожидать сохранение различия в уровне благосостояния разных стран.
Модель также позволяет описать траекторию сходимости к стацио нарному состоянию. Пусть у* — значение yt в стационарном состоянии. Тогда можно показать, что имеет место следующее приближенное со отношение:
^ = A ( l n y * - l n y t),
где А = (п + д + 5)(1 —а —0). Решая это уравнение, получаем
In yt - (1 - е~м Inу* + e~Xt In у0). |
(3.52) |
3.32.2. Покажите, что из (3.51) и (3.52) вытекает следующее уравнение для траектории сходимости:
In ^ = (1 - е"А‘) Уо
х { i - ' а - / ? (а1пз* + 0 |пя* ~ (в + /?)Ь(п + У + Д ))-1п У»| • (3.53)
Данные. Используются данные, извлеченные из архива журнала Jour nal of Applied Econometrics. Они соответствуют работе (Durlauf, Johnson 1995). Начало этим исследованиям положила работа (Summers, Heston 1988). Единицей наблюдения является страна, даны результаты наблю дений 121 страны. Используются переменные, перечисленные в табли це 3.6.
Все данные, за исключением Ы Т , взяты из работы (Mankiw et al., 1992); переменная L I T взята из доклада Всемирного банка. Данные содержатся в файле growth.xls. Список стран приведен в приложении к работе (Mankiw et al., 1992).
3.32.3. а) Вычислите суммарные статистики всех переменных. Проверь те, имеют ли смысл ваши результаты.
б) Вычислите корреляционную матрицу Dcex переменных. Дайте ин терпретацию наиболее важных результатов. Соответствуют ли они тому, что вы ожидали?
104 |
Гл. 3. Модель множественной регрессии |
|
Таблица 3.6 |
Переменная |
Описание |
N U M |
номер страны в базе данных Summers, Heston (1988) |
N O IL |
1 для страны, не добывающей нефть, 0 — для добыва |
|
ющей |
I N T E R |
1для страны с хорошим качеством данных, 0 — в про |
|
тивном случае |
O E C D |
1 для страны, входящей в Организацию экономическо |
|
го сотрудничества и развития, 0 — в противном случае |
GDP60 |
ВВП на душу населения в 1960 г. (долл.) |
GDP8S |
ВВП на душу населения в 1985 г. (долл.) |
GD PGRO |
средний рост ВВП надушу населения с 1960 по 1985 г. |
|
(%) |
PO PG RO |
средний рост работоспособного населения с 1960 по |
|
1985 г. (%) |
IO N Y |
средняя доля инвестиций (включая государственные) |
|
в общем объеме ВВП с 1960 по 1985 г. (%) |
SC H |
средняя доля населения, продолжающего получать об |
|
разование одновременно с работой с 1960 по 1985 г. (%) |
L IT |
доля людей среди населения старше 15 лет, умеющих |
|
читать и писать в 1960 г. |
Анализ стационарного состояния. Если предположить, что в 1985 г. страны достигли стационарного состояния, то мы можем использовать достигнутый в 1985 г. уровень ВВП для оценивания уравнения (3.51). Поскольку мы используем данные, относящиеся к одному и тому же году, то индекс t можно опустить. Уравнение (3.51) переписывается в следующем виде:
In GDP85 = |
л0 + я-1 In а* + щ In зн + лз 1п(п + д + <5), |
(3.54) |
где no = In До + |
gt — постоянный член. При оценивании |
уравне |
ния (3.54) представляется разумным в качестве sk использовать пере менную IO N Y , а в качестве з/, переменную SC H . Мы не наблюдаем величины д и S, поэтому будем считать, как в работе (Mankiw et al., 1992), что д = 2% и 6 = 3%. В качестве п берется переменная PO PGRO .
3.32.4 а) Оцените уравнение (3.54), используя данные по всем странам, за исключением тех, для которых пропущены наблюдения какойлибо переменной.
Упражнения |
105 |
б) Исходная модель Солоу не включает человеческий капитал. Оце ните уравнение (3.54), удалив переменную In S C H . Сравните с ре зультатом, полученным в п. а). В чем состоит основное различие? Объясните это различие, используя также результаты упражне ния 3.32.3.
3.32.5. а) Структурная форма (3.51) накладывает некоторое линейное ограничение на параметры щ , я-j, яз приведенной формы. Что это за ограничение?
б) Протестируйте (на 5%-ном уровне значимости) выполнимость этого ограничения.
в) Оцените вновь уравнение (3.54), используя это ограничение. Сравните ваш результат с результатом, полученным в упражне нии 3.32.4 а).
г) Выразите структурные параметры а и 0 через тг\, яг и постройте, таким образом, их оценки.
3.32.6. а) Добавьте в регрессионное уравнение упражнения 3.32.4 а) фиктивные переменные N O IL и O E C D и проверьте их значи мость.
б) Проверьте, является линейная спецификация (3.54) разумной, добавляя квадраты независимых переменных и перекрестные члены.
3.32.7. Согласно «золотому правилу накопления капитала», доли инве стиций я*,, sh должны выбираться таким образом, чтобы в стационар ном состоянии величина с = (1 —s* —s/,)y была максимальна.
а) Найдите теоретические оптимальные значения величин я*, я/,.
б) Используя оценки, полученные в упражнении 3.32.5, проверьте, удовлетворяют ли в среднем инвестиции в физический капитал «золотому правилу».
Рост ВВП. Уравнение (3.53) служит основой эмпирического анализа роста ВВП в период с 1960 (t = 0) по 1985 г. (t = 25). Заметим, что уравнение (3.53) можно переписать следующим образом:
,GDP85
ПG D P 60 = wo+ wi 1пя*+я2 Insn+ я3 In(п+ 0 + 5)+ я 4 InGDP60. (3.55)
При оценивании этого уравнения будем использовать тс же предполо жения, что и в предыдущих разделах. Так, например, д — 2%, 5 = 3% и т. д.
106 |
Гл. 3- Модель множественной регрессии |
3.32.8. а) Оцените уравнение (3.55), интерпретируйте результат.
б) Исходпая модель Ссшоу не включает человеческий капитал. Оце ните уравнение (3.55), удалив переменную InSCH. Сравните ре зультат с тем, что получен в п. а). Объясните разницу.
3.32.9. а) Структурная форма (3.53) накладывает некоторое линейное ограничение на параметры wi, 7г2, *з приведенной формы. Что это за ограничение?
б) Протестируйте (на 5%-ном уровне значимости) выполнимость этого ограничения.
в) Оцените вновь уравнение (3.55), используя это ограничение. Сравните ваш результат с результатом, полученным в упражне нии 3.32.8 а).
г) Используя результат п. в), постройте оценки структурных пара метров А, а, р. Проинтерпретируйте результаты. Сравните ваши оценки параметров а, р, с оценками, полученными в предыдущих упражнениях.
3.32.10. а) Добавьте фиктивные переменные NOIL и OECD в уравне ние упражнения 3.32.8 а) и проверьте их значимость.
б) Проверьте, является линейная спецификация (3.55) разумной, добавляя квадраты независимых переменных и перекрестные члены.
3.32.11. а) Оцените уравнение (3.55) отдельно для стран — членов OECD и для стран — нечленов OECD и проинтерпретируйте ре зультаты.
б) Проверьте, совпадают ли коэффициенты уравнения (3.55) (за ис ключением свободного члена) для стран — членов OECD и для стран —нечленов OECD.
3.32.12. Выберите наилучшее, с вашей точки зрения, уравнение и по стройте 95%-ный доверительный интервал для скорости сходимости А. Проинтерпретируйте результат.
3.33. Рассматривается информация о стоимости коттеджей в Москов ской области по Киевскому направлению (поданным строительной ком пании «Стройсервис», осень 1997 г.).
Данные находятся в файле v illa .x ls. Переменные описаны в та блице 3.7.
Упражнения |
107 |
|
Таблица 3.7 |
Переменная |
Описание |
N |
Номер по порядку |
Price |
Цена в тыс. долл. |
Dist |
Расстояние от кольцевой автодороги в км |
House |
Площадь дома в кв.м |
Area |
Площадь участка в сотках |
Подберите функциональную форму зависимости цены коттеджа от его параметров, учитывая такие факторы, как t-статистики и коэффи циент детерминации R2.
Глава 4
Различные аспекты множественной регрессии
В предыдущих главах были изучены основные теоретико-стати стические вопросы регрессионных моделей. В данной главе рас сматриваются некоторые проблемы, часто возникающие при их практическом использовании.
На практике исследователю нередко приходится сталкиваться с ситуацией, когда полученная им регрессия является «плохой», т. е. t-статистики большинства оценок малы, что свидетельствует о незначимости соответствующих независимых переменных (ре грессоров). В то же время F -статистика (3.36) может быть до статочно большой, что говорит о значимости регрессии в целом. Одна из возможных причин такого явления носит название муль тиколлинеарности и возникает при наличии высокой корреляции между регрессорами. Проблеме мультиколлинеарности посвяще но начало этой главы.
Регрессионные модели являются достаточно гибким инстру ментом, позволяющим, в частности, оценивать влияние качествен ных признаков (пол, профессия, наличие детей и т. п.) на изучае мую переменную. Это достигается введением в число регрессоров так называемых фиктивных переменных, принимающих, как пра вило, значения 1 или 0 в зависимости от наличия или отсутствия
108
4.1. Мультиколлинеарность |
109 |
соответствующего признака в очередном наблюдении. С формаль ной точки зрения фиктивные переменные ничем не отличаются от других регрессоров. Однако следует обратить особое внимание на правильное их использование и интерпретацию оценок.
В этой главе мы также рассмотрим задачу нахождения част ной корреляции между переменными и так называемую проблему спецификации модели.
4.1.Мультиколлинеарность
Одним из условий классической регрессионной модели являет ся предположение о линейной независимости объясняющих пере менных, что означает линейную независимость столбцов матрицы регрессоров X или (эквивалентно) что матрица (Х 'Х )-1 имеет полный ранг к. При нарушении этого условия, т. е. когда один из столбцов матрицы X есть линейная комбинация остальных столбцов, говорят, что имеет место полная коллинеарность. В этой ситуации нельзя построить МНК-оценку параметра /3, что фор мально следует из сингулярности матрицы Х 'Х и невозможности решить нормальные уравнения. Нетрудно также понять и содер жательный смысл этого явления. Рассмотрим следующий простой пример регрессии (Greene, 1997): С = 0i + (hS + 0$N + /?4Т + e, где С — потребление, S — зарплата, N — доход, получаемый вне работы, Т — полный доход. Поскольку выполнено равенство Т = S + N , то для произвольного числа h исходную регрессию можно переписать в следующем виде: С = /?i+je^S+p^N+P^T+e, где ft2 = -0 2 + h ,p $, = fe + h ,fli = l34 — h. Таким образом, одни и те же наблюдения могут быть объяснены различными наборами ко эффициентов (3. Эта ситуация тесно связана с проблемой иденти фицируемости системы, о чем более подробно будет говориться позднее. Кроме того, если с учетом равенства Т — S + N перепи сать исходную систему в виде С = fa + {fa + 04)S +О Зз+Д О ^+е, то становится ясно, что оценить можно лишь три параметра (3\, ifh + 04.) И (/Зз+ Д0, а не четыре исходных. В общем случае можно показать, что если rank(X 'X ) = I < к, то оценить можно только I
110 Гл. 4. Различные аспекты множественной регрессии
линейных комбинаций исходных коэффициентов. Если есть пол ная коллинеарность, то можно выделить в матрице X максималь ную линейно независимую систему столбцов и, удалив остальные столбцы, провести новую регрессию.
На практике полная коллинеарность встречается исключи тельно редко. Гораздо чаще приходится сталкиваться с ситуа цией, когда матрица X имеет полный ранг, но между регрес сорами имеется высокая степень корреляции, т. е. когда матри ца Х ' Х , говоря нестрого, близка к вырожденной. Тогда гово рят о наличии мультиколлинеарности. В этом случае МНК-оценка формально существует, но обладает «плохими» свойствами. Это нетрудно объяснить, используя геометрическую интерпретацию метода наименьших квадратов. Как уже отмечалось, регрессию можно рассматривать как проекцию в пространстве BJ1 вектора у на подпространство, порожденное столбцами матрицы X . Если между этими векторами существует приблизительная линейная зависимость, то операция проектирования становится неустойчи вой: небольшое изменение в исходных данных может привести к существенному изменению оценок. Рисунок 4.1 наглядно это де монстрирует. Векторы у и у 1 мало отличаются друг от друга, но в
силу того, что угол между векторами (регрессорами) ®i и х% мал, разложения проекций этих векторов по ®i и хч отличаются зна чительно. У проекции вектора у оба коэффициента разложения по *i и ®2 (напомним, что это и есть МНК-оценки) положитель ны и относительно невелики. У проекции вектора у ' коэффициент