книги / Эконометрика. Начальный курс
.pdfУпражнения |
|
|
|
|
|
141 |
|
|
|
|
|
|
|
Таблица 4.6 |
|
Годы |
У |
Xi |
х2 |
Годы |
У |
XI |
х2 |
1964 |
28.4 |
635.7 |
92.9 |
1972 |
75.9 |
1171.1 |
125.3 |
1965 |
32.0 |
688.1 |
94.5 |
1973 |
94.4 |
1306.6 |
133.1 |
1966 |
37.7 |
753.0 |
97.2 |
1974 |
131.9 |
1412.9 |
147.7 |
1967 |
40.6 |
796.3 |
100.0 |
1975 |
126.9 |
1528.8 |
161.2 |
1968 |
47.7 |
868.5 |
104.2 |
1976 |
155.4 |
1702.2 |
170.5 |
1969 |
52.9 |
935.5 |
109.8 |
1977 |
185.8 |
1899.5 |
181.5 |
1970 |
58.5 |
982.4 |
116.3 |
1978 |
217.5 |
2127.6 |
195.4 |
1971 |
64.0 |
1063.4 |
121.3 |
1979 |
260.9 |
2368.5 |
217.4 |
Источник: D.Salvatore. Statistics and Econometrics, McGraw-Hill, 1982.
а) Вычислите выборочный коэффициент корреляции между х\ и xj.
б) Оцените регрессию у на константу и xj.
в) Оцените регрессию у на константу и х^.
г) Оцените регрессию у на константу, xi и х^.
Как можно проинтерпретировать полученные результаты? Можно ли ограничиться только одной из регрессий б) или в)?
4.17. В таблице 4.7 представлены выпуск Q, трудозатраты L и капита ловложения К 15 фирм некоторой отрасли.
|
|
|
|
|
|
Таблица 4.7 |
|
Фирма |
Q |
L |
К |
Фирма |
Q |
L |
К |
1 |
2350 |
2334 |
1570 |
9 |
2550 |
2446 |
1880 |
2 |
2470 |
2425 |
1850 |
10 |
2450 |
2403 |
1790 |
3 |
2110 |
2230 |
1150 |
11 |
2290 |
2301 |
1480 |
4 |
2560 |
2463 |
1940 |
12 |
2160 |
2253 |
1240 |
5 |
2650 |
2565 |
2450 |
13 |
2400 |
2367 |
1660 |
6 |
2240 |
2278 |
1340 |
14 |
2490 |
2430 |
1850 |
7 |
2430 |
2380 |
1700 |
15 |
2590 |
2470 |
2000 |
8 |
2530 |
2437 |
1860 |
|
|
|
|
а) Оцените по этим данным производственную функцию КоббаДугласа Q = a l / 1К&*, вычислите коэффициент детерминации, скорректированный коэффициент детерминации и выборочный коэффициент корреляции между InL и 1пА\
б) Проведите регрессию InQ только на ln/f.
Как можно проинтерпретировать полученные результаты?
142 |
Гл. 4. Различные аспекты множественной регрессии |
4.18.Можно ли преодолеть проблему мультиколлинеарности, возника ющую в упражнении 4.17, если известно, что производственная функ ция обладает постоянной отдачей на масштаб (0i + 0г =» 1)?
4.19.Пусть у = Х/3 + е —стандартная модель множественной регрес сии и /3 —МНК-оценка вектора коэффициентов /3.
а) Покажите, каким образом можно использовать /3 для получения более эффективной оценки параметров /3, если известно, что /3 удовлетворяет линейному ограничению R 0 = г.
б) Для модели yt = а + 0хц + 71 «2 + et по п = 100 наблюдениям получены следующие данные (матрица сумм произведений соот ветствующих переменных):
У ~ У |
X i - X i |
Х 2 — Х 2 |
у - у
Xi - |
Х| |
н |
HI |
to 1 |
to |
2000 |
100 |
90 |
100 |
10 |
5 |
90 |
5 |
5 |
Проверьте гипотезу Но: 5/3 = 7 против альтернативы Hj: 50 ф 7
4.20. С помощью обычного метода наименьших квадратов получены две спецификации модели- у = а + 0х + е и у —а* + 0*х + у*z + и,
где е, и —остатки соответствующих регрессий. Объясните, при каких обстоятельствах выполнены следующие условия:
а) Д = ДФ;
б) |
< Е е?; |
в) оценка 0 статистически значима на 5%-ном уровне, а оценка 0* незначима;
г) оценка 0* статистически зна'мма на 5%-ном уровне, а оценка 0 незначима.
4.21. Дана стандартная модель множественной регрессии у = Х 0 + е.
а) Выразите матрицу ковариаций МНК-оцепки вектора /3 в терми нах собственныхзначений и собственных векторов матрицы Х 'Х .
б) Объясните, как соотносится результат а) с проблемой мультикол линеарности.
Упражнения |
143 |
4.22. Дана модель множественной регрессии у = Х |
+ Х ф ч + е>гАе |
/31( /32 — векторы размерности /гь к%, соответственно. Предположим, что у вектора 0 г есть несмещенная оценка /3lt некоррелированная с е, с известной ковариационной матрицей Vi.
а) Вычислите ковариационную матрицу оценки вектора /32, получа емой регрессией у - Х ф х на Х 2.
б) Сравните ковариационную матрицу, полученную в а), с ковариа ционной матрицей МНК-оценки вектора /32 в исходной модели.
в) Можете ли вы предложить более эффективную оценку вектора /32, чем те, что получены в а) и б)?
г) Как полученные результаты связаны с проблемой мультиколли неарности?
4.23. Для проверки гипотезы о том, что удельный выпуск Q/L в ме таллургической промышленности зависит от уровня зарплаты W , на основе межстрановых наблюдений была получена регрессия
In % = 0.374 + 0.805W + е, R2 = 0.929 |
|
L |
(0.049) |
(в скобках указана стандартная ошибка).
а) Проверьте гипотезу.
б) Было высказано предположение, что приведенное выше уравне ние содержит ошибки спецификации, поскольку оно не учитывает разницу в эффективности между странами, которая оказывает влияние на удельный выпуск и положительно коррелирована с зарплатой. Как это предположение повлияет на ваш вывод?
4.24. Модель
Vt — 01 + 02^12 + 0 зФз + 04^4 + 0ьXt + £t
оценивается с помощью обычного метода наименьших квадратов на основе ежеквартальных наблюдений, где dti, i = 2, 3, 4 — фиктивные переменные для соответствующих кварталов, т. е.
dt2 = |
1,если t — второй квартал, |
= 0 |
в остальных случаях, |
|
dtз — |
1,если t — третий квартал, |
= |
0 |
в остальных случаях, |
dt4 = |
1,если t — четвертый квартал, |
= |
0 |
в остальных случаях. |
144 |
Гл. 4. Различные аспекты множественной регрессии |
а) Почему в модель не включена переменная dt1?
б) Покажите, что оценка Рь совпадает с МНК-оценкой коэффициен та /?в регрессии yl = а+Рх^ +щ, где у£ —остатки регрессии yt на dt2,dt3,dt4 и константу, a —остатки регрессии xt на dt2,dt3,du
иконстанту.
4.25.О программе исследований к разных удобрений, предназначен ных для повышения урожайности лимонных бананов, использованы в
опытах на п = nj + • • ■+ п* опытных участках. Удобрение номер а (а = 1,. .,к) использовалось на п, опытных участках. Для изучения влияния удобрений использовалась регрессионная модель
Vt — 0id\t + ■• ■+ Pkdkti t = l , . . . , n .
Здесь у —урожайность, d, — фиктивная переменная, равная 1 для участка номер а и 0 в других случаях. Известны выборочные средние у, и стандартные отклонения а* для а = 1,.... А:.
У> = 7Г Y l yt' = 2 h h -У,)-
Выразить через известные величины F-статистику для тестирования нулевой гипотезы о равном влиянии всех удобрений (Pi = • = Рк)-
4.26. Вы в скором времени планируете поступить на должность по литического аналитика на некую телевизионную станцию. Все телеви зионные компании уделяют большое впимание освещению выборов в Конгресс (США), а ваших знаний по этому вопросу недостаточно, что бы получить эту работу. Поэтому вы решили рассмотреть несколько регрессионных моделей, чтобы подкрепить свое мнение относительно выборов в Конгресс 1996 года.
Вам понадобится три модели. Каждая из них пытается объяснить различия в проценте голосов, отданных Республиканской партии, среди всех 50 штатов. Т. е. все модели включают 50 наблюдений, каждое со ответствует одному штату. У вас также есть четыре типа объясняющих переменных:
1)уровень безработицы для каждого штата;
2)региональные фиктивные переменные, показывающие, что штат находится на северо-востоке, юге, среднем западе или на западе;
Упражнения |
145 |
3)фиктивная переменная, показывающая, что Альберт Гор (вицепрезидент, демократ) появлялся в этом штате, агитируя за кан дидатов в Конгресс;
4)перекрестные произведения региональных фиктивных перемен ных и фиктивной переменной Гора.
Три ваших модели отличаются только набором объясняющих пере менных:
Модель I содержит переменные 1) и 2). Модель II содержит перемеиные 1), 2) и 3). Модель III содержит переменные 1) и 4).
а) Запишите уравнение регрессии для каждой из моделей. Это мож но сделать разными способами, используйте формулировку, кото рая вам больше нравится.
б) Укажите, как бы вы тестировали с помощью этих моделей сле дующие гипотезы (если вы хотите предложить F-тест, укажите регрессию с ограничениями и без ограничений):
1)появление Гора не оказывает влияния па процент голосов, отданных республиканцам;
2)вся страна голосует одинаково, без различий по региональ ному признаку;
3)северо-восток и средний запад («пояс холода») голосуют одинаково;
4)«пояс холода» голосует одинаково, «солнечный пояс» (юг и запад) голосует одинаково, но между этими поясами может
быть разница;
5)появление Гора приводит к одному и тому же эффекту для всех регионов.
4.27.На основе квартальных данных с 1971 по 1976 г. с помощью метода наименьших квадратов получено следующее уравнение:
= 1.12 - 0.0098iti - |
5.62Xt2 + 0.044xt3 |
|||
(2 |
14) |
(0 0034) |
(3 42) |
(0 |
в скобках указаны стандартные ошибки, RSS = 101.32, ESS = 21.43. а) Проверьте значимость каждого из коэффициентов.
б) Найдите коэффициент детерминации.
146 |
Гл. 4 Различные аспекты множественной регрессии |
в) Протестируйте значимость регрессии в целом.
г) Когда в уравнение были добавлены три фиктивные переменные, соответствующие трем первым кварталам года, величина RSS вы росла до 118.20. Проверьте гипотезу о наличии сезонности, сфор мулирован необходимые предположении о виде этой сезонности.
д) Для той же исходной модели были раздельно проведены две ре грессии на основеданных: 1-й квартал 1971 г.-1-й квартал 1975 г. и 2-й квартал 1975 г-4-й квартал 1976 г., соответственно, и получе ны следующие значения сумм квадратов остатков: ESS1 = 11.25, ESS2 = 2.32. Проверьте гипотезу о том, что между первым и вто рым кварталами 1975 г. произошло структурное изменение.
4.28. Ниже приведены результаты регрессии W —зарплаты менеджера фирмы, на объем ее продаж S и доход Р (число наблюдений п = 102, в скобках даны стандартные ошибки):
W = 0.50S + 0.4 Р, е'е * 250,
(0 83) (0 83)
(для удобства все переменные представлены в отклонениях от средних). Ввиду большой зависимости между объемами продаж и доходом возни кает проблема мультиколлинеарности, что не позволяет точно оценить соответствующие параметры. Для решения этой проблемы было пред ложено действовать следующим образом.
1)Провести регрессию Р на S и получить остатки г.
2)Провести регрессию W на S и г.
Обозначим результат последней регрессии W = cjS + с^г.
а) Вычислите с\, сг-
б) Дайте оценку предложенному методу как способу борьбы с мультиколлинеарностыо.
в) Дайте оценку предложенному методу как способу получения бо лее точных оценок исходных параметров.
4.29. Файл usa_import.xls содержит данные об объеме импорта Imp (млрд, долл.), валовом национальном продукте GDP (млрд, долл.) и индексе потребительских цен CPI в США за период с 1964 по 1979 г.
а) Вычислите выборочный коэффициент корреляции между GDP и CPI.
Упражнения |
147 |
|
б) |
Оцените регрессию Imp на константу и GDP. |
|
в) |
Оцените регрессию Imp на константу и CPI. |
|
г) |
Оцените регрессию Imp на константу, GDP и CPI. |
|
Как можно интерпретировать полученные результаты? Можно ли огра ничиться только одной из регрессий б) или в)?
4.30. Построение модели цены колготок в московских оптовых торго вых фирмах, осень 1997г. Данные содержатся в файле tig h ts .xls (все го 74 наблюдения). Описание переменных содержится в таблице 4.8.
Переменная |
Таблица 4.8 |
Описание |
|
N |
номер но порядку |
Price |
цена колготок в рублях 1997 г. |
DEN |
плотность в DEN |
polyamid |
содержание полиамида |
lykra |
содержание лайкры |
cotton |
% хлопка |
wool |
% шерсти |
firm |
фирма-производитель: 0 — Levante, 1 — Golden Lady |
а) Постройте уравнения зависимости цены колготок от их плотно сти, состава и производителя. Подберите наиболее подходящую форму модели. Какие проблемы с данными вы при этом встрети ли?
б) О помощью построенной модели ответьте на вопрос: верно ли, что цены колготок двух фирм-производителей различаются статисти чески достоверно? Какая из фирм устанавливает более высокие цены?
Глава 5
Некоторые обобщения множественной регрессии
В этой главе классическая регрессионная схема обобщается в двух направлениях. Первое связано с отказом от предположения, что независимые переменные являются неслучайными величина ми. Оказывается, что при выполнении некоторых естественных условий МНК-оценка вектора неизвестных параметров сохраня ет основные свойства МНК-оценки в стандартной модели. Глав ным условием, гарантирующим наличие этих свойств, является некоррелированность (независимость) матрицы регрессоров X и вектора ошибок е.
Второе направление — это изучение линейной модели, в кото рой ковариационная матрица ft вектора ошибок е не обязатель но является скалярной (т. е. имеет вид <т2/ п), а может быть про извольной симметричной положительно определенной матрицей. С помощью линейного преобразования исходную систему можно свести к обычному регрессионному уравнению и построить для него МНК-оцснку вектора коэффициентов. Эта оценка зависит от матрицы ковариаций ошибки е, а способ оценивания носит на звание обобщенный метод наименьших квадратов (ОМНК). (Со ответствующий термин на английском языке — Generalized Least Squares, GLS.) Для ОМНК-оценки устанавливается аналог теоре-
148
5.1. Стохастические регрессоры |
149 |
мы Гаусса-Маркова, а именно, доказывается, что в классе всех несмещенных линейных оценок она обладает наименьшей матри цей ковариаций. Обобщенный метод наименьших квадратов поз воляет с единых позиций изучать некоторые важные классы ре грессионных моделей: так называемые модели с гетероскедастичностью, когда матрица О является диагональной, но имеет раз ные элементы на главной диагонали, и модели, в которых наблю дения имеют смысл временных рядов, а ошибки коррелированы по времени. Эти вопросы изучаются в главе 6. Следует подчерк нуть, что практическое использование обобщенного метода наи меньших квадратов усложнено тем обстоятельством, что для по строения ОМНК-оценки требуется знать матрицу О, которая ре ально почти всегда неизвестна. В связи с этим возникает пробле ма построения так называемого доступного обобщенного метода наименьших квадратов (Feasible Generalized Least Squares), кото рый обсуждается в разделе 5.3.
5.1.Стохастические регрессоры
В предыдущих разделах предполагалось, что независимые пере менные (матрица X ) являются неслучайными. Ясно, что такое условие выполнено не всегда, например, во многих ситуациях при измерении независимых переменных могут возникать случайные ошибки. Кроме того, при анализе временных рядов значение ис следуемой величины в момент t может зависеть от ее значений в предыдущие моменты времени, т. е. в некоторых уравнениях эти значения выступают в качестве независимых, а в других — в ка честве зависимых переменных (модели с датированными перемен ными). Поэтому возникает необходимость рассматривать модели со стохастическими регрессорами.
Предлагаемый здесь подход позволяет сохранить, по существу, все основные свойства МНК-оценок в классической регрессии. Условия, накладываемые на систему со стохастическими регрессо рами, почти дословно повторяют ограничения стандартной моде ли, но только теперь их следует понимать, говоря не совсем стро
150 |
Гл. 5. Некоторые обобщения множественной регрессии |
го, в условном смысле (при фиксированной матрице X ). Мы пред полагаем, что читателю известны простейшие свойства условных распределений и условных математических ожиданий, использу емые ниже (см. приложение МС, п. 2).
Пусть, как и раньше,
у = Х/3 + е ,
где у — п х 1 вектор зависимых переменных, X — п х к матрица независимых переменных, е — п х 1 вектор случайных ошибок. Но теперь будем считать, что элементы матрицы X также яв ляются случайными величинами. Предположим, что выполнены следующие условия:
1)Е(е | X ) = О,
2)V (e| X ) = <r2J,
3)при любой реализации (т.е. с вероятностью 1) матрица X имеет ранг к.
Здесь Е (е |Х )—условное математическое ожидание случайно го вектора е при фиксированной матрице X , V (e|X ) = Е (ее'|Х )
— его условная ковариационная матрица. Заметим, что условия 1), 2) эквивалентны условиям:
1') Е(у | X ) = Х/3,
V) V(y I X ) = «г2/.
Пусть 3 OLS = 3 = {Х'Х)~1Х ' у — МНК-оценка вектора /3 (которая существует при любой реализации X в силу условия 3)), е == М у — вектор остатков, а2 = е'е/{п — к) — оценка дисперсии, V(/3) = а 2(Х 'Х )-1 — оценка ковариационной матрицы /3. Тогда (ср. (3.7), (3.8))
Е(3 | X ) = Е(/3 + ( Х 'Х ^ Х 'е | X ) = /3 + E ((X 'X )‘ 1X 'e | X )
= /3+ { Х ' Х ) - 1Х'Ще | X) = /3;
V (3 |X ) = V ((X 'X )-1X 'y |X )
= (X ,X ) - 1X 'V (y | Х )Х (Х 'Х )" 1 = а 2(Х 'Х )"1;