Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
15
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

Упражнения

351

б) Повторите а) для probit-модели. Изменяются ли ваши выводы?

12.6. Докажите вогнутость (по 0) логарифмической функции правдо­ подобия для logit-модели.

12.7. Рассмотрим

простейшую

tobit-модель: у* =

а + е(, где

~

N(0,a2)t и yt = y l,

если yt* >0,

yt = 0, если yt* ^ 0.

 

 

Даны результаты 30 наблюдений переменной yt:

 

 

0.768

2.911

0.461

0.000

0.678

0.000

 

 

0.000

1.233

1.868

0.709

0.000

0.000

 

 

1.010

0.000

1.422

1.543

4.411

2.385

 

 

0.000

2.487

3.469

1.778

2.931

1.283

 

 

0.000

0.060

3.198

5.546

1.546

4.680

 

а)

Вычислите МНК-оценку параметра а по цензурированным на­

 

блюдениям yt. Будет ли эта оценка завышена или занижена по

 

сравнению с истинным значением а?

 

 

 

б)

Повторите а) для усеченных на уровне 0 наблюдений yt.

 

12.8. В таблице приведены 100 наблюдений бинарных переменных

(x,y,z).

Количество наблюдений

У

X

г

12

0

0

0

10

0

0

1

20

0

1

0

0

0

1

1

8

1

0

0

28

1

0

1

22

1

1

0

0

1

1

1

а) В рамках /oytt-модели Р= 1) = Л(а + 0х + уг) тестируйте значимость влияния г на у.

б) В рамках линейной модели вероятности Р(у = 1) = а + 0x + yz тестируйте значимость влияпия г на у.

352Гл. 12. Дискретные зависимые переменные и цензурированные выборки

12.9.Запишите функцию правдоподобиядля оценки параметров (/3,<т2)

модели

yl = х[Р + et,

(у(—ненаблюдаемая переменная),

yt = max{ у ;, с},

где с ф0, Ее = 0, V(e) = <тг1.

12.10. Пусть yl = f3i + 02Xt2+ (hxa + Щ, где ut ~ АГ(0,<т2) и щ незави­ симы.

1) Бинарная переменная d определяется следующим образом:

dt =

если у? > 0, в противном случае.

а) Выпишите вероятность того, что Ф = 1, как функцию перемен­

ных Xti.

б) Какие параметры вы можете оценить по наблюдениям (х(«,ф)?

в) Найдите выражение для асимптотической матрицы ковариаций оценок максимального правдоподобия в этом случае.

г) Вы хотите проверить гипотезу, что переменная х«2 незначима. Опишите процедуру проверки этой гипотезы с помощью теста от­ ношения правдоподобия.

2) Пусть

yt, если yt* > 0,

Vt

0, в противном случае.

а) Какие параметры можно оценить по наблюдениям (х£,у£)?

б) Найдите выражение для предельного эффекта фактора х(з для Vt и у£*.

в) Повторите процедуру проверки гипотезы о незначнмости х£г из п. 1 г) в данном случае. Какой из этих двух тестов выглядит для вас более предпочтительным?

12.11. Дано п = П) + пг + пз наблюдений переменных х и у. Известно, что для ni наблюдений у = 1 и х = 1, для п2 наблюдений у = 0 и х = 1, для п3 наблюдений у = 0 и х = 0. Покажите, что как для logit-, так и для probit-модели, уравнение правдоподобия не имеет решения.

Упражнения

353

12.12.Покажите, что логарифмическая функция правдоподобия для probit-модели является вогнутой (по 0) функцией.

Указание. Покажите, что при любом х выполнено неравенство х + у>(х)/Ф(х) > 0, и воспользуйтесь этим фактом.

12.13.Модель бинарного выбора описывается стандартным образом:

1, если уГ > О, {О, в противном случае,

где у1 = x't0 + elt а ошибки е« имеют распределение Лапласа.

а) Найдите логарифмическую функцию правдоподобия для оцени* вания вектора 0. Является ли эта функция вогнутой по 01

б) Предположим, что вы оценили вектор 0, используя probit-модель,

иэти оценки примерно пропорциональны оценкам, полученным

спомощью исходной модели. Чему приблизительно должен быть равен коэффициент пропорциональности?

12.14.Пусть у(* = х[0 + £«, где ошибки et имеют плотность распреде­ ления /(х) и

<*1,

если у; ^

<*1,

yt*,

если а (

< у,* < сг2,

{а 2,

если yt*

^

а2.

а) Найдите распределение у(.

б) Найдите логарифмическую функцию правдоподобия для оцени­ вания вектора 0.

в) Найдите (#Еу)/(дх).

12.15.Докажите, что в (12.40) случайные величины щ и ту независимы.

12.16.Расходыдомашних хозяйств в Нидерландах (см. начало в упраж­ нении 6.14).

Расходы на отдых и модели с усеченными переменными Не все се­ мьи расходуют деньги па отдых. В нашем случае v3 = 0 для 22.5% наблюдений. В этом разделе мы рассмотрим модели бинарного выбо­ ра для ответа на вопрос, тратит какие-нибудь средства па отдых или нет, игнорируя информацию о размерах этих затрат. Мы рассмотрим также tofrtl-модель, в которой явно учитывается смешанный дискретно­ непрерывный тип переменной v3.

354Гл. 12. Дискретные зависимые переменные и цензурированные выборки

12.16.1.а) Постройте фиктивную переменную у, такую что у = 1, если v3 > 0 и у = 0, если «3 = 0.

б) Оцените линейную модель вероятности для у (выберите подходя­ щий набор объясняющих переменных среди тех, что использова­ лись в упражнениях 6.14.1-6.14.10). Проинтерпретируйте резуль­ таты. Как вычислены стандартные ошибки? Почему?

в) Найдите прогноз для у, основываясь на линейной модели вероят­ ности. Находятся ли прогнозные значения в интервале от 0 до 1?

12.16.2. а) Оцените probit-модель для у. Проинтерпретируйте результат ты

б) Проверьте совместную значимость переменных в модели п. а).

в) Используя стратегию «от общего к частному», постройте подхо­ дящую probit-модель для у. Проинтерпретируйте результаты. Ис­ пользуйте эту модель в последующих упражнениях.

г) Найдите прогноз для уи т. е. оценки вероятностей событий у{ = 1. Вычислите также коэффициент детерминации для этой probit- модели.

12.16.3. а) Повторите упражнение 12.16.2, используя logit-модель вме­ сто probit-моддли.

б) Сравните результаты линейной модели вероятности, probit- модсли и модели.

12.16.4. а) Оцените tobtt-модель для переменной у = In(v3 + 1), исполь­ зуя регрессоры, выбранные ранее в упражнении 12.16.2.

6)Сравните результаты линейной модели вероятности, pmbit- модели, logit-модели и tobtt-модели.

12.17. В Великобритании подростки в 16 лет делают важный выбор дальнейшей карьеры. В этом возрасте все они сдают специальный эк­ замен. Через несколько месяцев после этого они должны решить, про­ должать учебу в школе или нет. Те из них, кто решает оставить школу, могут, п свою очередь, работать полный рабочий день или совмещать работу с учебой. В данных упражнениях мы попытаемся выяснить, ка­ кие факторы определяют этот выбор.

Здесь используютсяданные Британского национальногоопроса (UK Natioual Child and Development Survey). Они содержат информацию о людях, родившихся в Великобритании в марте 1958 года. Детальное описание данных можно найти в статье (Micklewright, 1986). Данные о респондентах собирались в разные моменты их жизни. В упражнениях

Упражнения

355

используются данные о юношах и девушках (подвыборка тех, кто жи­ вет не в Шотландии). Большинство значений переменных относится к шестнадцатилетнему возрасту. Файл choice.xls3 содержит следующие переменные (см. таблицу 12.3):

 

Таблица 12.3

Переменная

Описание

afl6

Решение, принятое в 16-летнем возрасте (1 — продол­

 

жать учебу, 2 — совмещение учебы н работы, 3 —ра­

 

ботать полный рабочий день)

able7

Результат теста общих способностей, проводящегося в

 

7-летнем возрасте

loginc

Логарифм дохода семьи (в 16 лет)

ctratio

Число учеников па одного учителя в школе (показа­

oldsib

тель, отражающий качество школы)

Число старших братьев и сестер (в 16 лет)

yngsib

Число младших братьев и сестер (в 16 лет)

etot

Число полученных на выпускных экзаменах высших

 

оценок (экзамен проводится в 16 лет, до принятия ре­

 

шения о продолжении учебы)

female

Пол (1 —для девушек, 0 —для юношей)

12.17.1.Вычислите описательные статистики переменных как для всей выборки, так и отдельно для девушек и юношей. Постройте гистограм­ мы значений переменной а<16 отдельно для юношей и девушек. Интер­ претируйте результаты.

12.17.2.Сконструируйте переменную school, равную 1, если atl6 = 1,

иравную 0 в противном случае. Оцените Jo^tt-perpeccmo переменной school на все остальные переменные и интерпретируйте результаты. Со­ гласуются ли они с вашими ожиданиями?

12.17.3.Повторите упражнение 12.17.2, используя probit вместо logit. Сравните полученные результаты с результатами упражнения 12.17.2.

12.17.4.Выберите из logit- и probxt-моделей более подходящую. Про­ верьте, одинаково ли влияет на принятие решения о продолжении уче­ бы наличие в семье старших и младших братьев и сестер.

3Исходные данные Британского национального опроса можно скачать по адресу http://явя.data-archive.ас.uk/findingData/ncdsHevs.asp

356Гл. 12. Дискретные зависимые переменные и цензурированиые выборки

12.17.5.Оцените logit- или probxt-модель раздельно для юношей и для девушек (не забудьте удалить из списка объясняющих переменных пе­ ременную female). Прокомментируйте различия в результатах оцени­ вания.

12.17.6.Проверьте гипотезу о применимости общей модели для всех подростков против гипотезы о том, что нужно использовать разные мо­ дели для юношей и для девушек (используйте тест отношения правдо­ подобия).

12.17.7.Используя наиболее подходящую, с вашей точки зрения, мо­ дель, вычислите прогнозную вероятность продолжить учебу для юноши и девушки со средними характеристиками. Также вычислите влияние на эту вероятность наличия в семье еще одного младшего брата (се­

стры).

12.17.8.Рассмотрите тех подростков, для которых school = 0, постройте переменную job, равную 1, если аН6 = 3 (полный рабочий день), и О, если atl6 = 2 (совмещение работы и учебы). Проделайте упражнения 12.17.1-12.17.7 и проанализируйте, какие факторы влияют на выбор между работой и совмещением работы и учебы.

12.17.9.Используя наиболее подходящие, с вашей точки зрения, моде­ ли, вычислите прогнозную вероятность выбрать полный рабочий день (school = 0 и job = 1) для юноши и девушки со средними характери­ стиками. Также вычислите влияние на эту вероятность одного допол­ нительного младшего брата (сестры).

Глава 13

Панельные данные

13.1.Введение

Панельные данные (Panel data) состоят из наблюдений одних и тех же экономических единиц или объектов (индивидуумы, до­ машние хозяйства, фирмы, регионы, страны и т. п.), которые осу­ ществляются в последовательные периоды времени. Примерами могут служить ежегодные бюджетные обследования одних и тех же домашних хозяйств, ежеквартальные данные о деятельности фиксированного множества предприятий, ежегодные социальноэкономические показатели определенной группы стран. Таким об­ разом, панельные данные сочетают в себе как данные простран­ ственного типа (cross-sectional data), так и данные типа времен­ ных рядов (time-series data): в каждый момент времени имеются данные пространственного типа по экономическим единицам, и для каждого такого объекта соответствующие ему данные образу­ ют один или несколько временных рядов. Благодаря специальной структуре панельные данные позволяют строить более гибкие и содержательные модели и получать ответы на вопросы, которые недоступны только в рамках, например, моделей, основанных на пространственных данных.

В частности, возникает возможность учитывать и анализиро­ вать индивидуальные отЛичНя между экономическими единица-

357

358

Гл. 13. Панельные данные

ми, что нельзя сделать в рамках стандартных регрессионных мо­ делей.

Классический пример такой ситуации, вошедший в большин­ ство книг, посвященных панельным данным, привел (Ben-Porah, 1973). Предположим, что ежегодное исследование рынка труда показало, что процент работающих замужних женщин равен 50%. Как можно интерпретировать этот факт? Возможны две крайние точки зрения. Согласно первой, полученный результат означает, что каждая замужняя женщина имеет шанс 50% работать в те­ чение года. Согласно второй, результаты исследования показыва­ ют, что 50% всех замужних женщин работают полный рабочий день, а остальные 50% вообще не работают. Ясно, что прогноз состояния рынка труда будет существенно разный в зависимости от того, какая из ситуаций имеет место. Более или менее аде­ кватное представление о реальном положении можно получить, если проследить историю некоторого числа индивидуумов в те­ чение определенного периода времени, т. е. в рамках панельных данных.

Можно привести еще несколько примеров, показывающих, что панельные данные дают возможность учесть эффекты, которые невозможно проследить, оставаясь в рамках обычных моделей. Так, при изучении величины ВВП на душу населения имеется воз­ можность для какой-либо страны в каждый период времени на­ блюдать уровень инфляции, объем инвестиций, денежную массу и т. п. Но кроме этого существуют факторы, которые либо не наблю­ даемы, либо нел1>зя представить в численной форме, но которые могут оказывать существенное влияние на исследуемый показа­ тель: географическое положение, история, культурные традиции и т. д. При этом действие этих факторов можно считать постоян­ ным (т. е. не зависящим от времени) для каждой национальной экономики. Имея лишь пространственные данные для несколь­ ких стран, можно определить влияние обычных экономических факторов на величину ВВП на душу населения, но нельзя вы­ явить индивидуальные различия между странами. При наличии наблюдений за одними и теми же странами в течение нескольких

13.1. Введение

359

периодов времени возникает возможность такие индивидуальные различия оценить.

На микроуровне одна из традиционных задач — объяснение расходов домашних хозяйств на тот или иной товар, например, средства личной гигиены. Можно собрать пространственные дан­ ные, включив в них экономические и социально-демографические характеристики семьи и т. п., и получить значимую зависимость расходов на изучаемый товар от семейного дохода. Однако па­ нельные данные могут показать, что доход не всегда оказывает существенное влияние, а разницу в расходах следует объяснять семейными традициями, уровнем культуры и другими фактора­ ми, не всегда поддающимися измерению и наблюдению.

Часто индивидуальные факторы коррелироваиы с другими объясняющими переменными. Так, например, общий уровень культуры семьи и уровень ее дохода естественно считать связан­ ными. В рамках моделей регрессии это означает, что индивиду­ альный фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных парамет­ ров (см. п. 4.4). Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.

Вто же время, поскольку панельные данные содержат наблю­ дения за одними и теми же объектами в разные периоды време­ ни, предположение о взаимной независимости этих наблюдений становится нереалистичным, поэтому анализ этих моделей может потребовать применения более тонких (по сравнению с обычным методом наименьших квадратов) методов оценивания.

Внастоящее время существует много баз пансльиых дан­ ных как на микро-, так и на макроуровне. Например, в Na­ tional Longitudinal Survey of Labor Market Experience (NLS), http://wvw.bls.gov/nls/home.htm. содержатся данные по рынку труда в США, в Michigan Panel Study of Income Dynamics (PSID), http://www.isr.umich.edu/src/psid/, — результаты бюджетных обследований домашних хозяйств в США. В последние годы про­ водится работа по сбору панельных данных в России (Russia Lon­ gitudinal Monitoring Survey, http://www.cpc.unc.edu/rlms/), пред­

м а к р о ­

360 Гл. 13. Панельные данные

ставляющих результаты обследований по широкому кругу вопро­ сов (бюджетные, демографические, социальные и т. п.).

Все эта данные содержат наблюдения о большом количестве (несколько тысяч) экономических единиц (семей, индивидуумов) за относительно короткий промежуток времени. Такое соотноше­ ние между объемами пространственных и временных наблюдений является типичным для многих панельных данных.

Помимо этого существует большое число финансовых, экономических и т. п. баз панельных данных.

В данной главе основное внимание уделяется статическим мо­ делям с обычными количественными зависимыми переменными. Динамические модели и модели с дискретными зависимыми пе­ ременными рассматриваются менее детально. Их подробное из­ ложение выходит за рамки начального курса, поэтому мы даем лишь описание моделей и краткое изложение возможных мето­ дов оценивания. В конце главы кратко описывается обобщенный метод моментов, который в настоящее время является одним из основных инструментов оценивания динамических моделей с па­ нельными данными.

13.2.Обозначения и основные модели

Введем обозначения, которые будут использоваться на протяже­ нии всей главы. Пусть уи — зависимая переменная для экономи­ ческой единицы i в момент времени t, x it — набор объясняющих (независимых) переменных (вектор размерности к) и £ц — соот­ ветствующая ошибка, г = 1 ,..., n, t = 1 ,..., Т. Обозначим также

V x il £ ц '

Уг = | , *i = : , Si = •

У»Г .< т .

Введем также «объединенные» наблюдения и ошибки:

У1

 

'X , '

V

У =

, * =

I , е =

*

.Уп.

 

Х п

*п

(Здесь у, е — пТ х 1 векторы, X — пТ х к Матрица.)