книги / Эконометрика. Начальный курс
.pdfУпражнения |
351 |
б) Повторите а) для probit-модели. Изменяются ли ваши выводы?
12.6. Докажите вогнутость (по 0) логарифмической функции правдо подобия для logit-модели.
12.7. Рассмотрим |
простейшую |
tobit-модель: у* = |
а + е(, где |
~ |
||||
N(0,a2)t и yt = y l, |
если yt* >0, |
yt = 0, если yt* ^ 0. |
|
|
||||
Даны результаты 30 наблюдений переменной yt: |
|
|||||||
|
0.768 |
2.911 |
0.461 |
0.000 |
0.678 |
0.000 |
|
|
|
0.000 |
1.233 |
1.868 |
0.709 |
0.000 |
0.000 |
|
|
|
1.010 |
0.000 |
1.422 |
1.543 |
4.411 |
2.385 |
|
|
|
0.000 |
2.487 |
3.469 |
1.778 |
2.931 |
1.283 |
|
|
|
0.000 |
0.060 |
3.198 |
5.546 |
1.546 |
4.680 |
|
|
а) |
Вычислите МНК-оценку параметра а по цензурированным на |
|||||||
|
блюдениям yt. Будет ли эта оценка завышена или занижена по |
|||||||
|
сравнению с истинным значением а? |
|
|
|
||||
б) |
Повторите а) для усеченных на уровне 0 наблюдений yt. |
|
12.8. В таблице приведены 100 наблюдений бинарных переменных
(x,y,z).
Количество наблюдений |
У |
X |
г |
12 |
0 |
0 |
0 |
10 |
0 |
0 |
1 |
20 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
8 |
1 |
0 |
0 |
28 |
1 |
0 |
1 |
22 |
1 |
1 |
0 |
0 |
1 |
1 |
1 |
а) В рамках /oytt-модели Р(у = 1) = Л(а + 0х + уг) тестируйте значимость влияния г на у.
б) В рамках линейной модели вероятности Р(у = 1) = а + 0x + yz тестируйте значимость влияпия г на у.
352Гл. 12. Дискретные зависимые переменные и цензурированные выборки
12.9.Запишите функцию правдоподобиядля оценки параметров (/3,<т2)
модели
yl = х[Р + et, |
(у(—ненаблюдаемая переменная), |
yt = max{ у ;, с}, |
где с ф0, Ее = 0, V(e) = <тг1. |
12.10. Пусть yl = f3i + 02Xt2+ (hxa + Щ, где ut ~ АГ(0,<т2) и щ незави симы.
1) Бинарная переменная d определяется следующим образом:
dt =
если у? > 0, в противном случае.
а) Выпишите вероятность того, что Ф = 1, как функцию перемен
ных Xti.
б) Какие параметры вы можете оценить по наблюдениям (х(«,ф)?
в) Найдите выражение для асимптотической матрицы ковариаций оценок максимального правдоподобия в этом случае.
г) Вы хотите проверить гипотезу, что переменная х«2 незначима. Опишите процедуру проверки этой гипотезы с помощью теста от ношения правдоподобия.
2) Пусть
yt, если yt* > 0,
Vt
0, в противном случае.
а) Какие параметры можно оценить по наблюдениям (х£,у£)?
б) Найдите выражение для предельного эффекта фактора х(з для Vt и у£*.
в) Повторите процедуру проверки гипотезы о незначнмости х£г из п. 1 г) в данном случае. Какой из этих двух тестов выглядит для вас более предпочтительным?
12.11. Дано п = П) + пг + пз наблюдений переменных х и у. Известно, что для ni наблюдений у = 1 и х = 1, для п2 наблюдений у = 0 и х = 1, для п3 наблюдений у = 0 и х = 0. Покажите, что как для logit-, так и для probit-модели, уравнение правдоподобия не имеет решения.
Упражнения |
353 |
12.12.Покажите, что логарифмическая функция правдоподобия для probit-модели является вогнутой (по 0) функцией.
Указание. Покажите, что при любом х выполнено неравенство х + у>(х)/Ф(х) > 0, и воспользуйтесь этим фактом.
12.13.Модель бинарного выбора описывается стандартным образом:
1, если уГ > О, {О, в противном случае,
где у1 = x't0 + elt а ошибки е« имеют распределение Лапласа.
а) Найдите логарифмическую функцию правдоподобия для оцени* вания вектора 0. Является ли эта функция вогнутой по 01
б) Предположим, что вы оценили вектор 0, используя probit-модель,
иэти оценки примерно пропорциональны оценкам, полученным
спомощью исходной модели. Чему приблизительно должен быть равен коэффициент пропорциональности?
12.14.Пусть у(* = х[0 + £«, где ошибки et имеют плотность распреде ления /(х) и
<*1, |
если у; ^ |
<*1, |
|
yt*, |
если а ( |
< у,* < сг2, |
|
{а 2, |
если yt* |
^ |
а2. |
а) Найдите распределение у(.
б) Найдите логарифмическую функцию правдоподобия для оцени вания вектора 0.
в) Найдите (#Еу)/(дх).
12.15.Докажите, что в (12.40) случайные величины щ и ту независимы.
12.16.Расходыдомашних хозяйств в Нидерландах (см. начало в упраж нении 6.14).
Расходы на отдых и модели с усеченными переменными Не все се мьи расходуют деньги па отдых. В нашем случае v3 = 0 для 22.5% наблюдений. В этом разделе мы рассмотрим модели бинарного выбо ра для ответа на вопрос, тратит какие-нибудь средства па отдых или нет, игнорируя информацию о размерах этих затрат. Мы рассмотрим также tofrtl-модель, в которой явно учитывается смешанный дискретно непрерывный тип переменной v3.
354Гл. 12. Дискретные зависимые переменные и цензурированные выборки
12.16.1.а) Постройте фиктивную переменную у, такую что у = 1, если v3 > 0 и у = 0, если «3 = 0.
б) Оцените линейную модель вероятности для у (выберите подходя щий набор объясняющих переменных среди тех, что использова лись в упражнениях 6.14.1-6.14.10). Проинтерпретируйте резуль таты. Как вычислены стандартные ошибки? Почему?
в) Найдите прогноз для у, основываясь на линейной модели вероят ности. Находятся ли прогнозные значения в интервале от 0 до 1?
12.16.2. а) Оцените probit-модель для у. Проинтерпретируйте результат ты
б) Проверьте совместную значимость переменных в модели п. а).
в) Используя стратегию «от общего к частному», постройте подхо дящую probit-модель для у. Проинтерпретируйте результаты. Ис пользуйте эту модель в последующих упражнениях.
г) Найдите прогноз для уи т. е. оценки вероятностей событий у{ = 1. Вычислите также коэффициент детерминации для этой probit- модели.
12.16.3. а) Повторите упражнение 12.16.2, используя logit-модель вме сто probit-моддли.
б) Сравните результаты линейной модели вероятности, probit- модсли и модели.
12.16.4. а) Оцените tobtt-модель для переменной у = In(v3 + 1), исполь зуя регрессоры, выбранные ранее в упражнении 12.16.2.
6)Сравните результаты линейной модели вероятности, pmbit- модели, logit-модели и tobtt-модели.
12.17. В Великобритании подростки в 16 лет делают важный выбор дальнейшей карьеры. В этом возрасте все они сдают специальный эк замен. Через несколько месяцев после этого они должны решить, про должать учебу в школе или нет. Те из них, кто решает оставить школу, могут, п свою очередь, работать полный рабочий день или совмещать работу с учебой. В данных упражнениях мы попытаемся выяснить, ка кие факторы определяют этот выбор.
Здесь используютсяданные Британского национальногоопроса (UK Natioual Child and Development Survey). Они содержат информацию о людях, родившихся в Великобритании в марте 1958 года. Детальное описание данных можно найти в статье (Micklewright, 1986). Данные о респондентах собирались в разные моменты их жизни. В упражнениях
356Гл. 12. Дискретные зависимые переменные и цензурированиые выборки
12.17.5.Оцените logit- или probxt-модель раздельно для юношей и для девушек (не забудьте удалить из списка объясняющих переменных пе ременную female). Прокомментируйте различия в результатах оцени вания.
12.17.6.Проверьте гипотезу о применимости общей модели для всех подростков против гипотезы о том, что нужно использовать разные мо дели для юношей и для девушек (используйте тест отношения правдо подобия).
12.17.7.Используя наиболее подходящую, с вашей точки зрения, мо дель, вычислите прогнозную вероятность продолжить учебу для юноши и девушки со средними характеристиками. Также вычислите влияние на эту вероятность наличия в семье еще одного младшего брата (се
стры).
12.17.8.Рассмотрите тех подростков, для которых school = 0, постройте переменную job, равную 1, если аН6 = 3 (полный рабочий день), и О, если atl6 = 2 (совмещение работы и учебы). Проделайте упражнения 12.17.1-12.17.7 и проанализируйте, какие факторы влияют на выбор между работой и совмещением работы и учебы.
12.17.9.Используя наиболее подходящие, с вашей точки зрения, моде ли, вычислите прогнозную вероятность выбрать полный рабочий день (school = 0 и job = 1) для юноши и девушки со средними характери стиками. Также вычислите влияние на эту вероятность одного допол нительного младшего брата (сестры).
358 |
Гл. 13. Панельные данные |
ми, что нельзя сделать в рамках стандартных регрессионных мо делей.
Классический пример такой ситуации, вошедший в большин ство книг, посвященных панельным данным, привел (Ben-Porah, 1973). Предположим, что ежегодное исследование рынка труда показало, что процент работающих замужних женщин равен 50%. Как можно интерпретировать этот факт? Возможны две крайние точки зрения. Согласно первой, полученный результат означает, что каждая замужняя женщина имеет шанс 50% работать в те чение года. Согласно второй, результаты исследования показыва ют, что 50% всех замужних женщин работают полный рабочий день, а остальные 50% вообще не работают. Ясно, что прогноз состояния рынка труда будет существенно разный в зависимости от того, какая из ситуаций имеет место. Более или менее аде кватное представление о реальном положении можно получить, если проследить историю некоторого числа индивидуумов в те чение определенного периода времени, т. е. в рамках панельных данных.
Можно привести еще несколько примеров, показывающих, что панельные данные дают возможность учесть эффекты, которые невозможно проследить, оставаясь в рамках обычных моделей. Так, при изучении величины ВВП на душу населения имеется воз можность для какой-либо страны в каждый период времени на блюдать уровень инфляции, объем инвестиций, денежную массу и т. п. Но кроме этого существуют факторы, которые либо не наблю даемы, либо нел1>зя представить в численной форме, но которые могут оказывать существенное влияние на исследуемый показа тель: географическое положение, история, культурные традиции и т. д. При этом действие этих факторов можно считать постоян ным (т. е. не зависящим от времени) для каждой национальной экономики. Имея лишь пространственные данные для несколь ких стран, можно определить влияние обычных экономических факторов на величину ВВП на душу населения, но нельзя вы явить индивидуальные различия между странами. При наличии наблюдений за одними и теми же странами в течение нескольких
13.1. Введение |
359 |
периодов времени возникает возможность такие индивидуальные различия оценить.
На микроуровне одна из традиционных задач — объяснение расходов домашних хозяйств на тот или иной товар, например, средства личной гигиены. Можно собрать пространственные дан ные, включив в них экономические и социально-демографические характеристики семьи и т. п., и получить значимую зависимость расходов на изучаемый товар от семейного дохода. Однако па нельные данные могут показать, что доход не всегда оказывает существенное влияние, а разницу в расходах следует объяснять семейными традициями, уровнем культуры и другими фактора ми, не всегда поддающимися измерению и наблюдению.
Часто индивидуальные факторы коррелироваиы с другими объясняющими переменными. Так, например, общий уровень культуры семьи и уровень ее дохода естественно считать связан ными. В рамках моделей регрессии это означает, что индивиду альный фактор является существенной переменной в модели и ее исключение приводит к смещенным оценкам остальных парамет ров (см. п. 4.4). Иными словами, модели с панельными данными позволяют получать более точные оценки параметров.
Вто же время, поскольку панельные данные содержат наблю дения за одними и теми же объектами в разные периоды време ни, предположение о взаимной независимости этих наблюдений становится нереалистичным, поэтому анализ этих моделей может потребовать применения более тонких (по сравнению с обычным методом наименьших квадратов) методов оценивания.
Внастоящее время существует много баз пансльиых дан ных как на микро-, так и на макроуровне. Например, в Na tional Longitudinal Survey of Labor Market Experience (NLS), http://wvw.bls.gov/nls/home.htm. содержатся данные по рынку труда в США, в Michigan Panel Study of Income Dynamics (PSID), http://www.isr.umich.edu/src/psid/, — результаты бюджетных обследований домашних хозяйств в США. В последние годы про водится работа по сбору панельных данных в России (Russia Lon gitudinal Monitoring Survey, http://www.cpc.unc.edu/rlms/), пред