Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика-методичка для заочников.doc
Скачиваний:
76
Добавлен:
18.11.2019
Размер:
5.91 Mб
Скачать

13.2. Доверительные интервалы и интервалы предсказания

Проведение регрессионного анализа позволяет предсказать значения зависимой переменной, исходя из заданных значений независимых переменных. После этого, можно дополнительно вычислить доверительные интервалы и/или интервалы предсказания. Доверительный интервал предоставляет информацию об ожидаемом (среднем) значении зависимой переменной. Таким образом, доверительный интервал для предсказанного значения зависимой переменной содержит информацию о диапазоне возможных значений, расположенных вокруг "истинного" (популяционного) среднего зависимой переменной с заданным уровнем доверия. Интервал предсказания говорит об отдельных предсказаниях значений зависимой переменной. Т.е. интервал предсказания для предсказанного значения зависимой переменной предоставляет сведения о диапазоне значений, в котором предположительно будут располагаться значения зависимой переменной при проведении дополнительных наблюдений (с заданным уровнем уверенности, см. также Элементарные понятия статистики). Отметим, что доверительный интервал предоставляет меньший диапазон значений, поскольку это интервальная оценка для среднего, а не не интервальная оценка для единичного наблюдения.

13.3. Критерий г. Чоу

Предположим, сопутствующая переменная z принимала в процессе сбора регрессионных наблюдений

B~n = {(X1 , y1), (X2, y2), …,(X n, yn)}

всего два значения: z1 и z2 . Тогда общая выборка B~n может быть поделена на две подвыборки

B~(1)n = {(Xi1 , yi1), (Xi2, yi2), …,(Xin1, yin1) | z =z1 },

B~(2)n = {(Xj1 , yj1), (Xj2, yj2), …,(Xjn2, yjn2) | z =z2 },

таким образом, что все наблюдения внутри каждой из подвыборок были произведены при одном и том же значении сопутствующей переменной z: 1-я подвыборка – при z = z1 и 2-я подвыборка – при z = z2.

Мы хотели бы получить ответ на вопрос: действительно ли подвыборки B(1)n1 и B(2)n2 неоднородны в регрессионном смысле или переход от градации z1 к градации z2 в условиях сбора исходных статистических данных никак не влияет на структуру линейной модели регрессии у по X, и, следовательно, подвыборки B(1)n1 и B(2)n2 можно объединить и строить искомую функцию регрессии по объединенной (общей) выборке B~n ? Иными словами, мы хотели бы статистически проверить гипотезу

H0 : Θ(1) = Θ(2) , De (1) = De (2) = σ2,

где Θ(j) = (Θ(j) 0, Θ(j)1, … Θ(j) p ) и е(j) соответственно коэффициенты регрессии и случайные регрессионные остатки, генерирующей наблюдения выборки B(j)nj (j =1,2).

Если n1 р+1 и n2 р+ 1, то можно предложить много способов проверки гипотезы Hо (например, для принятия гипотезы Но достаточно проверить тот факт, что точечные оценки Θ(1) = (Θ(1) 0, Θ(1)1, … Θ(1) p )T, полученные по 1-й подвыборке, попадают внутрь интервальных оценок коэффициентов регрессии, построенных по 2-й подвыборке).

Если же объем одной из подвыборок (например, второй) не позволяет провести сколько-нибудь надежную оценку неизвестных коэффициентов (это всегда так при n2 р + 1), то требуется более изощренная процедура проверки гипотезы H0. Кстати, именно в такой ситуации достаточно часто оказывается статистик-эконометрист, если к уже имеющейся у него основной выборке B(1)n1 он хочет присоединить полученную позже (или в другом месте) небольшую дополнительную порцию данных вида B(2)n2, но не знает, можно ли считать выборки B(1)n1 и B(2)n2 регрессионно-однородными,

Г. Чоу предложил следующую процедуру для статистической проверки гипотезы Н0 в данном случае.

1) По основной выборке B(1)n1 строим МНК-оценки Θ(1) параметров модели и вычисляем вектор невязок e(1) = Y(1) – Х(1) Θ(1) , а затем и сумму квадратов этих невязок e(1)T e(1).

2) По объединенной (общей) выборке Bn содержащей в себе все наблюдения обеих выборок B(1)n1 и B(2)n2 , строим МНК-оценки θ параметров модели и вычисляем вектор невязок e = У – Хθ, а затем и сумму квадратов этих связок еTe (здесь Y и X – соответственно (n х 1)-вектор и n х (р+1)-матрица наблюденных значений анализируемых переменных соответствующие объединенной выборке Bn , n = n1 + n2).

3) Критическая статистика γ вычисляется по формуле

Yn,,n1 = ( (eTe – e T(1)e (1) )/n2) / eT (1)e (1)/ (n1 – p – 1)

В предположении справедливости гипотезы Hо статистика γn,,n1 должна «вести себя» как случайная величина, распределенная по закону F (n2, n1 – р – 1). Поэтому, если γn,,n1 Fa (n2, n1 – р – 1), то гипотезу Н0 о регрессионной однородности выборок B(1)n1 и B(2)n2 следует отвергнуть (и принять в противном случае). Здесь Fa (n2, n1 – р – 1) – 100%-ная точка F-распределения с числами степеней свободы числителя и знаменателя, равными соответственно n2 и (n1 – р – 1), a α – заданный уровень значимости критерия.

Замечание. Если объем «дополнительной порции» наблюдений n2 достаточно велик для того, чтобы можно было получить статистически надежные оценки θ(2) неизвестных параметров регрессии и соответствующие невязки e(2) = Y(2) – X(2)θ(2) только по наблюдениям 2-й подвыборки, то для проверни гипотезы H0 более предпочтительно использовать критическую статистику

Yn,,n1 = ( (eTe – eT (1)e (1) – eT (2)e (2) ) / (p + 1) ) / (eT (1)e (1) + eT(2)e (2) )/ (n1 + n2 – 2p – 2)

В предположения справедливости гипотезы Hо статистика γn1, n2 должна «вести себя» как случайная величина, распределенная по закону F(р+1, n1 + n2 – 2р-2). Так что, если γn,,n1 F(р+1, n1 + n2 – 2р-2), то гипотезу Hо отвергают с уровнем значимости α (и принимают в противном случае).