Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

672

.pdf
Скачиваний:
4
Добавлен:
09.01.2024
Размер:
2.55 Mб
Скачать

Проведем регрессионный анализ первых и последних семи наблюдений отдельно, рассчитаем квадраты остатков, таблица 3.

Таблица 3

Расчет квадратов остатков по группам, упорядоченным по Х

Наблюдения

У

Х

 

Ɛi

RSSi i 2)

1

315,63

286,56

 

17,7297

314,3422

2

259,33

403,3333

 

-63,8402

4075,573

3

333,97

442,6133

 

2,297297

5,277576

4

355,28

446,56

 

22,74967

517,5477

5

306,08

454,3467

 

-28,1358

791,6241

6

396,16

459,04

 

60,92827

3712,254

7

329,20

485,36

 

-11,7289

137,5674

Итого по первой группе (верхняя выборка)

9554,186

14

842,08

635,2

 

113,4883

12879,6

15

689,60

647,44

 

-44,1147

1946,11

16

732,21

664

 

-8,43263

71,10919

17

692,99

669,9467

 

-50,1483

2514,85

18

715,57

675,1467

 

-29,7381

884,3537

19

826,85

830,6667

 

16,44872

270,5603

20

814,59

834,6933

 

2,496681

6,233416

Итого по второй группе (нижняя выборка)

 

18572,82

Согласно тесту Гольдфельда-Квандта получаем:

F факт = 18572,82/9554,186 = 1,94 Fкр = 6,3

В результате F факт Fкр, на уровне значимости в 5% гипотеза об отсутствии гетероскесдастичности принимается, предпосылка о равенстве дисперсий остаточных величин не нарушается.

Аналогичный результат расчета получился с использованием Excel (таблицы 4 и 5).

Таблица 4

Дисперсионный анализ по верхней выборке

Показатель

df

SS

MS

Регрессия

1

1221,598

1221,598

Остаток

5

9554,186

1910,837

Итого

6

10775,78

-

 

80

 

 

Таблица 5

Дисперсионный анализ по верхней выборке

Показатель

df

SS

MS

Регрессия

1

7800,826

7800,826

Остаток

5

18572,82

3714,564

Итого

6

26373,65

-

Таким образом, согласно тесту Гольдфельда-Квандта и тесту Спирмена получаем идентичные результаты.

Вопросы для проверки и закрепления знаний

1. Дайте определение гетероскедастичности и укажите, какие стандартные предположения нарушаются?

2.Каковы причины возникновения гетероскедастично-

сти?

3.Какие могут быть последствия гетероскедастичности для оценок параметров регрессии методом наименьших квадратов и проверки статистических гипотез?

4.Какие существуют тесты для определения гетероскедастичности?

5. Какими способами можно получить корректные статистические выводы при наличии гетероскедастичности?

6.Какова методика использования в расчетах теста Спирмена?

7.Какова методика использования в расчетах теста Гольдфельда-Квандта?

Задания для проверки и закрепления знаний

Задание 1. Тестирование гетероскедастичности по Спирмену и Гольдфельду-Квандту

Исходные данные:

Имеются следующие данные, представленные в таблице 6.

81

 

 

 

Таблица 6

 

Исходные данные

 

 

 

 

 

 

 

Наблюдения

 

У

Х

 

1

 

199,49

310,26

 

2

 

234,15

400,10

 

3

 

242,79

220,43

 

4

 

253,23

373,35

 

5

 

256,90

340,47

 

6

 

235,45

349,50

 

7

 

304,74

353,11

 

8

 

273,29

343,51

 

9

 

384,70

401,62

 

10

 

440,27

408,31

 

11

 

448,57

405,25

 

12

 

322,65

417,52

 

13

 

533,07

515,34

 

14

 

563,24

510,77

 

15

 

550,44

519,34

 

16

 

530,46

498,03

 

17

 

636,86

461,52

 

18

 

626,61

642,07

 

19

 

647,75

488,62

 

20

 

636,04

638,97

 

Задание

1.Требуется: проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Спирмена на уровне значимости 0,05 и 0,01.

2.Построить график зависимости остатков от фактора

Х.

3.Требуется: проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Гольдфельда-Квандта на уровне значимости 0,05 и 0,01.

Задание 2. Тестирование гетероскедастичности по Спирмену и Гольдфельду-Квандту

Исходные данные:

Имеются данные о дисперсионном анализе выборки (всего наблюдений 20), представленном в таблицах 7 и 8.

82

Таблица 7

Дисперсионный анализ по верхней выборке

Показатель

 

df

SS

MS

 

Верхняя выборка

 

Регрессия

 

2

1157,837

578,9187

Остаток

 

4

357,5073

89,37682

Итого

 

6

1515,345

 

 

Нижняя выборка

 

Регрессия

 

2

1884,397

942,1986

Остаток

 

4

1824,397

456,0992

Итого

 

6

3708,794

 

Имеются также данные по регрессионной статистике, таблица 8.

Таблица 8

Результаты регрессионной статистики по выборкам

Переменные

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

 

 

 

 

 

 

 

 

 

 

 

 

Верхняя выборка

 

 

 

Y-

 

 

 

 

 

 

 

 

пере-

-34,303

44,710

-0,767

0,486

-158,437

89,831

-158,437

89,831

сече-

 

 

 

 

 

 

 

 

ние

 

 

 

 

 

 

 

 

X1

0,641

0,202

3,177

0,034

0,081

1,202

0,081

1,202

X2

1132,054

340,824

3,322

0,029

185,775

2078,334

185,775

2078,334

 

 

 

Нижняя выборка

 

 

 

Y-

 

 

 

 

 

 

 

 

пере-

213,602

78,308

2,728

0,053

-3,817

431,021

-3,817

431,021

сече-

 

 

 

 

 

 

 

 

ние

 

 

 

 

 

 

 

 

X1

0,577

0,296

1,952

0,123

-0,244

1,398

-0,244

1,398

 

-1106,870

842,418

-1,314

0,259

-

1232,055

-

1232,055

X2

3445,800

3445,800

 

 

 

 

 

 

Задание

1.Требуется: определить по каким уравнениям линейной регрессии осуществляется дисперсионный анализ.

2.Требуется: проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Гольдфельда-Квандта на уровне значимости 0,05.

83

Задание 3. Тестирование гетероскедастичности по Спирмену и Гольдфельду-Квандту

Исходные данные:

Имеются следующие данные, представленные в таблице 9.

Таблица 9

Исходные данные

Y

Х1

Х2

1

280,51

254,68

0,17

2

230,48

358,46

0,09

3

296,82

393,37

0,09

4

315,76

396,88

0,14

5

272,03

403,80

0,09

6

352,09

407,97

0,14

7

292,58

431,36

0,07

8

270,54

462,27

0,12

9

444,47

464,02

0,17

10

518,27

468,22

0,14

11

508,67

471,75

0,21

12

372,78

482,39

0,07

13

735,81

533,23

0,17

14

748,40

564,53

0,14

15

612,88

575,41

0,19

16

650,75

590,13

0,14

17

615,89

595,42

0,17

18

635,97

600,04

0,21

19

734,87

738,26

0,19

20

723,96

741,83

0,19

Задание

3.Требуется: проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Спирмена на уровне значимости 0,05 и 0,01.

4.Построить график зависимости остатков от фактора Х.

5.Требуется: проверить гипотезу о наличии гетероскесдастичности в линейной регрессии с помощью теста Гольдфельда-Квандта на уровне значимости 0,05 и 0,01.

84

7. Учет автокоррелированности ошибок

7.1. Понятия и последствия автокорреляции

Для статистических данных, развернутых во времени (временные ряды) возможно наличие нарушений стандартных предположений в виде автокоррелированности (сери-

альной корреляции) ошибок (autocorrelation, serial correlation).

Взаимная независимость возмущений также является условием успешного проведения регрессионного анализа и получения качественной модели. Для этого необходима независимость возмущений, т. е. r (Ɛi, Ɛj) = cov (Ɛi, Ɛj) =0, i≠j.

Под автокорреляцией понимается корреляция между наблюдаемыми показателями. Такое явление связано с использованием данных временных рядов. Поэтому, как привило используется символ t, вместо i, для отражения периода наблюдения.

Ожидаемые последствия наличия автокорреляции, следующие:

1.Метод наименьших квадратов обеспечивает несмещенные оценки параметров;

2.Следствием заниженности оценок стандартных отклонений коэффициентов является завышенность t – статистик;

3.Оценки МНК для стандартных отклонений будут заниженными;

4.Оценка дисперсии возмущений смещена, следовательно, параметры регрессии не эффективны.

Если автокорреляция присутствует, то наибольшее влияние на наблюдение оказывает результат предыдущего наблюдения, это называется автокорреляцией первого порядка. Если корреляция между соседними наблюдениями отсутствует, то МНК даст адекватные и эффективные результаты.

85

Положительная автокорреляция сопровождается записью r t-1, Ɛt)>0. Графически положительная автокореляция выглядит так, как представлено на рисунке 1.

Рисунок 1. Положительная автокорреляция

Отрицательная автокорреляция характеризуется записью r t-1, Ɛt) 0. Это значит, что за положительным возмущением следует отрицательное и наоборот. Графически это представлено рисунком 2.

Рисунок 2. Отрицательная автокорреляция

Основными причинами автокорреляции можно назвать следующие:

1. Ошибки спецификации. Неправильный выбор формы зависимости или невключение в состав объясняющих переменных какого-либо важного фактора может привести к систематическим отклонениям наблюдаемых значений показателя от линии регрессии. Неправильный выбор модели, либо

86

как отбрасывание значимой переменной также приводит к такому результату.

2.Сглаживание данных. Данные по продолжительному временному периоду времен рассчитаны усреднением по интервалам, что приводит к сглаживанию возникших колебаний внутри исследуемого периода.

3.Инерция. Зачастую экономические показатели имеют свойство цикличности или их реакция на изменение условий имеет определенный временной лаг.

Простейшей моделью автокорреляции ошибок является следующая:

Ɛt = r Ɛt-1+ut, i=1,….,n,

где |r | 1, а ut, i=1,2….,n – независимые в совокупности случайные величины, имеющие одно и то же нормальное распределение.

Следовательно, r - коэффициент корреляции между двумя соседними случайными величинами Ɛt и Ɛt-1.

Тогда можно сделать следующую интерпретацию полученных значений r:

r>0 – автокорреляция положительная; r 0 - автокорреляция отрицательная; r =0- автокорреляция отсутствует.

Коэффициент автокорреляции остатков первого порядка рассчитывается по формуле:

.

7.2. Методы обнаружения автокорреляции

Существует несколько вариантов обнаружения автокорреляции.

1. Графический метод. Для этого необходимо построить

87

график остатков, в которых по оси абсцисс откладываются моменты (или порядковые номера) наблюдений, а по оси ординат — остатки (рисунок 3).

Рисунок 3. Варианты поведения данных в зависимости от периода

Согласно изображенным данным на рисунке, видно, что

ввариантах а, б, в возможно наличие автокорреляции.

2.Критерий Дарбина-Уотсона. Статистика ДарбинаУотсона (DW) предусмотрена во многих программных продуктах, как важнейшая характеристика качества регрессионной модели. Для установления автокорреляции используется следующая формула:

.

Эта статистика тесно связана с выборочным коэффициентом корреляции между соседними остатками (коэффициен-

88

том автокорреляции первого порядка, т е. парного коэффициента корреляции между рядами):

d 2 (1-r).

Интерпретация полученных значений следующая:

1.Если автокорреляция отсутствует, то d 0;

2.Если автокорреляция положительная, то 0 d ≤ 2;

3.Если автокорреляция отрицательная, то 2 d ≤ 4. Величину критерия вычислим по формуле:

где n - число наблюдений в модели;

V - квадрат стандартной ошибки при лаговой результативной переменной У t-1.

Проверка гипотезы осуществляется с помощью таблицы критических значений Дарбина -Уотсона: dU = dU (α, k, n) и d1 = d1 (α, k, n), которые определяются по значениям входных параметров α, k, n (приложение 4)

При проверке гипотезы Н0:r = 0 против гипотезы H1*: r > 0 гипотеза об отсутствии автокорреляции первого порядка принимается, если выполняется неравенство dвыч > dU (α, k, n) и гипотеза отклоняется в пользу альтернативной, если dвыч dL (α, k, n).

При проверке гипотезы Н0:r = 0 против гипотезы H1*: r <0 гипотеза об отсутствии автокорреляции первого порядка принимается, если выполняется неравенcтво dвыч 4- dU (α, k, n); гипотеза отклоняется, если dвыч> 4- dU (α, k, n).

При проверке гипотезы Н0:r = 0 против гипотезы H1*: r 0 гипотеза об отсутствии автокорреляции первого порядка принимается, если выполняется неравенcтво 4- dU (α/2, k, n) > dвыч > dU (α/2, k, n); гипотеза отклоняется, если dвыч> 4- dL (α/2, k, n) или dвыч dL (α/2, k, n).

89

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]