- •Тема 1. Природа эконометрики
- •1.1. Общие понятия эконометрических моделей
- •1. 2. Типы эконометрических моделей
- •1. 3. Типы данных
- •Тема 2. Корреляционный анализ в эконометрических исследованиях
- •2.1. Функциональная, статистическая и корреляционная зависимости
- •2.2. Понятие о двумерном корреляционном анализе
- •2.3. Понятие о многомерном корреляционном анализе
- •2.4. Ранговая корреляция
- •Тема 3. Регрессионный анализ в эконометрических исследованиях
- •3.1. Задача регрессионного анализа
- •3.2. Идентификация модели регрессии
- •3.3. Линейная парная регрессия и оценка параметров
- •3.4. Проверка значимости параметров линейной парной регрессии
- •3.5. Интервалы прогноза по линейному уравнению регрессии
- •3.6. Нелинейная регрессия
- •3.7. Корреляционное отношение и индекс корреляции
- •3.8. Множественный регрессионный анализ
- •4.9. Ковариационная матрица и ее выборочная оценка
- •4.10. Определение доверительных интервалов для коэффициентов и функции множественной регрессии
- •4.11. Мультиколлинеарность
- •Тема 5. Методы и модели анализа динамики экономических процессов
- •5.1. Понятия экономических рядов динамики
- •5.2. Предварительный анализ динамических рядов экономических показателей
- •5.3. Сглаживание динамических рядов
- •4.3. Расчет показателей динамики развития эконометрических процессов
- •4.4. Тренд-сезонные экономические процессы и их анализ
- •Тема 5. Модели прогнозирования экономических процессов
- •5.7. Трендовые модели на основе кривых роста
- •5.2. Оценка адекватности и точности трендовых моделей
- •5.3. Прогнозирование экономической динамики на основе трендовых моделей
- •5.4. Адаптивные модели прогнозирования
- •Лучшая модель ар(1,1)
- •Характеристика остатков
- •Тема 8. Системы взаимозависимых эконометрических моделей
- •8.1. Особенности систем взаимозависимьех моделей
- •8.2. Формы представления систем взаимозависимых эконометрических моделей
- •8.3. Косвенный метод оценки коэффициентов структурной формы систем взаимозависимых эконометрических моделей
- •8.4. Оценивание параметров структурной формы на основе двухшагового мнк с использованием инструментальных переменных
- •1. На первом шаге конструируются новые значения зависимых
- •2. На втором шаге значения используются вместо значений
- •8.5. Оценки параметров системы взаимозависимых эконометрических моделей с использованием трехшагового мнк
3.7. Корреляционное отношение и индекс корреляции
Введенный выше коэффициент корреляции, как уже отмечено, является полноценным показателем тесноты связи лишь в случае линейной зависимости между переменными. Однако часто возникает необходимость в достоверном показателе интенсивности связи при любой форме зависимости.
Для получения такого показателя вспомним правило сложения дисперсий (8.12):
, (3.37)
где общая дисперсия переменной
, (3.38)
средняя групповых дисперсий , или остаточная дисперсия
, (3.39)
, (3.40)
межгрупповая дисперсия
. (3.41)
Остаточной дисперсией измеряют ту часть колеблемости Y, которая возникает из-за изменчивости неучтенных факторов, не зависящих от X. Межгрупповая дисперсия выражает ту часть вариации Y, которая обусловлена изменчивостью X. Величина
(3.42)
получила название эмпирического корреляционного отношения Y по X. Чем теснее связь, тем большее влияние на вариацию переменной Y оказывает изменчивость X по сравнению с неучтенными факторами, тем выше . Величина , называемаяэмпирическим коэффициентом детерминации, показывает, какая часть общей вариации Y обусловлена вариацией X. Аналогично вводится эмпирическое корреляционное отношение X по Y.
. (3.43)
Отметим основные свойства корреляционных отношений (при достаточно большом объеме выборки n):
1. Корреляционное отношение есть неотрицательная величина, не превосходящая .
2. Если , то корреляционная связь отсутствует.
3. Если , то между переменными существует функциональная зависимость.
4. , т.е. в отличие от коэффициента корреляции r (для которого ) при вычислении корреляционного отношения существенно, какую переменную считать независимой, а какую — зависимой.
Эмпирическое корреляционное отношение является показателем рассеяния точек корреляционного поля относительно эмпирической линии регрессии, выражаемой ломаной, соединяющей значения Однако в связи с тем, что закономерное изменение нарушается случайными зигзагами ломаной, возникающими вследствие остаточного действия неучтенных факторов, преувеличивает тесноту связи. Поэтому наряду срассматривается показатель тесноты связи характеризующий рассеяние точек корреляционного поля относительно линии регрессии (3.3). Показатель получил названиетеоретического корреляционного отношения или индекса корреляции Y по X:
. (3.44)
где дисперсии и определяются по формулам (12.54)— (12.56), в которых групповые средние заменены условными средними , вычисленными по уравнению регрессии(12.16).
Подобно вводится и индекс корреляции X по Y:
. (3.45)
Достоинством рассмотренных показателей и R является то, что они могут быть вычислены при любой форме связи между переменными. Хотя и завышает тесноту связи по сравнению сR, но для его вычисления не нужно знать уравнение регрессии. Корреляционные отношения и R связаны с коэффициентом корреляции r следующим образом:
. (3.46)
Коэффициент детерминации R2, равный квадрату индекса корреляции (для парной линейной модели ), показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной.
Чем ближе R2 к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии. Если R2 = 1, то эмпирические точки (x, y) лежат на линии регрессии и между переменными YиX существует линейная функциональная зависимость. Если R2 = 0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных, и линия регрессии параллельна оси абсцисс.
Расхождение между и (или ) может быть использовано для проверки линейности корреляционной зависимости.
Проверка значимости корреляционного отношения основана на том, что статистика
(3.47)
имеет распределение Фишера—Снедекораи степенями свободы. Поэтому значимо отличается от нуля, если , гдетабличное значениекритерия на уровне значимостипри числе степеней свободыи .
Индекс корреляции R двух переменных значим, если значение статистики
(3.48)
больше табличного , гдеи .
Пример 12.8. Рассмотрим в качестве примера зависимость между суточной выработкой продукции Y (т) и величиной основных производственных фондов (ОПФ) X (млн руб.) для совокупности 50 однотипных предприятий (12.1). По данным таблицы вычислить корреляционное отношение и индекс корреляции и проверить их значимость на уровне .
Таблица 12.1
Величина ОПФ, млн руб. (X) |
Середины интервалов |
|
Всего
|
Групповая средняя, т
| ||||||
7-11 |
11-15 |
15-19 |
19-23 |
23-27 |
|
| ||||
|
9 |
13 |
17 |
21 |
25 |
|
| |||
20-25 25-30 30-35 35-40 40-45 |
22,5 27,5 32,5 37,5 42,5 |
2 3 - - - |
1 6 3 1 - |
- 4 11 2
|
- - 7 6 1 |
- - - 2 1 |
3 13 21 11 2 |
10,3 13,3 17,8 20,3 23,0 | ||
Всего |
- |
5 |
11 |
17 |
14 |
3 |
50 |
| ||
Групповая средняя , млн руб. |
- |
22,5 |
29,3 |
31,9 |
35,4 |
39,2 |
- |
- |
В таблице через и обозначены середины соответствующих интервалов, аисоответственно их частоты.
В таблице групповые средние получены по формулам:
; .
Решение. По данным табл. 12.1 на первом этапе вычислим общую среднюю признака y, для этого воспользуемся формулой:
.
Для вычисления общей дисперсии воспользуемся известной формулой:
Межгрупповую дисперсию получим по формуле (12.57):
Эмпирическое корреляционное отношение получим по формуле (1.58):
Теперь по (12.57) =517,8/50 = 10,36 и по (12.58)
. Значение близко к величине 0,740 (полученной ранее в примере 12.3). Поэтому оправдано сделанное выше на основании графического изображения эмпирической линии (ломаной) регрессии предположение о линейной корреляционной зависимости между переменными.
Для расчета по уравнению регрессии(см. пример12.1) находим значения , представленные в предпоследней графе табл. 12.4. Затем аналогичнои. Как и следовало ожидать, оказался равным (небольшое расхождение объясняется округлением промежуточных результатов при вычислении . Поэтому в случае линейной связи нет смысла вычислять , а достаточно ограничиться вычислением . Величина коэффициента детерминации показывает, что вариация зависимой переменнойY (суточной выработки продукции) на 55,1% объясняется вариацией независимой переменной Х (величиной основных производственных фондов).
Для проверки значимости , учитывая, что количество интервалов по группировочному признаку , по (12.63)
.
Табличное значение . Так как, то значимо отличается от нуля. Аналогично проверяется значимость найдем . По (12.64) . Так как, то индекс корреляциизначим.