- •1.2. Типы моделей
- •1.3. Типы данных
- •1.4. История
- •1.5. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •2. Парная регрессия и корреляция. Свойства коэффициентов регрессии и проверка гипотез
- •2.1. Задачи корреляционно-регрессивного анализа
- •Содержательный характер задач корреляционно-регрессивного метода
- •2.2. Вычисление и интерпретация параметров парной линейной корреляции
- •2.3. Статистическая оценка надёжности параметров парной корреляции
- •2.4. Применение парного линейного уравнения регрессии
- •Коэффициент корреляции рангов
- •2.5. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •3. Множественная регрессия
- •3.1. Формулы для коэффициентов и стандартных ошибок
- •3.2. Множественная регрессия и оценка параметров Кобба-Дугласа
- •3.3. Мультиколлинеарность
- •3.4. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •4. Выбор уравнения
- •4.1. Влияние отсутствия необходимой переменной
- •4.2. Лишняя переменная
- •4.3. Замещающие переменные
- •4.4. Лаговые переменные
- •4.5. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •5. Фиктивные переменные
- •5.1. Фиктивные и нефиктивные переменные в регрессии
- •5.2. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •6. Гетероскедастичность
- •6.1. Коэффициент ранговой корреляции Спирмена (кркс)
- •6.2. Тест Голдфелда-Куандта
- •6.3. Тест Глейзера
- •6.4. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •7. Автокорреляция
- •7.1. Поправка Прайса–Уинстена
- •7.2. Процедура Кохрана–Оркатта
- •7.3. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •8. Модели временных рядов
- •8.1. Модели рядов, содержащих сезонную компоненту
- •Ответы к тесту:
- •9. Автоковариационная и автокорреляционная функции, их свойства. Коррелограмма
- •9.1. Спектральная плотность
- •9.2. Спектральный (Фурье) анализ
- •9.3. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •10. Неслучайная составляющая временного ряда
- •10.1. Проверка гипотезы о неизменности среднего значения временного ряда
- •10.2. Метод экспоненциально взвешенного скользящего среднего (метод Брауна [Brown (1963)])
- •10.3. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •11. Стационарные временные ряды и их идентификация
- •11.1. Основные понятия
- •11.2 Модели скользящего среднего сс(1) и сс(2). Двойственность. Обратимость. Идентификация
- •11.3. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •12. Лаговые переменные. Нестационарные временные ряды и их идентификация
- •12.1. Модель авторегрессии-проинтегрированного скользящего среднего (arima(p, k, q)-модель)
- •12.2. Модели рядов, содержащих сезонную компоненту
- •12.3. Полиномиальная лаговая структура Ширли Алмон
- •12.4. Геометрическая лаговая структура Койка
- •12.5. Модель частичного приспособления
- •12.6. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •13. Предсказания
- •13.1 Основные понятия
- •13.2. Доверительные интервалы и интервалы предсказания
- •13.3. Критерий г. Чоу
- •13.4. Коэффициент Тейла
- •13.5. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •14. Модели в виде систем линейных одновременных уравнений и их идентификация
- •14.1. Основные понятия
- •14.2. Тестовые задания для самостоятельной работы
- •Ответы к тесту:
- •14.3. Использование эконометрической модели при исследовании зависимости затрат от объёма производства и структуры продукции на примере конкретного предприятия
- •Расчетное задание 1 «Построение уравнений парной регрессии и оценка их значимости»
- •Варианты лабораторных задач Задание
- •Расчетное задание 2. «Построение уравнений линейной множественной регрессии и оценка его значимости» Задача
- •Варианты лабораторных задач
- •Глоссарий
- •Библиографисеский список
- •Оглавление
- •1.1.Модели 3
- •10.1. Проверка гипотезы о неизменности среднего значения временного ряда 88
- •Эконометрика Учебное пособие
Коэффициент корреляции рангов
К мерам тесноты парной связи относится предложенный Спирменом коэффициент корреляции рангов. Ранги – это порядковые номера единиц совокупности в ранжированном ряду. Если проранжировать совокупность по двум признакам, связь между которыми изучается, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность – максимально тесную обратную связь. Ранжировать оба признака необходимо в одном и том же порядке либо от меньших значений признака к большим, либо наоборот. Если ранги единиц совокупности по признакам X и Y обозначим как Px, Py, то коэффициент корреляции рангов равен:
(2.18)
– средние ранги в ряду натуральных чисел от 1 до n. Причём они равны: , а знаменатель формулы есть:
.
Обозначим: di = Px – Py, тогда:
– формула Спирмена (2.19)
Преимущество коэффициента корреляции рангов состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить числами. Пример: умение руководить коллективом , по личному обаянию.
Недостаток – одинаковым разностям ранга могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков). Если среди значений признаков х и у встречается несколько одинаковых, образуются связанные ранги, т.е. одинаковые средние номера. Тогда коэффициент Спирмена вычисляется по формуле:
(2.20)
где ,
j – номер связок по порядку для признака х;
k – номер связок по порядку для признака у;
Aj – число одинаковых рангов в j – той связке по х;
Bk – число одинаковых рангов в k – той связке по у.
Пример 2.1.
Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х) в тыс. ед. и о расходе условного топлива (у) в тоннах (графы 1 и 2 таблицы).
Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии у по х) и измерить тесноту зависимости между ними.
Решение.
А. Рассматривая уравнение регрессии в форме линейной функции вида параметры данного уравнения (а0 и а1) найдем из системы нормальных уравнений
Таблица 2.1
i |
x |
y |
x2 |
ху |
|
y2 |
|
1 |
2 |
3 |
4 |
5 |
6 |
1 |
5 |
4 |
25 |
20 |
3,9 |
16 |
2 |
6 |
4 |
36 |
24 |
4,4 |
16 |
3 |
8 |
6 |
64 |
48 |
5,5 |
36 |
4 |
8 |
5 |
64 |
40 |
5,5 |
25 |
5 |
10 |
7 |
100 |
70 |
6,6 |
49 |
6 |
10 |
8 |
100 |
80 |
6,6 |
64 |
7 |
14 |
8 |
196 |
112 |
8,8 |
64 |
8 |
20 |
10 |
400 |
200 |
12,1 |
100 |
9 |
20 |
12 |
400 |
240 |
12,1 |
144 |
10 |
24 |
16 |
576 |
384 |
14,3 |
256 |
Σ |
125 |
80 |
1961 |
1218 |
80 |
770 |
Необходимые для решения суммы рассчитаны выше в таблице. Подставляем их в уравнения и решаем систему:
;
Отсюда
Подставляя в это уравнение последовательно значения х= 5, 6, 8, 10 и т.д., получаем выравненные (теоретические) значения результативного показателя (графа 5 таблицы).
Поскольку параметры уравнения регрессии являются оценочными, то для каждого из них рассчитывается средняя ошибка, т.е. .
Конкретный расчет ошибок для а0 и а1 по данным нашего примера приведен далее.
Б. Для измерения тесноты зависимости между у и х воспользуемся прежде всего линейным коэффициентом корреляции (поскольку зависимость рассматривалась линейной):
а) применяем формулу .
Находим, Определяем и , предварительно найдя и :
Отсюда
Значение линейного коэффициента корреляции r = 0,96 (т.е. близкое к единице) характеризует не только меру тесноты зависимости вариации у от вариации х, но и степень близости этой зависимости к линейной;
б) воспользуемся еще одной формулой линейного коэффициента корреляции:
т.е. результат от же.
При расчете коэффициента корреляции очень важно оценить его значимость. Оценка значимости (существенности) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой ( ).
Средняя ошибка коэффициента корреляции при п 50 рассчитывается приближенно по формуле
Если при этом коэффициент корреляции r превышает свою
среднюю ошибку больше чем в 3 раза, т.е. если , то он считается значимым, а связь – реальной.
При п 30 значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого рассчитывается фактическое (расчетное) значение критерия:
которое сопоставляется , определяемым по таблицам Приложений учебных пособий по эконометрики, для числа степеней свободы и заданного уровня значимости (обычно ).
Если r считается значимым, а связь – реальной. Если , то считается, что связь между х и у отсутствует и значение r, отличное от нуля, получено случайно.
В рассматриваемом примере средняя ошибка коэффициента корреляции
,
А
По таблице Приложения 9 находим, что при числе степеней свободы и уровне значимости табличное (критическое, пороговое) t равно 2,306, т.е. ( = 2,306).
Поскольку фактическое (расчетное) t больше табличного, т.е. , то линейный коэффициент корреляции r=0,96 считается значимым, а cвязь между х и у – реальной.
В. Кроме линейного коэффициента корреляции для измерения тесноты зависимости можно воспользоваться теоретическим корреляционным отношением:
где σ2 и δ2 – дисперсии соответственно теоретических и эмпирических значений результативного показателя. Расчет их показан ниже в таблице.
Таблица 2.2
i |
x |
y |
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
5 |
4 |
3,9 |
-4 |
16 |
-4,1 |
16,81 |
0,1 |
0,01 |
2 |
6 |
4 |
4,4 |
-4 |
16 |
-3,6 |
12,96 |
-0,4 |
0,16 |
3 |
8 |
6 |
5,5 |
-2 |
4 |
-2,5 |
6,25 |
0/5 |
0,25 |
4 |
8 |
5 |
5,5 |
-3 |
9 |
-2,5 |
6,25 |
-0,5 |
0,25 |
5 |
10 |
7 |
6,6 |
-1 |
1 |
-1,4 |
1,96 |
0,4 |
0,16 |
6 |
10 |
8 |
6,6 |
0 |
0 |
-1,4 |
1,96 |
1,4 |
1,96 |
7 |
14 |
8 |
8,8 |
0 |
0 |
0,8 |
0,64 |
-0,8 |
0,64 |
8 |
20 |
10 |
12,1 |
2 |
4 |
4,1 |
16,81 |
-2,1 |
4,41 |
9 |
20 |
12 |
12,1 |
4 |
16 |
4,1 |
16,81 |
-0,1 |
0,01 |
10 |
24 |
16 |
14,3 |
8 |
64 |
6,3 |
39,69 |
. 1,7 |
2,89 |
Σ |
125 |
80 |
80 |
– |
130 |
– |
120,14 |
– |
10,74 |
Дисперсия выравненных значений результативного показателя,
или факторная дисперсия, общая дисперсия эмпирических значений результативного показателя теоретическое корреляционное отношение
Рассчитанные показатели позволяют сделать вывод о том, что связь между вариацией результативного показателя (у) и факторного (х) весьма высокая.
Вместо дисперсии выравненных значений у, т.е. δ2, можно воспользоваться остаточной дисперсией. В соответствии с правилом сложения дисперсий можно записать, что , где
тогда
В нашем примере расчет остаточной дисперсии (σ2ост) показан в графах 8 и 9 таблицы: σ2ост = 1,074. Отсюда
.
Остаточная дисперсия, вернее, корень квадратный из нее, т.е. σост, используется для расчета средних ошибок параметров уравнения регрессии. Так, средняя ошибка параметра а0, равна а для а1, равна
Сопоставляя значение параметра с его средней ошибкой, по значению судят о значимости данного параметра. Если число наблюдений п 20, то параметр считается значимым при t 3.
Если n 20, то обращаются к специальном таблицам значений критерия Стьюдента. И в данном случае параметр считается значимым, если .
В рассмотренном примере для уравнения регрессии = 1,16 + 0,547х ошибки параметров
т.е а0=1,16±0,366,
, т.е а1=0,547±0,058.
Чтобы сделать вывод о значимости параметров, находим
и .
Так как п 20, обращаемся к таблице значений t-критерия. Для и находим =2,306. Поскольку t 2,306 и для aо, и для a1, то считаем параметры значимыми.
В приведенных формулах ошибок параметров и | вместо остаточной дисперсии σ2ст можно пользоваться значением линейного коэффициента корреляции, исходя из следующих преобразований:
;
Разделив обе части равенства на получим . Отсюда . Тогда а
Наряду с проверкой значимости отдельных параметров можно оценить значимость уравнения регрессии в целом.
Эта задача решается на основе расчета F-критерия Фишера и сопоставления его с табличным (критическим), F-критерий представляет собой отношение факторной дисперсии ( ) к остаточной ( ), каждая из которых рассчитана на одну степень свободы:
где т – число параметров в уравнении регрессии;
(m-1) – число степеней свободы для факторной дисперсии;
п – число наблюдений;
(n-m) – число степеней свободы для остаточной дисперсии. Часто формула F-критерия записывается в виде
где k – число коэффициентов регрессии, которое на единицу меньше числа параметров, т.е.k = m-1
F – критерий можно рассчитать и через коэффициент корреляции (r или η):
Расчетное F сопоставляется с табличным, определяемым по Приложению 8 для числа степеней свободы и при заданном уровне значимости (например, ).
Если уравнение считается значимым.
Для рассмотренного выше примера
По Приложению 8 находим Fта6л: при и , Fтабл = 5,32.
Так как то уравнение значимо.