- •Тема 1. Предмет, задачи, особенности эконометрики 7
- •Тема 2. Корреляционный и регрессионный анализ – математический метод оценки взаимосвязей экономических явлений 12
- •Введение
- •Тема 1. Предмет, задачи, особенности эконометрики
- •1.1 Cведения об истории возникновения эконометрики
- •1.2. Предмет эконометрики
- •1.3. Особенности эконометрического анализа
- •1.4. Измерения в экономике
- •Строится простая (парная) регрессия в случае, когда среди факторов, влияющих на результативный показатель, есть явно доминирующий фактор.
- •2.1.2. Линейная регрессия сущность, оценка параметров
- •2.1.3. Определение тесноты связи и оценка существенности уравнения регрессии
- •2.1.4 Интервальный прогноз на основе линейного уравнения регрессии
- •2.2. Нелинейная регрессия в экономике и ее линеаризация
- •2.2.1. Виды нелинейных регрессионных моделей, расчет их параметров
- •2.2.2. Оценка корреляции для нелинейной регрессии
- •2.3. Множественная регрессия и корреляция
- •2.3.1. Множественная регрессия. Отбор факторов при построении ее модели На любой экономической показатель чаще всего оказывает влияние не один, а несколько факторов.
- •2.3.2. Расчет параметров и характеристик модели множественной регрессии
- •2.3.3. Частные уравнения множественной регрессии. Индексы множественной и частной корреляции и их расчет
- •2.3.4. Обобщённый метод наименьших квадратов. Гомоскедастичность и гетероскедастичность
- •Тема 3. Информационные технологии в эконометрических исследованиях
- •Сводные экономические показатели рд за 1990-2000 гг.
- •Тема 4. Системы эконометрических уравнений
- •4.1. Понятие о системах эконометрических уравнений
- •Приравнивая это с правой частью 2-го уравнения (4.1) получаем
- •4.2. Проблема идентификации модели
- •4.3. Методы оценки параметров одновременных уравнений
- •Тема 5. Методы и модели анализа динамики экономических процессов
- •5.1. Понятие экономических рядов динамики. Сглаживание временных рядов
- •5.2. Автокорреляционная функция. Коррелограмма
- •5.3. Автокорреляция в остатках. Критерий Дарбина-Уотсона
- •5.4. Моделирование тенденций временного ряда. Адаптивные модели прогнозирования
- •Обычно полагают
- •Тема 6. Макро- и региональные эконометрические модели
- •6.1. Макроэконометрические модели
- •Рассмотрим мультипликативную производственную функцию
- •6.2. Сущность и особенности региональных эконометрических моделей
- •6.3. Филадельфийская модель региональной экономики
- •Тема 7. Моделирование динамических процессов
- •7.1. Характеристика моделей с распределенным лагом и моделей авторегрессии
- •7.2. Выбор вида модели с распределительным лагом
- •7.3. Модели адаптивных ожиданий и неполной корректировки
- •Приложения
- •1. Базовые понятия теории вероятностей
- •1.1. Вероятность. Случайная величина
- •1.2. Числовые характеристики случайных величин
- •1.3. Законы распределений случайных величин
- •2. Базовые понятия статистики
- •2.1. Генеральная совокупность и выборка
- •2.2. Вычисление выборочных характеристик
- •3.Статистические выводы: оценки и проверка гипотез
- •4. Статистическая проверка гипотез
- •Литература
- •Эконометрике
- •Махачкала – 2008
- •Введение.
- •Лабораторная работа №1. «Корреляционный и регрессионный анализ – математический метод оценки взаимосвязей экономических явлений» Часть 1. Парная регрессия и корреляция.
- •1.1. Методические указания
- •1.2 Реализация типовых задач на компьютере.
- •Часть 2. Множественная регрессия и корреляция.
- •2.1. Методические указания
- •Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции
- •Выбор вида модели и оценка ее параметров
- •Проверка качества модели
- •Оценка влияния отдельных факторов на основе модели на зависимую переменную (коэффициенты эластичности и
- •Использование многофакторных моделей для анализа и прогнозирования развития экономических систем
- •2.2.Технология решения задач корреляционного и регрессионного анализа с помощью пакета анализа.
- •Лабораторная работа №2 «Анализ и прогнозирование временных рядов в среде Excel»
- •1. Основные понятия и определения.
- •2. Анализ временных рядов с помощью инструмента Excel-Мастер Диаграмм
2.1.3. Определение тесноты связи и оценка существенности уравнения регрессии
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такового показателя выступает линейный коэффициент корреляции r. Одна из формул линейного коэффициента корреляции имеет вид:
Коэффициент корреляции находится в пределах: . Если b>0, то 0<r<1, и, наоборот, при b<0, -1< r<0.
Линейный коэффициент корреляции оценивает тесноту связи рассматриваемых признаков в ее линейной форме. Поэтому близость абсолютного значения линейного коэффициента корреляции к нулю еще не означает отсутствие связи между признаками. При нелинейном виде модели связь может оказаться достаточно тесной.
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:
Соответственно величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.
Пусть = 0,982. Таким образом, уравнением регрессии объясняется 98,2% дисперсии результативного признака, а на долю прочих факторов приходится лишь 1,8% ее дисперсии (т.е. остаточная дисперсия). Величина коэффициента детерминации является одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные, и ею можно воспользоваться для прогноза значений результативного признака. Так, полагая, что объем продукции предприятия, составляет 5 тыс. ед., прогнозное значение для издержек производства — 178,4 тыс. руб.
Линейный коэффициент корреляции по содержанию отличается от коэффициента регрессии. Выступая показателем силы связи, коэффициент регрессии b на первый взгляд может быть использован как измеритель ее тесноты. Из уравнений и видно, что во втором случае результат у изменяется сильнее с ростом фактора на единицу - эта величина в 10 раз больше, чем в первом случае. Однако вывод о более сильном влиянии фактора x на результат у прежде времен. Величина коэффициента регрессии зависит от единиц измерения переменных, от размерности признаков. Если предположить, что х выражен в центнерах и , а фактор z по экономическому содержанию выражен в тоннах и , то понятно, что по данным обоих уравнений , а разные значения коэффициентов регрессии обусловлены разными единицами измерения одного и того же фактора. Кроме того, коэффициенты регрессии - величины именованные, и потому несравнимы для разных признаков. Так, коэффициент регрессии по модели прибыли предприятия от состава выпускаемой продукции несопоставим с коэффициентом регрессии прибыли предприятия от затрат на рекламу.
Линейный коэффициент корреляции как измеритель тесноты линейной связи признаков логически связан не только с коэффициентом регрессии b, но и с коэффициентом эластичности, который является показателем силы связи, выраженным в процентах. При линейной связи признаков х и у средний коэффициент эластичности в целом по совокупности определяется как т.е. его формула по построению близка к формуле линейного коэффициента корреляции . Как и линейный коэффициент корреляции, коэффициент эластичности сравним по разным признакам. Если , а , то можно заключить, что фактор х в большей мере влияет на результат у, чем фактор z, ибо с ростом х на 1% y возрастает на 0,8%, а с ростом z на 1 % — только на 0,2%.
Несмотря на схожесть этих показателей, измерителем тесноты связи выступает линейный коэффициент корреляции , а коэффициент регрессии (bу/х) и коэффициент эластичности — показатели силы связи: коэффициент регрессии является абсолютной мерой, ибо имеет единицы измерения, присущие изучаемым признакам у и х, а коэффициент эластичности - относительным показателем силы связи, потому что выражен в процентах.
Пусть уравнение регрессии составило . При этом известно, что , тогда . Коэффициент эластичности составит: Эу/х = 3 * 20/50 = 1,2%, т. е. с ростом х на 1% у возрастает в среднем на 1,2%. Предположим, что , а , тогда
, т.е. связь признаков достаточно тесная. Если же примет значение 12, что соответствует более сильной колеблемости результата, тогда значение окажется равным лишь 0,5 при том же значении коэффициента эластичности. Таким образом, при одной и той же величине коэффициента эластичности может быть разный коэффициент корреляции в зависимости от соотношения колеблемости x и y . Чем в большей мере колеблемость результата зависит от вариации фактора, т. е. чем ближе величина к значению , тем теснее связь между признаками.
Несмотря на всю важность измерителя тесноты связи, в эконометрике больший практический интерес приобретает коэффициент детерминации , ибо он дает относительную меру влияния фактора на результат, фиксируя одновременно и роль ошибок, т. е. случайных составляющих в формировании моделируемой переменной. Чем ближе коэффициент детерминации к 1 , тем в большей степени уравнение регрессии пригодно для прогнозирования.
После того как построено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных ее параметров.
Оценка значимости уравнения регрессии в целом производится с помощью F-критерия Фишера.
С F-критерием тесно связана характеристика, называемая числом степеней свободы, которая применительно к исследуемой проблеме показывает, сколько независимых отклонений из n-возможных требуется для образования данной суммы квадратов.
Существует равенство между числом степеней свободы общей, факторной и остаточной суммы квадратов.
Число степеней свободы для факторной суммы квадратов равно 1, для общей суммы квадратов равно (n-1), для остаточной суммы квадратов составляет (n-2).
Р азделив каждую сумму квадратов на соответствующее ей число степеней свободы, получаем дисперсию на одну степень свободы:
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения, т. е. F
критерий
(2.15)
F-статистика используется для проверки нулевой гипотезы Н0: .
Если нулевая гипотеза H0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если H0 несправедлива, то факторная дисперсия превышает остаточную - в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F - отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F - критерия — это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F – отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:
Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска, сделать, неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: .
В рассматриваемом примере 2.1:
- общая сумма квадратов;
- факторная сумма квадратов;
— остаточная сумма квадратов;
Поскольку как при 1%-ном, так и при 5%-ном уровне значимости, можно сделать вывод о значимости уравнения регрессии (связь доказана).
Величина F - критерия связана с коэффициентом детерминации . Факторную сумму квадратов отклонений можно представить как
а остаточную сумму квадратов — как
Тогда значение F - критерия можно выразить следующим образом:
(2.16)
В нашем примере . В таком случае (несовпадение с предыдущим результатом объясняется ошибками округления).
Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл. 2.2).
Таблица 2.2
Дисперсионный анализ результатов регрессии
Источники вариации |
Число степеней свободы |
Сумма квадратов отклонений |
Дисперсия на одну степень свободы |
F-отношение |
|
фактическое |
табличное при α = 0,05 |
||||
Общая |
6 |
15000 |
- |
- |
- |
Объясненная |
1 |
14735 |
14735 |
278 |
6,61 |
Остаточная |
5 |
265 |
53 |
1 |
- |
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: mb и ma.
Стандартная ошибка коэффициента регрессии параметра mb рассчитывается по формуле:
(2.17)
где S2 — остаточная дисперсия на одну степень свободы.
Для нашего примера величина стандартной ошибки коэффициента регрессии составила:
Отношение коэффициента регрессии к его стандартной ошибке дает t-статистику, которая подчиняется статистике Стьюдента при (n - 2) степенях свободы. Эта статистика применяется для проверки статистической значимости коэффициента регрессии и для расчета его доверительных интервалов.
Для оценки значимости коэффициента регрессии его величину сравнивают с его стандартной ошибкой, т. е. определяют фактическое значение t - критерия Стьюдента: которое затем сравнивают с табличным значением при определенном уровне значимости а и числе степеней свободы (n - 2).
В рассматриваемом примере фактическое значение t -критерия для коэффициента регрессии составило:
Этот же результат получим после извлечения квадратного корня из найденного ранее F - критерия, т. е.
.
Покажем справедливость равенства
При α = 0,05 (для двустороннего критерия) и числе степеней свободы 5 табличное значение t= 2,57. Поскольку фактическое значение t - критерия превышает табличное, гипотезу о несущественности коэффициента регрессии можно отклонить.
На основе стандартной ошибки может быть рассчитан доверительный интервал – множество значений, определенных как интервал между нижней и верхней границами неравенства.
Доверительный интервал для коэффициента регрессии определяется как . Для коэффициента регрессии b в примере 2.1 95%-ные границы составят:
т.е.
Поскольку коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, . Такого рода запись показывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже нуль, чего не может быть.
Стандартная ошибка параметра а определяется по формуле:
(2.18)
Процедура оценивания значимости данного параметра не отличается от рассмотренной выше для коэффициента регрессии: вычисляется t - критерий:
,
его величина сравнивается с табличным значением при степенях свободы.
Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции :
. (2.19)
Фактическое значение t - критерия Стьюдента определяется как
. (2.20)
Данная формула свидетельствует, что в парной линейной регрессии , ибо, как уже указывалось, . Кроме того, , следовательно,
Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о значимости линейного уравнения регрессии.
В рассматриваемом примере tr не совпало с tb в результате ошибок округлений. Величина значительно превышает табличное значение 2,57 при α = 0,05. Значит, коэффициент корреляции существенно отличен от нуля, и зависимость является достоверной.
Рассмотренную формулу оценки коэффициента корреляции рекомендуется применять при большом числе наблюдений, а также, если r не близко к + 1 или — 1. Если же величина коэффициента корреляции близка к + 1, то распределение его оценок отличается от нормального, или распределения Стьюдента, так как величина коэффициента корреляции ограничена значениями от -1 до +1. Для того чтобы устранить это затруднение Р.Фишер предложил ввести вспомогательную величину z. (приложение 2, табл. 3), связанную с коэффициентом корреляции следующим отношением:
(2.21)
При изменении r от -1 до +1 величина z изменяется от -∞ до +∞, что соответствует нормальному распределению. Математический анализ доказывает, что распределение величины z мало отличается от нормального даже при близких к единице значениях коэффициента корреляции. Стандартная ошибка величины z рассчитывается по формуле
(2.22)
где n - число наблюдений.
При
Величину z можно не рассчитывать, а воспользоваться готовыми таблицами z - преобразования, в которых приведены значения величины z для соответствующих значений r.
Далее выдвигаем нулевую гипотезу H0 о том, что корреляция отсутствует, т. е. теоретическое значение коэффициента корреляции равно нулю. Коэффициент корреляции значимо отличен от нуля, если т. е. если фактическое значение tz превышает его табличное значение на уровне значимости α= 0,05 или α= 0,01. Иными словами, если коэффициент корреляции значимо отличен от нуля, что имеет место в рассмотренном примере:
при
Ввиду того, что r и z связаны между собой приведенным выше соотношением, можно вычислить критические значения r, соответствующие каждому из значений z. Таблицы критических значений r разработаны для уровней значимости 0,05 и 0,01 и соответствующего числа степеней свободы (приложение 2). Критические значения r предполагают справедливость нулевой гипотезы, т. е. r мало отлично от нуля. Если фактическое значение коэффициента корреляции по абсолютной величине превышает табличное, то данное значение r считается статистически значимым. Если же r оказывается меньше табличного, то фактическое значение r статистически незначимо.
В рассматриваемом примере 2.1 при числе степеней свободы (n - 2) = 5 критическое значение r при α= 0,05 составляет 0,754, а при α= 0,01 — 0,874, что ниже фактической величины rух = 0,991. Следовательно, как было уже доказано, полученное значение r существенно отлично от нуля.