- •Тема 2. Парная корреляция и регрессия.
- •1. Понятие о корреляционной связи
- •2. Условия применения и задачи корреляционно-регрессионного анализа и моделирования
- •Задачи корреляционно-регрессионного анализа и моделирования
- •3. Парная регрессия и корреляция в эконометрических исследованиях.
- •4.Парная линейная корреляция.
- •Применение нелинейных моделей в эконометрических исследованиях
3. Парная регрессия и корреляция в эконометрических исследованиях.
Простая (парная) регрессия представляет собой регрессию между двумя переменными – у и х, т.е. модель вида
y = (x),
где у – зависимая переменная (результативный признак);
х – независимая, или объясняющая, переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия: y = a+b*x+.
Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам:
полиномы разных степеней y = a+b1*x+b2*x2+b3*x3+e
равносторонняя гипербола y = a+b/x+e и регрессии, нелинейные по оцениваемым параметрам
степенная y = a*xb *e
показательная y = a*bx *e
экспоненциальная y = e a+b*x *e
Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными: из всего круга факторов, влияющих на результат, необходимо выделить наиболее существенно влияющие факторы; кроме того, необходимо знать, какие остальные факторы предполагают неизменными, поскольку возможно, в дальнейшем их придется учесть в модели и от простой регрессии перейти к множественной.
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых: y = ŷ+e,
где y – фактическое значение результативного признака;
ŷ – теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х, т.е. из уравнения регрессии;
e – случайная величина, характеризующая отклонение реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Случайная величина e называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками:
1. Спецификацией модели, От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретическое значение результативного признака ŷx подходят к фактическим данным y. К ошибкам спецификации будут относиться не только неправильный выбор математической функции, но и недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной.
2. Выборочным характером исходных данных. Ошибки выборки имеют место в силу неоднородности данных в исходной статистической совокупности. Если совокупность неоднородна, то уравнение регрессии не имеет практического смысла. Для получения хорошего результата обычно исключают из совокупности единицы с аномальными значениями исследуемых признаков. И в этом случае результаты регрессии представляют собой выборочные характеристики.
3. Ошибки измерения. Представляют наибольшую опасность (ошибки спецификации можно уменьшить, изменяя форму модели; выборки – увеличивая объем исходных данных):
инструментальные ошибки, возникающие из-за дефектов измерительной аппаратуры;
связанные с состоянием внешней среды, в которой производятся измерения;
обусловленные индивидуальными особенностями экспериментатора (субъективные);
вносимые самим методом постановки эксперимента из-за приближенности теоретических соотношений, связывающих наблюдаемые на опыте величины с величинами, непосредственно интересующими экспериментатора;
сознательное искажение исходной информации (баланс предприятия, достоверность которых не подтверждается и т.д.)
Предполагая, что ошибки измерения сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.
В парной регрессии выбор вида математической функции y = (x) может быть осуществлен тремя методами:
графический – достаточно нагляден, основан на поле корреляции
аналитический (т.е. исходя из теории изучаемой взаимосвязи), основан на изучении материальной природы связи исследуемых признаков.
экспериментальный, выбор типа уравнения обычно осуществляется при обработке информации на компьютере путем сравнения величины остаточной дисперсии, рассчитанной при различных моделях: Dост.=
Величина остаточной дисперсии характеризует влияние прочих не учтенных в модели факторов. Чем меньше величина остаточной дисперсии, тем в меньшей степени наблюдается влияние прочих не учитываемых в модели факторов и данное уравнение регрессии лучше подходит к исходным данным.
Если величина остаточной дисперсии примерно одинакова для различных моделей, то предпочтение отдается более простым функциям, т.к. они в большей степени поддаются интерпретации и требуют меньшего объема наблюдений.