Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика практикум.docx
Скачиваний:
149
Добавлен:
26.03.2016
Размер:
1.88 Mб
Скачать

7.2. Парная регрессия на основе метода наименьших квадратов и метода групировок

Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным.

Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии (a0, a1, и a2- в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (a0, a1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

(60)

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

где n - объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр a0показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии a1показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.

Пример.

Имеются следующие данные о размере страховой суммы и страховых возмещений на автотранспортные средства одной из страховых компаний г.Москвы на 01.01.2010 г.

Таблица 32

Зависимость между размером страховых возмещений и страховой суммой на авто-транспорт одной из страховых компаний г. Москвы на 01.01.2010 г.

№ автомобиля в регистре

Объем страхового возмещения (тыс.долл.США), Yi

Стоимость застрахованного автомобиля (тыс.долл.США), Xi

1 2 3 4 5 6 7 8 9 10

0,1 1,3 0,1 2,6 0,1 0,3 4,6 0,3 0,4 7,3

8,8 9,4 10,0 10,6 11,0 11,9 12,7 13,5 15,5 16,7

Итого

17,1

120,1

Предположим наличие линейной зависимости между рассматриваемыми признаками.

Построим расчетную таблицу для определения параметров линейного уравнения регрессии объема страхового возмещения (табл. 33).

Таблица 33

Расчетная таблица для определения параметров уравнения регрессии

№ автомобиля в регистре

Объем страхового возмещения (тыс.долл.США), Yi

Стоимость застрахованного автомобиля (тыс.долл.США), Xi

x2

xy

1 2 3 4 5 6 7 8 9 10

0,1 1,3 0,1 2,6 0,1 0,3 4,6 0,3 0,4 7,3

8,8 9,4 10,0 10,6 11,0 11,9 12,7 13,5 15,5 16,7

77,44 88,36 100,00 112,36 121,00 141,61 161,29 182,25 240,25 278,89

0,88 12,22 1,00 27,56 1,10 3,57 58,42 4,05 6,20 121,91

0,052 0,362 0,672 0,982 1,188 1,653 2,066 2,479 3,513 4,133

Итого

17,1

120,1

1503,45

236,91

17,100

Система нормальных уравнений для данного примера имеет вид:

Отсюда: a0=-4,4944; a1= ,5166.

Следовательно, =-4,4944+0,5166x.

Значения в таблице 33 получены путем простой подстановки значений факторного признака xi(стоимость застрахованного автомобиля) в уравнение регрессии=-4,4944+0,5166x.

Коэффициент регрессии a1=0,5166 означает, что при увеличении стоимости застрахованного автомобиля на 1 тыс.долл.США, объем страхового возмещения (тыс.долл.США) возрастет в среднем на 0,5166 тыс.долл. США