Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

672

.pdf
Скачиваний:
4
Добавлен:
09.01.2024
Размер:
2.55 Mб
Скачать

ствует возможность выделить из них наиболее значимые, подлежащие включению в модель регрессии. В таких случаях принято рассматривать несколько моделей с разным составом факторов. Наилучшей выбирается модель, имеющая значимые параметры и максимальный показатель тесноты связи.

Для построения таких моделей с целью перебора факторов разработаны четыре метода:

1.Метод последовательного включения факторов;

2.Метод исключения факторов из модели;

3.Шаговый регрессионный анализ;

4.Ступенчатый регрессионный анализ.

При использовании метода последовательного включения факторов сначала должна быть построена модель с фактором, который наиболее тесно связан с результатом. Затем, поочередно добавляются другие факторы. После включения каждого фактора обязательно оценивается целесообразность включения нового фактора с точки зрения сокращения остаточной дисперсии.

Использование метода исключения факторов предполагает, что сначала строится модель с максимально большим количеством факторов, из которой поочередно исключаются незначимые факторы до тех пор, пока модель не будет иметь только значимые параметры при факторах.

Шаговый регрессионный анализ является преобразованием метода последовательного включения факторов. Построение модели начинается с расчета параметров уравнения парной регрессии с фактором, который наиболее тесно связан с результатом. Добавление каждого нового фактора сопровождается не только оценкой значимости включения данного фактора, но и проверкой значимости влияния на результат факторов, уже включенных в модель. Выявленные незначи-

50

мые факторы исключаются из модели. Завершение процесса происходит тогда, когда добавление нового фактора не приведет к заметному улучшению качества модели.

Ступенчатый регрессионный анализ начинается с построения уравнения парной регрессии с наиболее значимым по степени влияния на результат фактором. Затем по полученной модели находят случайные остатки ε. По причине того, что эти остатки отражают влияние факторов, не включенных в уравнение регрессии, следует построить уравнение зависимости случайного остатка ε от следующего по степени влияния на результат фактора. Данная процедура повторяется до тех пор, пока вновь полученное уравнение регрессии является значимым. Этот метод является наиболее простым, но не достаточно точным, так как не учитывает взаимосвязь факторов.

Показатели, выбранные в качестве результативного признака и фактора, иногда могут быть неколичественными переменными. В случае если неколичественной переменной является фактор, то она называется фиктивной переменной. Если неколичественной переменной является результативный признак, то такую модель принято называть моделью би-

нарного выбора.

Чаще всего в моделях результативный признак является количественной переменной, однако его значения могут быть ограничены определенным интервалом. Для отражения этой особенности существует два типа моделей: модели с усеченными данными и модели с цензурированными данными.

При усеченной выборке наблюдения производятся не над всей статистической совокупностью, а над ее частью, для которой свойственно попадание значения результативного признака в определенный числовой интервал.

51

Цензурированная выборка представляет собой данные наблюдения над всей статистической совокупностью, но в силу каких-либо причин значениям результативного признака, меньшим или большим определенной числовой границы, присваивается значение, равное этой границе. Частным случаем модели с цензурированными данными является tobitмодель.

В парной линейной регрессии показатели тесноты связи называются коэффициентами корреляции (детерминации), в парной нелинейной регрессии – индексы корреляции (детерминации), а в множественной регрессии – коэффициенты (индексы) корреляции (детерминации). Формулы для расчета коэффициентов (индексов) корреляции, при наличии двух факторов имеют вид:

Совокупный коэффициент (индекс) множественной корреляции определяется по формуле:

Интерпретация значений коэффициентов (индексов) корреляции:

0,1- 0,3- слабая связь;

0,3-0,5 – умеренная связь;

0,5-0,7- заметная связь;

52

0,7-0,9- тесная связь;

0,9-0,99- весьма тесная.

Коэффициент (индекс) детерминации определяется воз-

ведением в квадрат коэффициента (индекса) корреляции. Ввиду того, что величины абсолютных показателей си-

лы связи определяются единицами измерения факторов, они не являются сравнимыми между собой. Для сопоставления факторов по силе влияния используют относительные показа-

тели силы связи – коэффициенты эластичности. Формула расчета коэффициента эластичности имеет вид:

Коэффициенты эластичности показывают, на сколько процентов в среднем изменится результат при изменении фактора на 1% и значениях других факторов, фиксированных на средних уровнях.

Во множественной регрессии и корреляции относительным показателем силы связи также являются стандартизированные коэффициенты регрессии. Как и коэффициенты эластичности, они сопоставимы между собой по силе влияния факторов на результат. Стандартизированные коэффициенты регрессии показывают, на сколько своих среднеквадратических отклонений в среднем изменится результат при изменении любого конкретного фактора на одно свое среднеквадратическое отклонение при фиксированном уровне других факторов, включенных в модель множественной регрессии.

Параметры уравнения множественной регрессии являются выборочными оценками неизвестных параметров по генеральной совокупности, поэтому следует проверить их качество. В модели множественной регрессии принято использовать оценки параметров, которые являются несмещенными,

эффективными и состоятельными.

53

Оценка параметра является несмещенной, если ее математическое ожидание равно оцениваемому параметру.

Оценка параметра является эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок данного параметра по выборкам одного и того же объема.

Оценка параметра является состоятельной, если с увеличением числа наблюдений оценка параметра стремится к его значению в генеральной совокупности.

Наиболее простым методом оценки параметров уравнения множественной регрессии является метод наименьших квадратов. Он применяется в случае соблюдения определен-

ных предпосылок:

1.Факторы являются неслучайными величинами, не связанными между собой;

2.Результат является случайной величиной, не ограниченной сверху или снизу;

3.Для каждого конкретного значения фактора (или факторов) результат рассматривается как отдельная случайная величина результативного признака;

4.Различные случайные величины независимы друг от

друга.

Если значения факторов и результативного признака не удовлетворяют перечисленным предпосылкам, то для нахождения параметров модели регрессии можно использовать

метод максимального правдоподобия. Для его применения необходимо знать закон распределения результативного признака. Предполагается, что для совокупности значений факторов результат подчиняется распределению одного вида, но

сразными параметрами, либо разными видами распределения что будет рассмотрено в теме 10.

54

Вопросы для проверки и закрепления знаний

1.Дайте понятие множественной регрессии.

2.В чем заключается основная цель множественной регрессии?

3.Какие функции чаще всего выбирают в качестве нелинейной функции множественной регрессии?

4.Что называется интеркорреляцией?

5.Какую корреляционную связь называют мультиколлинеарностью?

6.С помощью чего выявляется существование корреляционной связи между факторами?

7.Раскройте содержание четырех методов, используемых с целью перебора факторов для выделения из них наиболее значимых, подлежащих включению в модель регрессии.

8.Как называется неколичественная переменная, если она является фактором?

9.Как называется модель, если неколичественной переменной является результативный признак?

10.Раскройте два типа моделей, когда результативный признак является количественной переменной, но его значения ограничены определенным интервалом.

11.Какой относительный показатель силы связи используют для сопоставления факторов по силе влияния?

12.В каком случае оценка параметра является несме-

щенной?

13.Когда оценка параметра называется эффективной?

14.Охарактеризуйте состоятельную оценку параметра?

15.В каком случае для нахождения параметров модели регрессии используется метод максимального правдоподобия?

55

Задания для проверки и закрепления знаний

Задание 1. Множественная регрессия и корреляция Исходные данные:

Фактическое конечное потребление домашних хозяйств (в текущих ценах) на душу населения, тыс. руб. (У); средний размер назначенных пенсий тыс. руб. (Х1); величина прожиточного минимума (в среднем на душу населения) (Х2) тыс. руб. (таблица 1).

Таблица 1

Исходные данные для модели

 

2006

2007

2008

2009

2010

2011

2012

2013

2014

2015

У

106,84

132,54

165,92

175,36

195,74

245,52

277,98

306,97

329,28

343,19

Х2

2,73

3,12

4,20

5,19

7,48

8,20

9,04

9,92

10,79

11,99

Х3

3,42

3,85

4,59

5,15

5,69

6,37

6,51

7,31

8,05

9,70

Задание

1.Произвести расчет данных для построения модели в таблице 2.

2.Рассчитать показатели корреляции в таблице 3.

Таблица 2

Расчет коэффициентов корреляции

Формула

Результат расчета

 

 

 

 

 

 

56

Таблица 3

Данные для построения модели

t Y

1

2

3

4

5

6

7

8

9

10

Среднее значение

3. Построить матрицу коэффициентов в таблице 4.

Таблица 4

 

 

 

Матрица коэффициентов

 

 

 

 

 

 

 

 

 

Y

 

 

Y

 

 

1

 

 

 

 

 

 

1

 

 

 

 

 

 

1

Интерпретация:

0,1

– 0,3

- слабая связь;

0,3

– 0,5

- умеренная связь;

0,5

– 0,7

- заметная связь;

0,7

– 0,9

- тесная связь;

0,9

– 0,99 - весьма тесная.

4. Определить параметры а, b1 и b2 уравнения множественной линейной регрессии по системе уравнений:

57

Получим систему уравнений:

5.Переписать систему уравнений в матричном виде и решить его методом Гаусса.

6.Найти параметры уравнения:

- ?

- ?

- ?

7.Составить уравнение в виде:

8. Дать количественную оценку частным коэффициентам эластичности:

?

?

9. Определить расчетное значение критерия Фишера (таблица 5).

Таблица 5

Сравнение табличного и фактического значения

 

критерия Фишера

Формула

Результат расчета

 

 

 

 

 

 

 

 

58

10.Рассчитать совокупный коэффициент множественной корреляции:

11.Провести оценку статистической значимости коэффициентов регрессии b1 и b2 по t-критерию (таблица 6).

Таблица 6

 

Оценка статистической значимости

 

коэффициентов регрессии

Формула

 

Результат расчета

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11. Сформулировать выводы по каждому пункту заданий.

59

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]