Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Гусейнов Афган Салман оглы.#Эконометрика#экономическое моделирование состояния и охраны здоровья населения оренбургской области

.pdf
Скачиваний:
8
Добавлен:
25.02.2018
Размер:
936.26 Кб
Скачать

Видим, что недофинансирование из бюджета не покрывает финансирование из ФОМС на 0,9 %, что ведет к общему росту заболеваемости населения Оренбургской области.

3.2 Построение регрессионной модели

Построим регрессию Y на главные компоненты с максимальным числом значимых коэффициентов. Сначала введем основные понятия регрессионного анализа./15/

Для проведения регрессионного анализа из (k + 1)-мерной генеральной совокупности (у, х1, х2,..., хk) берется выборка объемом n единиц.

Линейная регрессионная модель имеет вид:

 

k

уi 0

j xij i

 

j 1

,

(2)

где уi - значение результативного показателя для i-го наблюдения,

хij - значение j-то объясняющего показателя для i-го наблюдения,

0 , 1,... k - подлежащие оценке параметры регрессионной модели,

 

- взаимно некоррелированные

 

случайные остатки

с нулевым

i

 

математическим ожиданием и дисперсией

 

2

i

1, n

 

 

 

 

 

 

 

 

 

 

Коэффициент регрессии j показывает,

на какую величину в среднем

изменится результативный показатель у, если переменную хj

увеличить на

единицу измерения, т.е. является нормативным коэффициентом.

 

В матричной форме регрессионная модель имеет вид:

 

Y X ,

(3)

61

 

y

 

 

1

 

 

 

y2

где Y

 

 

 

...

 

 

 

 

 

 

 

 

yn

 

1

 

 

1

 

 

 

X

 

 

 

...

 

 

 

 

1

 

 

 

коэффициентов

 

 

 

 

 

вектор-столбец наблюдений результативного признака;

 

 

 

 

 

 

 

 

x

x

x

 

 

 

11

12

1k

 

 

 

 

 

 

x21

x22

x2k

 

 

... ...

...

 

- матрица размерности

n * (k +1) известных

 

 

 

 

 

 

xn1

xn2

 

 

 

 

xnk

 

 

(k > k);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

- вектор

неизвестных параметров,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оцениванию;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

- вектор-столбец

 

случайных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

M 0;

 

2

 

 

 

 

 

 

E .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b b

, b ,...,b

T

 

Вектор

 

 

оценок

 

определяется

 

 

0

1

k

 

которые подлежат

ошибок, причем

при помощи метода

наименьших квадратов (МНК), минимизирующего сумму квадратов отклонении фактических значений от расчетных:

 

y

f b; x

 

min

 

 

n

 

 

2

 

 

 

 

i

i

 

 

,

(4)

i 1

 

 

 

 

 

 

 

 

 

 

Запись решения в матричной форме дает возможность находить оценки коэффициентов регрессии из уравнения

b

X

 

1

X

 

Y

T

X

T

 

 

 

 

,

(5)

Оценка

ковариационной

выражением

b

является несмещенной и состоятельной. Оценка матрицы вектора коэффициентов регрессии определяется

62

b M[ b b

] s

2

XT X

^

T

^

1

 

 

 

 

,

где несмещенная оценка для остаточной дисперсии равна

^

2

 

 

 

 

 

 

 

 

 

 

 

s

 

1

 

Y X b T Y X b . ,

n k 1

 

 

 

 

 

 

 

 

 

 

 

(6)

(7)

После построения модели, проверяем качество подгонки модели под выборочные данные. Находим коэффициент детерминации R2 – отношение объясненной регрессией части вариации у к общей вариации зависимой переменной. В силу определения, R2 принимает значения 0 R2 1. Если R2 = 0,

то это означает, что регрессия не дает никаких результатов, то есть объясняющие признаки не влияют на качество модели, построенной для у. Если же R2 = 1, то это означает точную подгонку: все точки наблюдений лежат на

регрессионной плоскости и все ошибки i равны нулю. Соответственно, чем

ближе к единице значение коэффициента детерминации, тем оценка

y

более

 

ˆ

 

точно аппроксимирует у.

Величина R2 позволяет осуществить выбор между несколькими регрессионными уравнениями. Однако она обладает двумя существенными недостатками, не позволяющими полагаться только на значение коэффициента детерминации при осуществлении этого выбора. Во-первых, оптимизация при определении коэффициентов регрессии осуществляется по критерию минимизации суммы квадратов остатков, то есть по критерию, отличающемуся от критерия R2. Во-вторых, значение коэффициента детерминации возрастает при добавлении еще одного или нескольких регрессоров и уменьшается при их исключении из модели./50/

После получения оценок уравнения регрессии проводится обязательная проверка значимости уравнения и его коэффициентов по статистическим критериям (дополнительно вводится требование нормального распределения

вектора случайных остатков - N 0; 2En ).

63

Значимость уравнения регрессии, т.е. проверка

H

0

:

 

2

....

k

0

осуществляется с помощью статистики

 

1

 

 

 

 

1

Q

 

 

 

 

 

 

F

k

R

 

 

 

 

 

1

 

 

,

 

 

Q

 

n k 1

 

 

ост

 

 

 

 

гипотезы

(8)

которая при справедливости нулевой гипотезы распределена по закону Фишера

- Снедекора с

v

k

и

v

n k 1

степенями свободы.

1

 

2

 

Q

X b

X b ;

 

T

 

 

R

 

 

 

Q

 

T

Y X b

Y X b

ост

 

 

,

(9)

(10)

Если уравнение регрессии незначимо, то есть все коэффициенты уравнения регрессии для генеральной совокупности равны нулю, то на этом анализ уравнения заканчивается.

Если же нулевая гипотеза отвергается, то представляет интерес проверка значимости отдельных коэффициентов и построение интервальных оценок для значимых коэффициентов.

Значимость коэффициентов регрессии можно проверить с помощью критерия

tj

bj

 

 

 

 

,

 

(11)

^

1 12

 

 

s X T X

 

 

 

 

 

jj

 

 

 

который при выполнении гипотезы

H

0

:

 

0

имеет распределение

 

1

 

 

Стьюдента с (n – k – 1) числом степеней свободы.

Значимые коэффициенты необходимо экономически интерпретировать.

Наряду с точечными оценками bj генеральных коэффициентов регрессии

о регрессионный анализ позволяет получать и интервальные оценки последних с доверительной вероятностью .

64

Интервальная оценка с доверительной вероятностью

имеет вид

 

 

t

^

 

 

 

b

 

t

^

 

b

j

s

b j

j

j

s

b j

 

 

 

 

 

 

 

,

для параметра

j

(12)

1

где t находят по таблице распределения Стьюдента при вероятности

и числе степеней свободы v n k 1.

 

 

Интервальная оценка для уравнения регрессии

~

в точке, определяемой

y

вектором-столбцом начальных условий в виде

X

0

 

1,

x

0

,

 

1

 

 

0

 

0

T

x

,..., x

 

 

 

2

k

 

,

, записывается

~

 

0

T

b

y

X

 

 

 

 

 

 

 

Интервал предсказания определяется как

~

 

0

T

b

y

X

 

 

 

 

 

 

 

t

^

s

 

 

 

~

 

 

y

 

 

n 1

 

 

^

t

 

s

 

 

X

 

 

X

 

X

X

 

. ,

 

0

T

 

T

1

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

доверительной вероятностью

T

1

X 0

 

X 0

X T X

1 .

 

 

 

 

 

 

 

 

(13)

(14)

Решение задачи оценивания коэффициентов регрессии производится при условии линейной независимости столбцов матрицы Х исходных данных.

Нарушение этой предпосылки приводит к возникновению явления мультиколлинеарности, под которой в регрессионном анализе понимается наличие тесных связей статистических связей между факторными признаками x1, х2,…, хk, что, в частности, проявляется в близости к нулю определителя их корреляционной матрицы и матрицы ХТХ. Поскольку этот определитель входит в знаменатель для важных характеристик анализируемых модели, то мультиколлинеарность создает трудности и неудобства при статистическом исследовании, а именно, это приводит к неустойчивости получаемых оценок параметров регрессии, завышению оценок стандартных ошибок этих параметров./15/

65

На практике наиболее распространенным является метод, основанный на анализе парных коэффициентов корреляции, который состоит в том, что переменные признаются мультиколлинеарными, если значения парных коэффициентов между ними достаточно высоки по абсолютной величине

(больше 0.6). Но этот способ не обоснован теоретически. Вторым его недостатком является тот факт, что отсутствие высоких значений коэффициентов еще не свидетельствует об отсутствии мультиколлинеарности.

Тем не менее, этот метод прост и логически понятен, поэтому и используется достаточно широко. Однако следует помнить, что при этом могут возникнуть новые трудности. Во-первых, далеко не всегда ясно, какие переменные являются «лишними» в указанном смысле. Мультиколлинеарность означает лишь приблизительную линейную зависимость между столбцами матрицы Х, но это не всегда выделяет «лишние» переменные. Во-вторых, во многих ситуациях удаление каких-либо объясняющих переменных может значительно отразиться на содержательном смысле модели. Наконец, «отбрасывание» так называемых существенных переменных, которые реально влияют на результативный показатель, приводит к смещенности МНК - оценок.

Чтобы избавиться от этого негативного явления, обычно используют алгоритм пошагового регрессионного анализа. В подавляющем большинстве ситуаций получаемые с помощью пошаговой процедуры наборы переменных оказываются оптимальными или близкими к оптимальным.

Кроме того, при моделировании многих экономических или социально-

экономических процессов сталкиваются с ситуацией, когда разброс остатков около линии регрессии не остается постоянным, а меняется, т.е. имеем модель с гетероскедастичными остатками. Очень часто появление проблемы гетероскедастичности можно предвидеть заранее, основываясь на знании характера данных. К настоящему времени для такой проверки предложено несколько тестов (критериев), в которых делаются различные предположения о зависимости между дисперсией регрессионных остатков и величиной

66

объясняющей переменной (или объясняющих переменных): тест ранговой корреляции Спирмена, тест Голдфенда - Квандта и тест Глейзера.

В ситуациях, когда регрессионные остатки оказываются статистически взаимозависимыми (коррелированными) возникает явление автокорреляции.

Для обнаружении автокорреляции первого порядка используется критерий Дарбина - Уотсана. /14/

В случае наличия гетероскедастичности и автокорреляции метод наименьших квадратов приводит к несмещенным и состоятельным оценкам, но стандартные ошибки параметров модели будут определены не верно, а,

следовательно, получено неправильное представление о точности оцененного уравнения регрессии. В этом случае для оценки параметров регрессионной модели применяется обобщенный метод наименьших квадратов /3/.

Наибольшее влияние на заболеваемость населения Оренбургской области оказывает финансирование из ФОМС – экономический фактор и обеспеченность врачами - фактор здравоохранения.

В приложении М представлены данные для построения регрессионной модели влияния основных факторов – обеспеченность врачами и финансирование из ФОМС – на заболеваемость населения Оренбургской области.

На основе линейной регрессионной модели исследуем зависимость заболеваемости – у от финансирования из ОМС – х1 и от обеспеченности врачами – х2.

В нашем случае в качестве объясняющих переменных выступают выделенные главные компоненты fj.

Решим данные таблицы М.1, используя инструмент Регрессия в пакете Анализ в Microsoft Excel.

В Microsoft Excel в пакете Анализ данных инструмент Регрессия предлагает линейный регрессионный анализ, который заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов.

67

Регрессия используется для анализа воздействия на отдельную зависимую

переменную значений одной или более независимых переменных.

Вкатегории Входные данные указываем диапазон анализируемых зависимых данных - заболеваемость; диапазон должен состоять из одного столбца;

Вкатегории Входной интервал вводим диапазон независимых данных,

подлежащих анализу - данные по обеспеченность врачами и финансирование из ОМС. Microsoft Excel располагает независимые переменные этого диапазона слева направо в порядке возрастания.

Таблица 16 – Информация об уравнении регрессии

 

Коэф-

Стандартная

t-статис-

 

Нижние

Верхние

Показатели

фици-

P-Значение

ошибка

тика

95%

95%

 

енты

 

 

 

 

 

 

 

Y-

1439,7

46,084

31,24145

0,000

1346,35

1533,1

пересечение

 

 

 

 

 

 

246

0,042

0,070

0,596

0,555

-0,09973

0,182853

80473,3

-0,0001

0,00042

-0,236

0,815

-0,00094

0,000744

В результате получили уравнение регрессии:

Yx = 1439,7+0,042x1 -0,0001x2 ,

(15)

Так как ни один из коэффициентов уравнения регрессии не равен нулю,

то полученное уравнение регрессии значимо.

Определим с доверительной вероятностью р= 0,95 интервальные оценки для коэффициентов регрессии βj € [ bj ± tα Sbj]/

β0 € [1439,7 ± 2,021*46]= 1439,7± 92,966 β1 € [0,042 ± 2,021*0,070]= 0,042±0,142

β2 € [-0,0001 ± 2,021*0,00042]= -0,0001±0,001

Некоррелированность главных компонент подтверждает матрица их парных коэффициентов корреляции в таблице 17.

68

Таблица 17 - Матрица парных коэффициентов корреляции

 

Коэффициенты

 

 

 

 

y

 

 

 

 

x1

 

 

x2

 

Y

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

0,0891569

 

 

1

 

 

 

 

x2

 

 

 

 

 

0,0038982

 

0,264609

 

1

 

 

В таблице 18 приведены интервальные

оценки

для

 

параметра fj

с

доверительной вероятностью 0,95.

 

 

 

 

 

 

 

 

 

 

Таблица 18 – Интервальные оценки для параметра fj

с доверительной

 

 

 

 

вероятностью 0,95

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

 

 

 

Нижняя граница

 

 

Верхняя граница

 

 

регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f2

 

 

 

 

-0,09973

 

 

 

 

0,182853

 

 

 

 

f3

 

 

 

 

-0,00094

 

 

 

 

0,000744

 

 

 

 

 

 

 

 

 

 

Проверим полученную

модель

(15)

на

гетероскедастичность

и

автокоррелированность остатков.

 

 

 

 

 

 

 

 

 

 

 

В данной модели (15) на основе анализа регрессионных остатков, можно

сделать вывод об отсутствии гетероскедастичности.

 

 

 

 

 

 

Для

проверки автокорреляции

остатков,

был вычислен коэффициент

Дарбина

-

Уотсона:

d

наб

2,29

,

который больше

верхнего порогового

 

 

 

значения dв

1,72 ,

следовательно,

гипотеза

о

наличии

 

автокорреляции

не подтверждается.

Таким образом, для остатков модели (15) не свойственна гетероскедастичность и автокорреляция.

Из приведенной модели следует, что между всеми уровнем заболеваемости и всеми факторами, за исключением последнего

(финансирование из ОМС), имеется прямая зависимость: с увеличением фактора на одну единицу уровень заболеваемости также возрастает.

69

Заключение

Санитарно-эпидемиологическая обстановка в г. Оренбурге продолжает оставаться напряженной, а по некоторым показателям, характеризующим состояние здоровья населения и среды обитания, является критической.

Идет интенсивное загрязнение воздуха выбросами автотранспорта, что ухудшается неблагоприятным состоянием автомагистралей.

Остается обостренной проблема обеспечения населения доброкачественной питьевой водой. Ухудшается санитарно-техническое состояние водопроводных сооружений и сетей, в течение многих лет не решаются проблемы санитарной охраны водоисточников города, строительства нового водозабора.

Ухудшилось положение в области охраны и создания безопасных условий труда.

Высок удельный вес предприятий с неудовлетворительными условиями труда.

Состояние питания населения характеризуется дальнейшим снижением потребления важнейших продуктов - молочных, мяса и мясопродуктов, рыбы,

овощей и фруктов. Формируются группы населения с признаками белково-

витаминной недостаточности. Усугубилась ситуация с обеспеченностью населения, особенно детей, витаминами и важнейшими микроэлементами (йод,

железо, селен и др.). Не решен вопрос обеспечения населения качественными продуктами питания.

Свыше 50 % трудопотерь, связанных с недожитием до пенсионного возраста, определяются смертельными травмами и отравлениями.

Наметилась выраженная тенденция ухудшения интегральных показателей заболеваемости различных групп населения.

Эпидемиологическая обстановка в 2015 г. продолжает оставаться напряженной, а по некоторым аспектам критической.

70