Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8860

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
1.97 Mб
Скачать

и вычисляем их соотношение RS R S - это значение сравнивается с таблич-

ными: верхними и нижними границами (более подробную информацию пред-

лагается найти самостоятельно)

4). Гомоскедастичность остатков – постоянство дисперсии остатков или

дисперсия каждого отклонения одинакова для всех xi . Невыполнение данного

условия означает наличие гетероскедастичности.

Способы выявление гетероскедостичности: 4.1) Графический (построение графика). 4.2) Критерий Гольдфельда-Квандта:

Шаг 1. Упорядочение n наблюдений по мере возрастания значений фак-

тора x .

Шаг 2. Исключение из рассмотрения C центральных наблюдений, при этом n C / 2 p , где p - это число оцениваемых параметров.

Шаг 3. Разделение совокупности из (n - C) на две группы (с малыми и большими значениями фактора) и определение по каждой из групп уравнения

регрессии.

Шаг 4. Нахождение отношения R

S12ост

(большее делим на меньшее).

S 22ост

 

 

 

 

 

 

n C 2 p

 

n C 2 p

R Fтабл , то име-

Найденное значение Fтабл ;

 

 

;

 

 

, если

2

 

 

2

 

 

 

 

 

 

ет место гетероскедастичность.

5). Отсутствие автокорреляции в остатках. Ищется коэффициент корре-

ляции r i j (j=i+1), если его значение по модулю значительно (близко к еди-

нице), то имеет место автокорреляции остатков. Более точным является крите-

рий для проверки автокорреляции остатков Дарбина-Уотсона.

4. Построение и анализ модели множественной регрессии

71

a)Отбор факторов – введение фиктивных переменных и анализ матрицы корреляции между факторами (и показателем). Удаление явно

коррелирующих факторов. Проверка на мультиколлинеарность.

Парная регрессия дает хороший результат, если на рассмотрение оказы-

вает один фактор и влияниями других факторов можно пренебречь. Как прави-

ло, необходимо учесть влияние двух и более факторов.

Проблемы при построении модели множественной регрессии: 1). Отбор факторов, включаемых в модель.

2). Объем выборки должен быть достаточно большим ( n 7m , где n

объем выборки, а m – число факторов).

3). Выбор спецификации модели, то есть функциональной зависимости

(линейные и нелинейные).

Отбор факторов.

Факторы, включаемые в модель должны отвечать следующим условиям:

Факторы должны быть количественно измеримы, если необходимо вклю-

чить в модель качественный фактор, не имеющий количественного из-

мерения, то ему нужно придать количественную определенность одним их двух способов – разработать шкалу и придать количественное значе-

ние фактору или использовать фиктивных переменные (вид несущих

стен, наличие – отсутствие балкона и т.д.). Фиктивные переменные при-

нимают значения 0 либо 1.

 

0

отсутствие балкона

. Фиктивные переменные должны ис-

z

 

 

 

 

 

 

1

наличие балкона

 

пользоваться в модели исследования цены квартиры на рынке жилья.

Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. (Интеркоррелированность – это зависи-

мость факторов, когда при построение регрессии вида yˆ a b1 x1

b2 x2

выполняется неравенство, следовательно, связь между x1 и y

менее

72

сильна, чем связь между x1 и x2 , в таком случае включать x1 в регресси-

онную модель не нужно.)

Если между факторами существует высокая корреляция, то нельзя вы-

явить их изолированное влияние на исследуемый показатель и параметры урав-

нения регрессии не возможно верно интерпретировать. Считается, две пере-

менные явно коллинеарные, то есть находятся между собой в линейной зависимости, если | rxi x j | 0,7 .

Негативным считается явление мультиколлениарности факторов. Это яв-

ление проявляется тогда, когда более чем два фактора связаны между собой за-

висимостью, близкой к линейной, то есть имеет место совокупное воздействие факторов друг на друга. Чем сильнее мультиколлениарность факторов, тем ме-

нее надежна оценка параметров регрессии с помощью метода наименьших квадратов, при этом затрудняется интерпретация параметров множественной регрессии. Данную модель нельзя использовать для прогнозирования, так как она ненадежна.

Для оценки мультиколлениарности факторов будем использовать опреде-

литель матрицы парных коэффициентов корреляции между факторами. В MS Excel используем функцию МОПРЕД.

Если между факторами существует полная линейная зависимость, то все линейные коэффициенты межфакторной корреляции будут равны единице,

Det MR 0 , если же факторы вообще не связаны, то Det MR 1.

При проверке мультиколлинеарности рекомендуется пользоваться упро-

щенным критерием и сравнивать детерминант матрицы парной корреляции факторов с числом 0,3. Предлагается найти в литературе или в сети Интернет иные критерии проверки мультиколлинеарности. Осуществить процесс опреде-

ления и устранения факторов, ответственных за мультиколлинеарность.

Самый простой способ устранения мультиколлениарности – это устране-

ния факторов, ответственных за мультиколлинеарность. Для поиска перемен-

ной, ответственной за мультиколлениарность факторов, строят регрессии, где в

73

качестве зависимой переменной рассматривается каждый из факторов и устра-

няют тот фактор, связь которого с другими наиболее сильная.

b)Построение модели множественной линейной регрессии, вычисление средней ошибки аппроксимации. Проверка качества модели по критерию Фишера, частному критерию Фишера и критерию Стьюдента. Множественный индекс детерминации и коэффициент

корреляции.

Оценка параметров уравнения множественной регрессии производится с помощью метода наименьших квадратов. При этом оцениваются параметры линейного уравнения; если используется нелинейная модель, то производим сначала ее линеаризацию. При использовании функции ЛИНЕЙН выделяем

( m 1) столбцов и 5 строчек и получаем искомые значения

bm

bm 1

b1

b0

mb

mb

mb

mb

m

m 1

1

0

R 2

my

 

 

F

df2

S регрессии2

Sостаточная2

Не зависимо от форм связи показатель множественной корреляции может быть найден, как индекс множественной корреляции:

Ryx x

 

 

1

остаточная2

x

y2

i x

 

n

 

Отметим, что Ryx2 1 x2 xm Ryx2 i max , то есть индекс детерминации больше

или равен максимальному индексу парной корреляции

ryx x

x

 

 

ryx

.

 

1 2

 

m

 

i max

 

Статистическая значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера, значение которого может быть найдено по формуле

F

Dфакт

 

 

R2

 

n m 1

D

 

R2

m

 

1

 

 

 

 

 

 

 

 

74

где m - число факторов, включенных в модель.

Наряду с этим критерием используется частный F-критерий Фишера для

обоснования включения фактора в модель.

F

Ryx2

x x x

Ryx2

x

x

x

m

n m 1

1

2 i m

 

1

i 1

i 1

 

 

 

xi

 

1 Ryx2

x x

 

 

 

 

1

 

 

 

 

1

i

m

 

 

 

 

 

 

Найденное значение сравниваем с табличным значением Fтабл, рассчи-

танным с n m 1 степенями свободы.

 

 

 

 

 

 

Если Fx превышает Fтабл,

то включение фактора xi в модель, статиче-

i

 

 

 

 

 

 

 

 

 

 

 

ски оправданно и коэффициент регрессии bi

статистически значим.

Оценки значимости коэффициента чистой регрессии по t-критерию Сть-

юдента могут быть проведены также и с помощью частного F-критерия.

 

 

 

 

 

 

 

 

 

bi

 

t

b

 

F

t

b

 

 

 

 

 

x

 

 

 

mb

 

i

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

Значение t сравнивается с

табличным, за

 

степень свободы берется

n m 1 .

Если величина частного F-критерия больше табличного, то это не только указывает на значимость рассматриваемой регрессии, но и на значимость част-

ного коэффициента корреляции.

r 2

 

 

 

 

,x

, ,x

F

 

 

 

 

yx x ,x , ,x

 

 

x

 

 

 

 

i 1 2 i 1

 

i 1

 

 

m

 

i

 

 

 

 

c) Частные уравнения регрессии.

 

 

 

 

 

 

 

 

 

 

На основе линейного уравнения регрессии могут быть найдены частные

уравнения регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yx | x2 , x3 , , xm f x1

 

y

1

| x , x

3

, , x

m

f x

2

 

 

 

x2

1

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

xm

| x , x

2

, , x

m 1

f x

m

 

 

1

 

 

 

 

 

 

 

 

то есть уравнения регрессии, которые связывают результативный признак y с

75

соответствующим фактором xi (i 1, m) при закреплении других, учитывае-

мых во множественной регрессии факторов, на среднем уровне. yx1 | x2 , x3 , , xm a b1 x1 b2 x2 bm xm

yx2 | x1 , x3 , , xm a b1 x1 b2 x2 bm xm

или в виде

yx1 | x2 , , xm A1 b1 x1 yx2 | x1 , , xm A2 b2 x2

где A1 a b2 x2 bm xm , A2 a b1x1 bm xm и т.д.

В отличие от парной регрессии, частные уравнения регрессии характери-

зуют изолированное влияние фактора на результат, при этом иные факторы за-

креплены на неизменном уровне.

Это позволяет на основе частных уравнений регрессии определять част-

ные коэффициенты эластичности.

Эyxi

bi

 

xi

yˆ xi

| x1 , x2 ,...xi 1 , xi 1 , , xm

 

 

Средние показатели коэффициента эластичности:

x

Эyi bi yˆ | x , xi ...,x

1 2 m

d)Построение уравнения регрессии в стандартизированном масштабе.

Анализ коэффициентов модели.

Уравнение регрессии в стандартизированном масштабе имеет вид:

 

 

 

 

ˆ

 

 

2tx

....... mtx

,

 

 

 

 

t y 1tx

 

 

 

 

 

1

 

 

 

2

 

m

где t y

y y

,

tx

xi x

– это стандартизированные переменные. Они обла-

y

x

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

0 , t2

t2

1.

дают следующими свойствами – t

y tx

 

 

 

 

 

 

 

 

 

i

y

xi

 

76

– это стандартные коэффициенты регрессии, их находят при помощи МНК. В силу того, что все переменные t заданы, как центрированные, стан-

дартные коэффициенты сравнимы между собой.

По значениям стандартизированных коэффициентов регрессии можно ранжировать факторы по силе из воздействия на результат.

e)Расчет коэффициентов частной корреляции, сопоставление с коэффициентами модели в стандартизированном масштабе.

Частные коэффициенты (индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влия-

ния других факторов, включенных в уравнение регрессии.

С помощью частных коэффициентов корреляции можно проранжировать факторы по их степени влияния, а также они могут быть использованы при ре-

шении проблемы отбора факторов.

Показатели частной корреляции представляют собой отношения сокра-

щения остаточной дисперсии за счет дополнительного включения в анализ но-

вого фактора к остаточной дисперсии, имевший место до введения его в мо-

дель.

Сопоставление коэффициентов частной корреляции разного порядка по мере увеличения числа включаемых факторов показывает процесс «очищения» зависимости результативного признака с исследуемым фактором. При наличии m факторов коэффициент частной корреляции, измеряющий влияние на y

фактора xi при неизменном уровне других факторов определяется по формуле:

 

 

 

 

 

 

 

 

 

 

1 Ryx2

,x , ,x , ,x

ryx

 

 

 

 

 

 

 

1

 

 

1

2

i

m

 

x , ,x

,x ,x

,x

 

 

 

Ryx2

 

 

 

 

i

 

1 i 1

i i 1

 

m

 

 

1

,x , ,x

,x

, ,x

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

i 1

i 1

m

Ранжирование факторов по их воздействию на результат с помощью частных коэффициентов корреляции должно согласовываться со значениями параметров уравнения регрессии в стандартизированном масштабе i .

77

f)Проверка условий применимости МНК (обязательно критерии Гольдфельда-Квандта и Дарбина-Уотсона)

После проведенного анализа для построенной модели множественной ре-

грессии предлагается исключить (добавить) один или несколько факторов и осуществить построение новой, «улучшенной» модели. Указанные действия повторять до выбора наилучшей модели по имеющимся данным. Выбор наилучшей модели обосновать.

g)Прогноз цены для ряда квартир, не включенных в выборку и сопоставление прогнозных и реальных данных.

4.Методические указания по организации самостоятельной работы

4.1 Общие рекомендации для самостоятельной работы

Самостоятельная работа студентов является основным способом овладе-

ния учебным материалом в свободное от обязательных учебных занятий время.

Целями самостоятельной работы студентов являются:

- систематизация и закрепление полученных теоретических знаний и прак-

тических умений студентов;

-углубление и расширение теоретических знаний;

-формирование умений использовать нормативную, правовую, справоч-

ную документацию и специальную литературу;

-развитие познавательных способностей и активности студентов:

-формирования самостоятельности мышления, способностей к саморазви-

тию, самосовершенствованию и самореализации.

Запланированная в учебном плане самостоятельная работа студента рас-

сматривается как связанная либо с конкретной темой изучаемой дисциплины,

либо с подготовкой к курсовой, дипломной работе, а также к защите ВКР. В

данном разделе рассматривается только самостоятельная работа первого вида.

Самостоятельная работа выполняется в два этапа: планирование и реали-

зация.

Планирование самостоятельной работы включает:

78

-уяснение задания на самостоятельную работу;

-подбор рекомендованной литературы;

-составление плана работы, в котором определяются основные пункты предстоящей подготовки.

Составление плана дисциплинирует и повышает организованность в рабо-

те.

На втором этапе реализуется составленный план. Реализация включает в себя:

-изучение рекомендованной литературы;

-составление плана (конспекта) по изучаемому материалу (вопросу);

-взаимное обсуждение материала.

Необходимо помнить, что на лекции обычно рассматривается не весь ма-

териал. Оставшийся восполняется в процессе самостоятельной работы. В связи с этим работа с рекомендованной литературой обязательна.

Работа с литературой и иными источниками информации включает в себя две группы приемов: техническую, имеющую библиографическую направлен-

ность, и содержательную. Первая группа – уяснение потребностей в литерату-

ре; получение литературы; просмотр литературы на уровне общей, первичной оценки; анализ надежности публикаций как источника информации, их отно-

симости и степени полезности. Вторая – подробное изучение и извлечение не-

обходимой информации.

Для поиска необходимой литературы можно использовать следующие спо-

собы:

-поиск через систематический каталог в библиотеке;

-просмотр специальных периодических изданий;

-использование материалов, размещенных в сети Интернет.

Для того, чтобы не возникало трудностей понимания текстов учебника,

монографий, научных статей, следует учитывать, что учебник и учебное посо-

бие предназначены для студентов и магистрантов, а монографии и статьи ори-

79

ентированы на исследователя. Монографии дают обширное описание пробле-

мы, содержат в себе справочную информацию и отражают полемику по тем или иным дискуссионным вопросам. Статья в журнале кратко излагает позицию ав-

тора или его конкретные достижении в исследовании какой-либо научной про-

блемы.

В процессе взаимного обсуждения материала закрепляются знания, а также приобретается практика в изложении и разъяснении полученных знаний, разви-

вается речь.

При необходимости студенту следует обращаться за консультацией к пре-

подавателю.

Составление записей или конспектов позволяет составить сжатое пред-

ставление по изучаемым вопросам. Записи имеют первостепенное значение для самостоятельной работы студентов. Они помогают понять построение изучае-

мого материала, выделить основные положения, проследить их логику.

Ведение записей способствует превращению чтения в активный процесс. У

студента, систематически ведущего записи, создается свой индивидуальный фонд подсобных материалов для быстрого повторения прочитанного. Особенно важны и полезны записи тогда, когда в них находят отражение мысли, возник-

шие при самостоятельной работе.

Можно рекомендовать следующие основные формы записи: план, кон-

спект, тезисы, презентация.

План – это схема прочитанного материала, краткий (или подробный) пере-

чень вопросов, отражающих структуру и последовательность материала. По-

дробно составленный план вполне заменяет конспект.

Конспект – это систематизированное, логичное изложение материала ис-

точника. Объем конспекта не должен превышать 10 страниц. Шрифт Times New Roman, кегль 14, интервал 1,5. Список литературы должен состоять из 5-8

источников, по возможности следует использовать последние издания учебных пособий и исследований.

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]