[ММвЛХ] Лекция 7 Регрессионный анализ+
.pdfАнализ графика остатков
•а) модель адекватна; б) гетероскедастичность (отсутствие постоянства дисперсии) указывает на необходимость преобразования переменной Y; в) линейный тренд, такой график дает основание для ввода дополнительной независимой переменной; г) в модель должен быть добавлен линейный или квадратичный член уравнения
Основные понятия регрессионного анализа, используемые в таблицах вывода в модуле Регрессия (MS Excel):
•Предсказанные значения Ŷi – значения Y, вычисленные по уравнению с оцененными параметрами (в нашем примере по уравнению M=5,99+0,36D).
•Остатки – разности между наблюдаемыми значениями и предсказанными: Yi –Ŷi.
•Сумма квадратов Y, скорректированная на среднее(SS):
SS (Y1 Y )2 (Y2 Y )2 ... (Yn Y )2
где Y – среднее значение Y.
•
•Сумма квадратов Ŷi, скорректированная на среднее – SS регрессии (SS регр.):
|
ˆ |
|
|
|
|
ˆ |
|
|
|
|
ˆ |
|
|
|
|
SS |
Y ) |
2 |
Y ) |
2 |
Y ) |
2 |
|||||||||
регр. (Y1 |
|
(Y2 |
|
... (Yn |
|
•Сумма квадратов остатков - SS остатков
(SSост..):
ˆ |
2 |
ˆ |
2 |
ˆ |
2 |
SSост. (Y1 Y1 ) |
|
(Y2 Y2 ) |
|
... (Yn Yn ) |
|
•Исходя из вышеизложенного:
SS= SSрегр.+ SSост.
•Несмотря на то, что это соотношение элементарно, оно играет ключевую роль в регрессионном и дисперсионном анализах. Именно на нем основывается большинство выводов в них.
• Коэффициент детерминации – R-квадрат (R2):
R2 SS регр
SS
•Коэффициент детерминации измеряет долю разброса относительно среднего значения, которую «объясняет» построенная регрессия. Коэффициент детерминации лежит в пределах от 0 до 1. Он измеряет качество построенной регрессии. Чем ближе коэффициент детерминации к 1, тем лучше регрессия «объясняет» зависимость в данных.
Пошаговая регрессия
•Метод включения – независимые переменные включают до тех пор, пока регрессионное уравнение не обеспечит желаемую точность. Первой вводят переменную наиболее коррелированную с откликом
•Метод исключения – разрабатывается наиболее полное уравнение, содержащее все переменные. Затем происходит исключение переменных по различным критериям.
•(см. лаб. работу 8 “Разработка множественных моделей
роста древостоя элементов леса в среде PROGNOZ”)