- •2.2. Лабораторная работа №2 “ Компьютерная обработка результатов эксперимента ”
- •2.2.1. Постановка задачи регрессионного анализа
- •2.2.2. Математический анонс.
- •1.Предварительная обработка результатов эксперимента
- •2.Поиск оценок коэффициентов линейной регрессии.
- •3.Анализ остатков и выявление выбросов.
- •4.Проверка значимости влияния факторов на отклик.
- •5.Проверка адекватности регрессии.
- •2.2.3. Подготовка данных
- •2.2.4. Рекомендации по реализации алгоритма обработки данных в пакетеStatistica.
- •1. К предварительной обработке результатов эксперимента.
- •2. К поиску оценок коэффициентов линейной регрессии.
- •3.К анализу остатков и выявлению выбросов.
- •4. К проверке значимости влияния факторов на отклик.
- •5. К проверке адекватности регрессии.
- •2.2.5. Требования к оформлению лабораторной работы.
5.Проверка адекватности регрессии.
Визуально об адекватности модели можно судить по графику соответствия распределения остатков нормальному закону и по графику соответствия расчётных и экспериментальных значений отклика. Количественная проверка адекватности выполняется путём сравнения показателей, характеризующих рассеяние расчетных и экспериментальных значений отклика. Выбор показателей определяется особенностями постановки эксперимента.
В эксперименте выполнялись параллельные опыты. В этом случае дисперсия воспроизводимости S2воспр характеризует усредненную погрешность измерения отклика и, если отклики измерены с большой погрешностью, то большая величина вряд ли связана с плохим выбором уравнения регрессии. Таким образом, для определения соответствия (адекватности) регрессии нужно сравнить остаточную дисперсию с величиной дисперсии воспроизводимости. Если различие дисперсий незначимо, модель следует признать адекватной. Для сравнения двух дисперсий используют критерийФишера
F = S2ОСТ/ S2воспр , (2.20)
по числу степеней свободы (см. Примечание ниже) остаточной дисперсии
f1=m-n-1
и числу степеней свободы дисперсии воспроизводимости
f2=m(L-1)
для заданного уровня значимости p (0.05) по распределению Фишера определяют Fт.
- Если значение F в (2.20) меньше или равно FТ, то модель адекватна с доверительной вероятностью 1 - p (95%).
- Если F > FТ, модель следует признать неадекватной.
Примечание. При расчете степеней свободы число опытов m и число факторов n берётся с учётом исключённых опытов и факторов.
В эксперименте отсутствуют параллельные опыты. В этом случае адекватность проверяют по коэффициенту детерминации (R2), который показывает насколько модель регрессии лучше модели среднего:
R2 = 1 - (2.21)
- сумма квадратов, определяющая рассеяние экспериментальных значений отклика относительно регрессии = ,
- сумма квадратов, определяющая рассеяние измерений отклика относительно среднего по всем опытам()
= , где .
Если ,томодель регрессии представляет данные примерно с той же точностью, что и просто среднее и использовать регрессию не имеет смысла. В этом случае 1 и R2 0.
Если <<, то регрессия представляет данные значительно точнее, чем просто среднее и имеет смысл использовать регрессию. При этом 0 и R2 1.Т.о.чем ближе значение R2 к 1, тем с большей уверенностью можно утверждать, что регрессия адекватна. Коэффициент детерминации интерпретируют, как долю изменчивости отклика от факторов, объясняемую регрессией. Например, R2 = 0.8означает, что 80% изменчивости Y от X объясняется регрессией, а 20% - случайностью. В идеале желательно иметь объяснение если не для всей, то хотя бы для большей части исходной изменчивости.
Более строго предположение о значимости доли изменчивости, объясняемой регрессией можно проверить по критерию F:
- сумма квадратов, определяющая рассеяние среднего экспериментального значения отклика относительно регрессии
= .
Очевидно, что чем больше F, тем лучше регрессия описывает экспериментальные данные по сравнению со средним. Учитывая, что
= +,
Fможновыразить через коэффициент детерминации
(2.22)
Для рассчитанного значения Fпо распределению Фишера можно вычислить уровень значимости p–level. Если p–level < 0.05, то с вероятностью 0.95 можно признать долю изменчивости, объясняемую регрессией значимой и модель адекватной. В противном случае – изменчивость объясняется случайностью и полученная регрессионная модель неприемлема.
Квадратный корень из коэффициента детерминации называется коэффициентом множественной корреляции R. R характеризует тесноту связи между факторами и откликом.