- •1. Эксперимент как предмет исследования
- •1.1. Классификация видов экспериментальных исследований
- •1.2. Погрешности результатов исследований
- •2. Краткие сведения из теории вероятностей и математической статистики
- •2.1. Вероятность случайных событий, их характеристики
- •2.2. Нормальный закон распределения
- •3.1. Вычисление характеристик эмпирических распределений
- •3.2. Статистические гипотезы
- •3.3. Отсев грубых погрешностей
- •3.4. Определение доверительных интервалов для исследуемых величин
- •3.4.1. Оценка доверительного интервала для математического ожидания
- •3.4.2. Оценка доверительного интервала для дисперсии
- •3.5. Сравнение двух рядов наблюдений
- •3.5.1. Сравнение средних значений
- •3.5.2. Сравнение двух дисперсий
- •3.5.3. Проверка однородности нескольких дисперсий
- •3.6. Определение необходимого количества измерений
- •3.7. Проверка гипотезы нормального распределения
- •3.8. Преобразование распределений к нормальному
- •4. Анализ результатов пассивного эксперимента. Эмпирические зависимости
- •4.1. Характеристика видов связей между рядами наблюдений
- •4.2. Определение коэффициентов уравнения регрессии
- •4.3. Определение тесноты связи между случайными величинами
- •4.4. Линейная регрессия от одного фактора
- •4.5. Регрессионный анализ
- •4.5.1. Проверка адекватности модели
- •4.5.2. Проверка значимости коэффициентов уравнения регрессии
- •4.6. Линейная множественная регрессия
- •4.7. Нелинейная регрессия
- •5.1. Оценка погрешностей определения величин функций
- •5.2. Обратная задача теории экспериментальных погрешностей
- •5.3.Определение наивыгоднейших условий эксперимента
- •6. Методы планирования экспериментов. Логические основы
- •6.1. Основные определения и понятия
- •6.2. Пример хорошего и плохого эксперимента
- •6.3. Планирование первого порядка
- •6.3.1. Выбор основных факторов и их уровней
- •6.3.2.Планирование эксперимента
- •6.3.3. Определение коэффициентов уравнения регрессии
- •6.3.4. Статистический анализ результатов эксперимента
- •6.3.5. Дробный факторный эксперимент
- •6.3.6. Разработка математической модели гидравлического режима методической печи
- •6.4. Планы второго порядка
- •6.4.1. Ортогональные планы второго порядка
- •6.4.2. Ротатабельные планы второго порядка
- •6.5. Планирование экспериментов при поиске оптимальных условий
- •6.5.1. Метод покоординатной оптимизации (Гаусса - Зейделя)
- •6.5.2. Метод крутого восхождения (Бокса-Уилсона)
- •6.5.3. Симплексный метод планирования
- •7. Компьютерные методы статистической обработки результатов инженерного эксперимента
- •7.1. Статистические функции Microsoft Excel
- •7.2.1. Общая структура системы
- •7.2.2. Возможные способы взаимодействия с системой
- •7.2.3. Ввод данных
- •7.2.4. Вывод численных и текстовых результатов анализа
- •7.2.5. Статистические процедуры системы statistica
- •7.2.6. Структура диалога пользователя в системе statistica
- •7.2.7. Примеры использования системы statistica
4.5. Регрессионный анализ
Ниже излагаются основные положения регрессионного анализа, применение которого для обработки результатов наблюдений связано с меньшим числом ограничений, чем корреляционного анализа. Как и корреляционный анализ регрессионный анализ включает в себя построение уравнения регрессии, например методом наименьших квадратов, и статистическую оценку результатов. Если в регрессионном анализе расчет коэффициентов ведется теми же методами, например наименьших квадратов, то теоретические предпосылки регрессионного анализа требуют других способов статистической оценки результатов.
При проведении регрессионного анализа примем следующие допущения:
1. Входной параметр x измеряется с пренебрежимо малой ошибкой. Появление ошибки в определении y объясняется наличием в процессе невыявленных переменных и случайных воздействий, не вошедших в уравнение регрессии.
2. Результаты наблюдений y1, y2,..., yi,..., ynнад выходной величиной представляют собой независимые нормально распределенные случайные величины.
3. При проведении эксперимента с объемом выборки n при условии, что каждый опыт повторен m* раз, выборочные дисперсии S12,..., Si2,..., Sn2должны быть однородны. При выполнении измерений в различных условиях возникает задача сравнения точности измерений. При этом следует подчеркнуть, что экспериментальные данные можно сравнить только тогда, когда их дисперсии однородны. Это означает, как уже отмечалось (см. п. 3.5.2 и п. 3.5.3), принадлежность экспериментальных данных к одной и той же генеральной совокупности. Напомним, что однородность дисперсий свидетельствует о том, что среди сравниваемых дисперсий нет таких, которые с заданной надежностью превышали бы все остальные, т.е. была бы большая ошибка. При одинаковом числе параллельных опытов однородность дисперсии, как мы уже показали, можно оценить по критерию Кохрена, а для сравнения двух дисперсий целесообразно воспользоваться F-критерием Фишера (см. примеры 3.7–3.9).
После того, как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в следующем: проверяется значимость всех коэффициентов и устанавливается адекватность уравнения.
4.5.1. Проверка адекватности модели
При моделировании приходится формализовать связи исследуемого явления (процесса), из-за чего возможна потеря некоторой информации об объекте. Иногда некоторые связи не учитываются. В то же время основное требование к математической модели заключается в ее пригодности для решения поставленной задачи и адекватности процессу.
Так, построив модель в виде линейного уравнения регрессии, мы хотим в частности убедиться, что никакие другие модели не дадут значительного улучшения в описании предсказания значений Y.
Сформулируем нуль-гипотезу Н0: "Уравнение регрессии адекватно". Альтернативная гипотеза Н1: "Уравнение регрессии неадекватно". Для проверки этих гипотез принято использовать F-критерий Фишера.
При этом общую дисперсию (дисперсию выходного параметра) Sy2сравнивают с остаточной дисперсией (дисперсией адекватности) Syост2.
Напомним, что
(4.24)
где l=k+1 – число членов аппроксимирующего полинома, а k – число факторов. Так, например для линейной зависимости (4.5) k=1, l=2.
В дальнейшем определяется экспериментальное значение F-критерия Фишера
(4.25)
который в данном случае показывает во сколько раз уравнение регрессии предсказывает результаты опытов лучше, чем среднее
Если Fэксп>F;m1;m2, то уравнение регрессии адекватно. Чем больше значение Fэксппревышает F;m1;m2для выбранногои числа степеней свободы m1=n-1, m2=n-l, тем эффективнее уравнение регрессии.
Рассмотрим так же случай, когда в каждой i-й точке xiдля повышения надежности и достоверности осуществляется не одно, а m* параллельных измерений (примем для простоты, что m* одинаково для каждого фактора). Тогда число экспериментальных значений величины Y составит n=nm*.
В этом случае для оценки адекватности модели:
1. Определяется – среднее из серии параллельных опытов при x=xi, где yij– значение параметра Y при x=xiв j-м случае.
2. Рассчитываются значения параметра по уравнению регрессии при x=xi.
3. Рассчитывается дисперсия адекватности (аналог остаточной дисперсии)
где n – число значений xi; l – число членов аппроксимирующего полинома (коэффициентов bi), для линейной зависимости l=2.
4. Определяется выборочная дисперсия Y при x=xi:
5. Определяется дисперсия воспроизводимости (аналог общей дисперсии)
Число степеней свободы этой дисперсии равно m1=n(m*-1).
6. Определяется экспериментальное значение критерия Фишера
7. Теоретическое значение этого же критерия F;m1;m2, где m1=m*(n-1), m2=n-l.
8. Если FэкспF;m1;m2, то уравнение регрессии адекватно, в противном случае – нет.