- •1. Эксперимент как предмет исследования
- •1.1. Классификация видов экспериментальных исследований
- •1.2. Погрешности результатов исследований
- •2. Краткие сведения из теории вероятностей и математической статистики
- •2.1. Вероятность случайных событий, их характеристики
- •2.2. Нормальный закон распределения
- •3.1. Вычисление характеристик эмпирических распределений
- •3.2. Статистические гипотезы
- •3.3. Отсев грубых погрешностей
- •3.4. Определение доверительных интервалов для исследуемых величин
- •3.4.1. Оценка доверительного интервала для математического ожидания
- •3.4.2. Оценка доверительного интервала для дисперсии
- •3.5. Сравнение двух рядов наблюдений
- •3.5.1. Сравнение средних значений
- •3.5.2. Сравнение двух дисперсий
- •3.5.3. Проверка однородности нескольких дисперсий
- •3.6. Определение необходимого количества измерений
- •3.7. Проверка гипотезы нормального распределения
- •3.8. Преобразование распределений к нормальному
- •4. Анализ результатов пассивного эксперимента. Эмпирические зависимости
- •4.1. Характеристика видов связей между рядами наблюдений
- •4.2. Определение коэффициентов уравнения регрессии
- •4.3. Определение тесноты связи между случайными величинами
- •4.4. Линейная регрессия от одного фактора
- •4.5. Регрессионный анализ
- •4.5.1. Проверка адекватности модели
- •4.5.2. Проверка значимости коэффициентов уравнения регрессии
- •4.6. Линейная множественная регрессия
- •4.7. Нелинейная регрессия
- •5.1. Оценка погрешностей определения величин функций
- •5.2. Обратная задача теории экспериментальных погрешностей
- •5.3.Определение наивыгоднейших условий эксперимента
- •6. Методы планирования экспериментов. Логические основы
- •6.1. Основные определения и понятия
- •6.2. Пример хорошего и плохого эксперимента
- •6.3. Планирование первого порядка
- •6.3.1. Выбор основных факторов и их уровней
- •6.3.2.Планирование эксперимента
- •6.3.3. Определение коэффициентов уравнения регрессии
- •6.3.4. Статистический анализ результатов эксперимента
- •6.3.5. Дробный факторный эксперимент
- •6.3.6. Разработка математической модели гидравлического режима методической печи
- •6.4. Планы второго порядка
- •6.4.1. Ортогональные планы второго порядка
- •6.4.2. Ротатабельные планы второго порядка
- •6.5. Планирование экспериментов при поиске оптимальных условий
- •6.5.1. Метод покоординатной оптимизации (Гаусса - Зейделя)
- •6.5.2. Метод крутого восхождения (Бокса-Уилсона)
- •6.5.3. Симплексный метод планирования
- •7. Компьютерные методы статистической обработки результатов инженерного эксперимента
- •7.1. Статистические функции Microsoft Excel
- •7.2.1. Общая структура системы
- •7.2.2. Возможные способы взаимодействия с системой
- •7.2.3. Ввод данных
- •7.2.4. Вывод численных и текстовых результатов анализа
- •7.2.5. Статистические процедуры системы statistica
- •7.2.6. Структура диалога пользователя в системе statistica
- •7.2.7. Примеры использования системы statistica
4.2. Определение коэффициентов уравнения регрессии
Будем полагать, что вид уравнения регрессии уже выбран и требуется определить только конкретные численные значения коэффициентов этого уравнения b=. Отметим предварительно, что если выбор вида уравнения регрессии, как это уже отмечалось, процесс неформальный и не может быть полностью передан ПЭВМ, торасчет коэффициентов выбранного уравнения регрессии – операция достаточно формальная и ее следует решать с использованием ПЭВМ.Это трудный и утомительный расчет, в котором человек не застрахован от ошибок, а ПЭВМ выполнит его значительно быстрее и качественнее.
Существуют два основных различных похода к нахождению коэффициентов bj. Выбор того или иного из них определяется целями и задачами, стоящими перед исследователем, точностью полученных результатов, их количеством и т.д.
Первый подход – интерполирование, базируется на удовлетворении условию, чтобы функция =(X,b) совпадала с экспериментальными значениями в некоторых точках, выбранных в качестве опорных (основных, главных) yi.
В этом случае для определения k+1 неизвестных значений параметров bjиспользуется система k+1 уравнений
f(xi, b0, ..., bj, ...., bk)=yi, 1in. (4.4)
Рис.4.3.
Аппроксимация функции с большим (1) и
небольшим (2) числом коэффициентов bi
Таким образом, задача в конечном счете сводится к решению системы k+1 уравнений с k+1 неизвестными. Основная сложность такого решения состоит в нелинейности системы, хотя в принципе при использовании ПЭВМ она преодолима.
При числе опытов n, большем, чем k+1 искомых коэффициентов, число независимых уравнений системы избыточно. Избыточность информации можно использовать по разному.
После определения численных значений параметров k+1 проверяется качество аппроксимации путем сопоставления значений функции и экспериментальных данных в оставшихся, не использованных точках. Если обнаруженные между ними расхождения превышают допустимые по условиям точности, то процедуру определения коэффициентов bjможно повторить, приняв в качестве опорных (основных) другие точки.
Из этих уравнений в разных комбинациях можно составить несколько систем уравнений, каждая из которых в отдельности даст свое решение. Но между собой они будут несовместимыми. Каждое решение будет соответствовать своим значениям коэффициентов bj. Если все их построить на графике, то получим целый пучек аппроксимирующих кривых.
Рис.4.4.
Метод избранных точек (
– избранные точки)
1. Метод избранных точек(рис. 4.4). На основании анализа данных выдвигают гипотезу о виде (форме) зависимости f(X). Предположим, что она линейная, т.е. статистическая связь – это линейная одномерная регрессия
(4.5)
Выбирают две наиболее характерные по мнению исследователя точки, через которые и проходит линия регрессии (см. рис. 4.4). Задача вычисления коэффициентов b0и b1модели в этом случае тривиальная. Если предполагается, что уравнение регрессии более высокого порядка, то соответственно увеличивают число избранных точек. Недостатки такого подхода очевидны. Так, избранные точки выбираются субъективно, а подавляющая часть экспериментального материала не используется для определения параметров (коэффициентов) уравнения регрессии, хотя ее можно использовать в дальнейшем для оценки надежности полученного уравнения.
Рис.4.5.
Метод медианных точек
(4.5а)
Если при выборе вида уравнения регрессии число его коэффициентов bjокажется больше числа уравнений (имеющихся результатов измерений) k+1>n, система (4.4) не будет иметь однозначного решения, в этом случае необходимо либо уменьшить число определяемых коэффициентов k+1, либо увеличить число опытов n, другого выхода здесь нет.
Второй подход. Метод наименьших квадратов.
Усреднение несовместимых решений избыточной системы уравнений n>k может быть преодолено методом наименьших квадратов, который был разработан еще Лежандром и Гауссом. Таким образом, метод наименьших квадратов – это "новинка" почти 200 летней давности. Сегодня благодаря возможностям ПЭВМ этот метод поступил, по существу, в полосу своего ренессанса. Определение коэффициентов bj основано на выполнении требования, чтобы сумма квадратов отклонений экспериментальных точек от соответствующих значений уравнения регрессии была минимальна.Заметим, что в принципе можно оперировать и суммой других четных степеней этих отклонений, но тогда вычисления будут сложнее. Однако руководствоваться суммой невязок нельзя, так как она может оказаться малой при больших отклонениях отрицательного знака.
Математическая запись приведенного выше требования имеет вид
(4.6)
где n – число экспериментальных точек в рассматриваемом интервале изменения аргумента x.
Необходимым условием минимума функции Ф(b0,b1,...,bj,...,bk) является выполнение равенства
(4.7)
или
(4.7а)
После преобразований получим
(4.8)
Система уравнений (4.8) содержит столько же уравнений, сколько неизвестных коэффициентов b0,b1,...,bkвходит в уравнение регрессии, и называется в математической статистикесистемой нормальных уравнений.
Поскольку Ф0 при любых b0,...,bk, величина Ф обязательно должна иметь хотя бы один минимум. Поэтому, если система нормальных уравнений имеет единственное решение, оно и является минимумом для этой величины.
При n>k+1 система имеет единственное решение, при n=k+1 численные значения коэффициентов уравнения регрессии по первому и второму подходам идентичны, а все опытные точки совпадают с уравнением регрессии.
Очевидно, что при k+1>n система уравнений (4.8) переопределена и имеет множество решений, преодолеть эту проблему можно, как уже отмечалось, либо увеличением числа наблюдений, либо уменьшением числа неизвестных коэффициентов bj.
Расчет коэффициентов по методу наименьших квадратов можно применять при любых статистических данных, распределенных по любому закону.