Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 482

.pdf
Скачиваний:
2
Добавлен:
30.04.2022
Размер:
1.78 Mб
Скачать

2.одинаковую и минимальную дисперсию коэффициентов регрессии;

3.независимость определения коэффициентов регрессии друг от друга;

4.простоту в вычислениях коэффициентов.

Последние дна свойства ПФЭ молено оценить па конкретном примере, используя понятия матричной алгебры (см. приложение 2).

Рассмотрим план типа ПФЭ 22 (см. табл.7), для которого X – матрица факторов и Y – столбец наблюдений имеет вид:

 

 

 

 

 

 

1

1

1

 

 

 

y1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

1

1

 

Y

y2

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

 

y4

 

 

 

 

 

Найдем произведение матриц:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

1

1

1

 

1

1

4

0 0

 

 

 

 

 

1

 

1

 

 

 

 

0 4 0

 

X

T

X

 

1

1

 

1

 

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

0

0 4

 

 

 

1

1

 

1

1

1

 

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

4

 

 

 

 

 

 

 

 

 

 

1

 

1

1

1

 

 

 

x0u yu

 

 

 

 

 

 

 

 

1

 

 

u 1

 

 

 

 

 

 

 

X

T

Y

 

 

1

1

 

 

 

y2

 

 

4

 

 

 

 

 

 

 

 

1

 

1

y

 

x1u yu

 

 

 

 

 

 

 

 

 

1

1

 

 

 

3

 

 

 

u 1

 

 

 

 

 

 

 

 

 

 

1

 

1

 

y

 

4

x

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2u

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u 1

 

 

 

 

 

Система нормальных выражений записывается:

 

 

 

 

 

 

 

 

 

(XTY)B XTY

 

 

 

 

 

 

(4.7)

40

 

 

 

 

 

 

4

 

 

 

 

4 0

0

 

b0

 

x0u yu

 

 

u 1

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

x1u yu

(4.8)

0 4

0

b1

 

 

 

 

 

 

u 1

 

 

 

 

0 0

4

 

b2

 

 

4

x

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2u u

 

 

 

 

 

 

 

u 1

 

 

 

 

Решение системы в общем виде

 

 

 

B (XTY)-1XTY

 

(4.9)

Или для конкретного примера:

 

 

 

 

 

1

 

 

 

 

 

4

 

 

 

 

0

0

x0u yu

 

 

b0

 

4

 

 

 

 

 

 

u 1

 

 

 

1

 

 

 

 

 

 

 

 

 

4

 

 

b1

0

 

 

0

x1u yu

 

(4.10)

4

 

 

 

 

1

 

u 1

 

 

b2

 

 

 

 

 

 

4

 

 

 

 

 

0 0

 

 

 

x2u yu

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u 1

 

 

Видно, что свободный член уравнения регрессии b0 равен среднему арифметическому всех значений выходной переменной (х0 = 1), а b1 и b2, находят как среднее алгебраической суммы yu со знаками столбца х1 или х2. Простота расчета коэффициентов уравнения регрессии не вызывает сомнения. Ясно также, что вычеркивание или добавление столбцов xi не меняет расчет других коэффициентов, т. е. коэффициенты регрессии определяются независимо друг от друга.

Расчет коэффициентов уравнения.

Таблица 10

План ПФЭ23

опыты

x1

 

x2

x3

y

1

+1

 

+1

+1

y1

2

-1

 

+1

+1

y2

 

 

41

 

 

Продолжение табл. 10

3

+1

-1

+1

y3

4

-1

-1

+1

y4

5

+1

+1

-1

y5

6

-1

+1

-1

y6

7

+1

-1

-1

y7

8

-1

-1

-1

y8

Реализация матрицы планирования. После построения матрицы планирования приступают непосредственно к эксперименту. Обычно матрицу планирования представляют в виде, удобном для реализации опытов — все кодированные значения факторов заменяют натуральными. Такую матрицу планирования называют рабочей. В рабочую матрицу также заносят время проведения опытов, значения ограничительных переменных и некоторые временные изменения в анализируемых пробах. Такая подробность в описании условий эксперимента очень часто бывает полезной в принятии решений о достоверности тех или иных опытов, о влиянии систематических ошибок и др.

Поскольку на изменение выходной переменной влияют помехи, план чаще всего реализуют несколько раз, получая m параллельпых значений переменной состояния. Первоначальное число m выбирают по результатам предварительного эксперимента или с помощью специально поставленных опытов, оценивающих их воспроизводимость.

Для того чтобы избежать появления некоторой неслучайной связи между реализациями каждого эксперимента или серии экспериментов, рекомендуется, опыты рандомизировать во времени. Здесь рандомизация предполагает случайное расположение или случайную реализацию плана эксперимента.

Появление и влияние неслучайной составляющей в опытных данных можно показать на следующем примере.

42

Пример 2. В табл. 10 приведена матрица ПФЭ 23, полученная с помощью уже описанного приема (см. табл. 8): два раза повторяется план 22 — один раз на верхнем уровне фактора х3, другой раз — на нижнем.

Предположим, что четыре опыта реализуются в первый день, а остальные — во второй день. Предположим также, что условия опытов в эти дни отличались друг от друга на некоторую ошибку (например, сбился нуль измерительного прибора). Тогда при подсчете b3 получается:

b

1

y y y y

 

(y ) (y ) (y ) (y )

8

 

3

 

 

1

2

3

 

4

5

 

6

7

 

 

8

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 11

 

 

 

 

 

 

Последовательность случайных чисел

 

 

 

 

 

 

 

 

 

 

 

 

 

№п/п

 

 

1

 

2

3

4

5

 

6

 

7

 

8

Рандомизиро-

 

05

 

02

03

07

06

 

01

 

08

 

04

ванные опыты

 

 

 

 

 

где

3

— истинное значение коэффициента при х3.

Таким

образом, значение b3 искажается. Отметим, что

на b1 и b2 не

влияет.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рандомизация

 

обычно

проводится

 

следующим

образом. В таблице случайных чисел из любого столбца выбирают числа в порядке их следования от 1 до N. Если матрица предполагает параллельные опыты, то тогда количество случайных чисел возрастает от 1 до mN, т. е. нумеруются не только строки матрицы, но и параллельные опыты. Каждое число от 1 до N или mN из таблицы случайных чисел берут только один раз. Для рассматриваемого примера в таблице случайных чисел были выбраны числа от 1 до 8 в последовательности, которая приведена в табл. 5. Это значит, что опыт № 1 в матрице планирования («+1, +1,+1, табл. 5) реализуется пятым по порядку, опыт № 6 («—1, +1, — 1») реализуется первым и т. д.

43

5. АЛГОРИТМ РАСЧЕТА ПОЛНОГО ФАКТОРНОГО ЭКСПЕРИМЕНТА ТИПА 2N

(при равном числе параллельных опытов в каждой точке факторного пространства)

5.1. Построение матрицы планирования

Если априорные сведения предполагают невысокую воспроизводимость результатов, то в матрицу планирования эксперимента включают параллельные опыты, как показано, в табл. 12 для ПФЭ 22.

Таблица 12 Матрица ПФЭ 22 с параллельными опытами

опыты

x0

Планирование

Переменная состояния

 

 

 

 

 

 

 

 

 

x1

x2

yu1

yu2

….

Yum

yu

 

 

1

+1

+1

+1

y11

y12

….

Y1m

 

y

1

2

+1

-1

+1

y21

y22

….

Y2m

 

y

2

3

+1

+1

-1

y31

y32

….

Y3m

 

y

3

4

+1

-1

-1

y41

y42

….

Y4m

 

y

4

m — число параллельных опытов; Nm — общее число опытов; n — число факторов

5.2. Расчет коэффициентов уравнения регрессии (линейная форма)

Коэффициенты рассчитывают по формуле (см. приложение 2)

 

1

N

 

 

bi

xiu

y

u

(i 1,2,.....,n)

(5.1)

 

 

N u 1

 

 

44

Где

 

 

 

1

m

 

y

u

 

yuk

(5.2)

 

 

 

 

m k 1

 

среднее значение по параллельным опытам u-й строки матрицы планирования. Объединяя формулы (14) и (15) получили:

 

1

N m

 

bi

xiu

y

uk

(5.3)

 

 

Nm u 1 k 1

 

После вычисления коэффициентов регрессии переходят к статистическому анализу уравнения регрессии.

Статистический анализ уравнения регрессии состоит из трех этапов:

1.оценка дисперсии воспроизводимости (или оценка ошибки опыта),

2.оценка значимости коэффициентов уравнения регрессии и

3.оценка адекватности модели.

5.3.Расчет ошибки опыта (дисперсии воспроизводимости)

Известно, что ошибка опыта so2 оценивается по

параллельным опытам. Перед расчетом ошибки опыта необходимо убедиться, что рассеяние опытов в каждой точке факторного пространства не превышает некоторой величины. Для этого рассчитываются построчные дисперсии su2 и

проверяются их однородность. Расчет проводится по формуле:

 

1

m

 

su2

(yuk

y

u )2

(5.4)

 

 

m 1k 1

 

Проверить однородность дисперсий su2 можно по критерию Кохрена. Его расчетное значение определяют так:

45

 

 

 

 

s2

 

 

 

Gp

 

umax

 

(5.5)

 

 

N

 

 

 

 

su2

 

 

 

 

 

u 1

 

где

2

— максимальная из

рассчитанных

построчных

sumax

дисперсии;

N

su2 — сумма всех дисперсий по N строкам матрицы

u 1

планирования.

Если выполняется условие:

Gp<GT

(5.6)

то гипотеза об однородности дисперсий принимается. GT находят но таблицам (приложение 1) для чисел степеней свободы f1 = m — 1 и f2 = N и уровня значимости q. В технических расчетах принимается 5%-ный уровень значимости q = 0,05.

5.4. Принятие решений

Если условие (5.6) не выполняется, то одним из решений является увеличение числа параллельных опытов, т. е. еще раз или несколько раз необходимо реализовать матрицу планирования.

Если увеличение m не дает результата, то следует изменить метод контроля переменной состояния, увеличив его точность. Иногда прибегают к масштабированию переменной состояния — вводится некоторая математическая функция от у (например квадратный корень или логарифм).

При выполнении условия (5.6) построчные дисперсии усредняют по формуле:

46

 

1

N

1

 

N m

 

so2

su2

 

(yuk

y

u )2

(5.7)

 

N(m

 

 

N u 1

1) u 1 k 1

 

где f0 = N (m — 1) — число степеней свободы.

Таким образом, получают ошибку опыта so2 .

Неоднородные дисперсии усреднять нельзя.

5.5. Проверка значимости коэффициентов регрессии

Очевидно, что один фактор больше влияет на переменную состояния, другой — меньше. Для оценки этого влияния используют проверку значимости каждого коэффициента двумя равноценными способами. В обоих случаях вначале находят дисперсию коэффициентов регрессии по формуле:

sb2

s2

 

o

(5.8)

N

i

 

т. е. дисперсии всех коэффициентов равны, поскольку зависят

только от

ошибки опыта s2

и

числа строк

матрицы

планирования N.

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По

первому

способу

оценку

значимости

коэффициентов определяется по формуле:

 

 

 

 

 

 

 

 

t

ip

 

 

 

bi

 

 

 

 

 

(5.9)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

и условию

 

tip tT

 

 

(5.10)

 

 

 

 

 

 

 

 

где

 

bi

 

— абсолютное значение i-гo коэффициента регрессии;

 

 

tT

— табличное значение критерия Стьюдента,

которое

находят по числу степеней свободы

 

 

 

f0 = N (m — 1) и уровню значимости q

 

 

 

sbi

— среднеквадратичное отклонение bi.

 

 

47

По второму способу для проверки значимости коэффициентов регрессии используют доверительный

интервал bi , который, вследствие равенства sb2 для всех

i

коэффициентов, одинаков для всех bi:

bi

tT sb

(5.11)

 

i

 

Тогда значимость оценивают, сравнивая абсолютные значения коэффициента и доверительного интервала:

|bi | | bi |

(5.12)

Если выполняются условия (5.11) и (5.12), то i-й коэффициент признается значимым.

5.6. Принятие решений

Если для какого-то коэффициента условия (5.9) и (5.10) не выполняются, то соответствующий фактор можно признать незначимым и исключить его из уравнения регрессии.

Однако надо быть осторожным и всегда помнить, что в предварительном эксперименте уже отсеивались незначимые факторы, скорее всего полученная незначимость фактора является следствием неудачно выбранного интервала варьирования: он был выбран малым. Более правильным является решение повторить эксперимент при расширенном интервале варьирования для исследуемого фактора. Конечно, при этом число опытов, а значит, время эксперимента, возрастает. Иногда половину опытов сохраняют тем, что расширение интервала варьирования проводят только в одну сторону: один (верхний или нижний) уровень остается.

Если фактор остался незначимым после повторения эксперимента и всех необходимых расчетов, то его (или их) отбрасывают и переходят к оценке адекватности полученной математической модели.

48

5.7. Проверка адекватности линейного уравнения регрессии

Пригодность линейного уравнения регрессии для решения задачи поиска области оптимума проверяется методом, изложенным в гл. II, § 6. Сравниваются две дисперсии — одна показывает рассеяние средних опытных данных переменной состояния yu относительно тех значений

переменной состояния ~yu , которые предсказаны полученным

линейным уравнением регрессии. Эта дисперсия называется дисперсией адекватности и рассчитывается по формуле:

 

 

 

m

N

2

 

2

 

 

~

 

 

 

 

s

ад

 

 

(yu yu )

 

 

 

 

N 1 u 1

(5.13)

 

 

 

 

 

где m — число параллельных опытов; N — число строк матрицы планирования; l — число членов в уравнении регрессии, оставшихся после оценки значимости.

Вторая дисперсия — это ошибка опыта. Адекватность проверяют, оценивая отношение

 

 

s2

 

Fp

 

ад

(5.14)

so2

по критерию Фишера

 

 

 

 

 

Fp

FT

(5.15)

для степеней свободы fад = N — l, f0 = N (m — 1) и заданного уровня значимости q. Если выполняется условие (28), то линейное уравнение регрессии признается адекватным, т. е. рассеяние экспериментальных данных переменной состояния относительно уравнения регрессии того же порядка, что и рассеяние, вызванное случайными изменениями в объекте исследования (ошибка опыта)

49