Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы в научных исследованиях в целлюлозно-бумажном производстве

..pdf
Скачиваний:
1
Добавлен:
12.11.2023
Размер:
1.1 Mб
Скачать

формации недостаточно. Построение плана эксперимента – это выбор точек (уровней входных факторов) относительно нулевого.

Для определения других уровней входных факторов вводится интервал варьирования каждого входного фактора. Чтобы обозначить верхний уровень входного фактора, следует интервал варьирования прибавить к нулевому уровню данного фактора, а чтобы определить нижний уровень – вычесть интервал варьирования из нулевого уровня.

К интервалу варьирования входного фактора предъявляются следующие требования:

он не может быть менее ошибки, с которой измеряется данный фактор, иначе уровни фактора будут неразличимы;

нижние и верхние уровни не должны покидать области определения фактора и области проведения эксперимента.

Обычно при первичном планировании эксперимента количество уровней по всем входным факторам выбирают одинаковым. То-

гда количество опытов в эксперименте (Nэ) может быть определено по формуле

Nэ = pэk,

где pэ – число уровней каждого входного фактора; k – число входных факторов, исследуемых в эксперименте.

Если из анализа априорной информации известно, что исследуемая зависимость Yj = f (X1, X2, … Xk) является линейной, то достаточно реализовать эксперимент, в котором каждый входной фактор имеет в эксперименте только два уровня, т.е.

Nэ = 2k.

Такой план эксперимента называется планом первого порядка. Если из анализа априорной информации известно, что исследуемая зависимость Yj = f(X1, X2, … Xk) является нелинейной, то достаточно реализовать эксперимент, в котором каждый входной фактор имеет три уровня. Такой план называется планом второго порядка, а

Nэ = 3k.

21

Эксперимент, в котором реализуются все возможные сочетания всех уровней всех входных факторов, называется полным факторным экспериментом (ПФЭ).

2.4. Полный факторный эксперимент

Планы эксперимента позволяют апроксимировать результаты наблюдений уравнениями регрессии общего вида

 

m

 

m

yˆ

b0 bi xi bij xi xj bijl xi xj xl ....

 

i 1

i 1

i j l

Параметрb0 называетсяобщимсредним, параметры bi (i = 1, ..., m) – главными эффектами (взаимодействиями нулевого порядка), bij – эффектами взаимодействия первого порядка (эффектами двухфакторных взаимодействий), bijl – эффектами взаимодействия второго порядка (эффектами трехфакторных взаимодействий). Принято считать, что в большинстве реальных ситуаций эффекты взаимодействия второго и более высоких порядков пренебрежимо малы, поэтому в исследовательской практике наиболее часто используются уравнения с эффектами взаимодействия не выше первого порядка.

Условия полного факторного эксперимента записывают в виде таблицы – матрицы планирования эксперимента. Для эксперимента, исследующего объект с двумя входными факторами, каждый из которых изменяется по двум уровням, матрица планирования имеет вид Nэ = 22 (табл. 1)

Матрица планирования

 

Таблица 1

 

 

 

 

 

 

 

Номера наблюдений

х1

 

х2

у

1

–1

 

–1

у1

2

–1

 

1

у2

3

1

 

–1

у3

4

1

 

1

у4

Знаком «1» обозначены верхние уровни факторов, знаком «–1» – нижние. Так выглядит кодированная форма записи.

22

Если для исследования входного фактора было выбрано три уровня, включая нулевой, то в матрице планирования они обозначаются знаками «–1» (нижний), «0» (нулевой), «1» (верхний).

Независимо от числа факторов матрицы ПФЭ обладают следующими общими свойствами:

симметричность относительно центра эксперимента;

условие нормировки – сумма квадратов элементов каждого столбца равна числу опытов;

ортогональность – сумма почленных произведений любых двух векторов-столбцов матрицы равна нулю;

рототабельность – точки в матрице планирования подбираются так, что точность предсказаний значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления.

Если анализ априорной информации дает основания полагать, что в выбранной области эксперимента объект описывается линейной моделью, то количество опытов можно минимизировать, сократив матрицу планирования эксперимента. Такой эксперимент называется дробным факторным экспериментом (ДФЭ), а таблица его плана – дробной репликой.

Уменьшение числа опытов позволяет снизить затраты времени, средств, материалов на проведение и обработку эксперимента.

Перед проведением эксперимента необходимо выяснить следующее:

1) можно ли установить выбранные уровни входных факторов на используемом для эксперимента оборудовании и удерживать их во время опыта;

2) возможно ли возникновение негативных последствий от реализации выбранных сочетаний уровней факторов;

3) возможно ли проведение параллельных опытов во время эксперимента;

4) когда были проверены и откалиброваны измерительные приборы.

Эксперименты рекомендуется повторять не менее трех раз.

Проведение параллельных опытов дает возможность сделать более

23

надежными оценки влияния входных факторов на выходной фактор и выполнить расчеты статистических характеристик.

После составления матрицы планирования необходимо произвести рандомизацию опытов, т.е. ввести случайную последовательность их проведения. Цель рандомизации – исключение появления и влияния систематических ошибок на результаты эксперимента.

Эксперимент, который ставится для решения задач оптимизации, называется экстремальным. Если не ставится задача оптимизации, а требуется установить только количественную связь между входными и выходными факторами, то такой эксперимент часто называют интерполяционным.

После проведения эксперимента следует тщательно проанализировать полученные результаты. Если среди результатов измерений выходного фактора имеются единичные значения, которые резко отличаются от остальных, то следует проверить, не являются ли они грубыми ошибками, которые подлежат исключению.

2.5. Планы второго порядка

Очень часто на практике оказывается, что линейный план эксперимента (план первого порядка) после его реализации не позволяет получить математическую модель, адекватную данному процессу. В таких случаях целесообразно переходить к композиционным планам второго порядка, при этом выбирают более экономный план с наименьшим количеством экспериментальных точек. Следует учитывать, что в планах второго порядка каждая из независимых переменных должна принимать несколько, но не менее трех значений. Планы второго порядка позволяют описать поверхность отклика полиномами общего вида:

 

m

m

m

yˆ

b0 bi xi bii xi2

bij xi xj

 

i 1

i 1

i j

с числом членов k = 2m + m(m2 1) 1 .

24

Характеристики некоторых планов второго порядка, наиболее часто используемых в исследовательской практике.

Планы Кифера (Ki). Общее число точек в плане

2

n = (Cmh ·2mh ).

h 0

Эти планы обладают хорошими статистическими свойствами, но включают относительно большое число опытов, поэтому их можно рекомендовать в тех случаях, когда предъявляются повышенные требования к оценкам параметров регрессионной функции и затраты на проведение эксперимента невелики.

Планы Коно (Kо). Число точек в плане

2

n = 1 + (Cmh ·2mh ).

h 0

При m = 2 и m = 4 планы очень экономны и в то же время обладают хорошими статистическими характеристиками.

Планы Хартли (На). Число точек в плане m = 2m–р + 2m + 1.

Наиболее хорош план Хартли при m = 5, в этом случае он имеет удовлетворительные статистические характеристики и включает небольшое число точек. При других размерностях планы Хартли являются самыми экономными из рассмотренных планов, но сильно уступают по остальным характеристикам.

Планы Бокса (В). Число точек в плане m = 2m + 2m.

При небольшом числе переменных (m < 4) это один из лучших планов с точки зрения близости D-оптимальности и числа экспериментальных точек.

План В-3 при трех независимых переменных (m = 3) включает всего 14 точек и может быть рекомендован для практического применения.

25

Вобщем виде результат наблюдения за процессом выглядит

всоответствии с табл. 2.

Таблица 2 План эксперимента в общем виде и результаты его реализации

Значения независимых переменных

Результаты процесса

п/п

x1

x2

xm

y1

yp

1

x11

x21

xm1

y11

yp1

2

x12

x22

xm2

y12

yp2

u

x1u

x2u

xmu

y1u

ypu

N

x1N

x2N

xmN

y1N

ypN

Наиболее часто при планировании эксперимента ограничиваются числом переменных m < 4, в таких случаях оптимальным выбором является план Бокса. Число точек эксперимента в этом плане рассчитывается по формуле N = 2m + 2m при трех независимых переменных (m = 3); таким образом, план включает 14 точек (табл. 3).

 

 

 

 

 

 

 

 

Таблица 3

 

План В-3 с кодированными значениями переменных

 

 

 

и результатов (уu)

 

 

 

 

 

x2u

 

 

 

 

 

 

 

 

x1u

x3u

уu

x1u

 

x2u

x3u

 

уu

1

1

1

у1

–1

 

–1

–1

 

у8

–1

1

1

у2

1

 

0

0

 

у9

1

–1

1

у3

–1

 

0

0

 

у10

–1

–1

1

у4

0

 

1

0

 

у11

1

1

–1

у5

0

 

–1

0

 

у12

–1

1

–1

у6

0

 

0

1

 

у13

1

–1

–1

у7

0

 

0

–1

 

у14

2.6. Регрессионные модели с одной входной переменной

Эмпирические модели объектов и процессов представляют собой результат обработки экспериментальных данных о поведении объекта или процесса методами математического статистического

26

анализа. Очень часто для построения моделей объектов по результатам экспериментальных исследований используют математический аппарат регрессионного и корреляционного анализа.

Основная задача корреляционного анализа – выявление значимости связи между значениями различных случайных величин. Зависимость между величинами (в том числе и случайными), при которых одному значению одной величины (аргумента) отвечает одно или несколько вполне определенных значений другой величины, называется, соответственно, однозначной или многозначной функциональной зависимостью. Зависимость между величинами, при которой каждому значению одной величины отвечает с соответствующей вероятностью множество возможных значений другой, называют вероятностной (стохастической, статистической).

Математический аппарат регрессионного анализа позволяет:

оценить неизвестные параметры предлагаемой к исследованию регрессионной модели;

проверить статистическую значимость параметров модели;

проверить адекватность модели;

оценить точность модели.

Вид регрессионной модели предлагает сам исследователь, при этом он исходит:

из физической сущности изучаемого объекта или явления;

характера экспериментального материала;

анализа априорной информации.

Входной фактор характеризует воздействие на исследуемый объект. В технологических процессах ЦБП это могут быть температура, время, расход химических реагентов, давление, тип сырья и т.д. Выходной фактор характеризует реакцию (отклик) объекта на воздействие входного фактора. Выходные факторы в технологических процессах ЦБП – выход продукции, ее качественные показатели и т.д.

Для начала построения эмпирической модели необходимо иметь данные экспериментальных исследований объекта (в виде таблицы или графика), в которых каждому значению входного фактора (X) соответствует значение выходного фактора (Y), т.е. известна

27

пара чисел (хi, yi). Пары случайных переменных (x, y) подчиняются некоторому двумерному вероятностному распределению. Общее количество пар чисел пусть равно m (рис. 1).

Рис. 1. Графическое отображение результатов эксперимента

Данный график называется диаграммой рассеяния, или точечной диаграммой. Необходимо найти такую кривую, которая бы наилучшим образом аппроксимировала экспериментальные точки. Для удобства дальнейшего исследования объекта эта кривая должна иметь для своего описания одну единственную формулу (функцию). Если мы соединим точки на графике, то получим ломаную линию, состоящую из нескольких прямых отрезков и описываемую соответствующим количеством линейных моделей. Это крайне неудобно для исследования. Необходимо найти кривую, наилучшим образом описывающую все экспериментальные точки (рис. 2). Такую кривую называют кривой регрессии, или регрессионной кривой Y по X. В общем случае кривая регрессии может иметь любой вид (монотонно возрастающая, монотонно убывающая, с точками перегиба и т.д.), но она должна быть непрерывной, т.е. не должна иметь разрывов.

В самом простом случае кривая регрессии имеет вид прямой линии.

Обычно построение моделей и исследование объекта начинают с самых простых моделей – линейных. Линейной модели соответствует кривая регрессии в виде простой линии.

Как видно из графика, всегда имеются отклонения экспериментальных точек от кривой регрессии, что вызвано влиянием других

28

(неучтенных в модели) внешних факторов на исследуемый объект. Во время исследования объекта входной фактор всегда носит детерминированный характер, а выходной – случайный.

Рис. 2. Построение линии регрессии

Выражение, которое устанавливает связь между случайной зависимой и детерминированной независимой переменными, представляет собой уравнение регрессии. Модель, построенная на основе уравнения регрессии, является регрессионной моделью.

Если иметь неограниченно большое количество экспериментальных точек, то линейная регрессионная модель имеет вид

y = β0 + β1 · x + ɛ, ŷ = β0 + β1 · x,

где ŷ – значения выходной переменной, рассчитанные (предсказанные) по линейной модели; x – значения входной переменной; β0 и β1 – коэффициенты регрессии; ɛ – остаток (невязка).

Определение коэффициентов регрессии осуществляется на основе метода наименьших квадратов. Метод наименьших квадратов применяют в тех случаях, когда случайная вариация входного фактора пренебрежительно мала по сравнению с наблюдаемым диапазоном его измерения, т.е. значения входной переменной считаются фиксированными. Суть метода в том, что подбираются такие β0 и β1, при которых сумма квадратов отклонений измеренных величин y от предсказанных ŷ была бы минимальной.

29

Для пар наблюдений можно записать y = β0 + β1xi + ɛi.

Отклонение измеренной величины y от предсказанной ŷ

ɛi = yi – ŷ = yi – (β0 + β1)x.

Сумма квадратов отклонений выражается в виде

S

m

2

 

m

y

 

0

x ).

 

i

 

 

i

 

1 i

 

i 1

 

 

i 1

 

 

 

 

 

где S – функция суммы квадратов.

Подберем b0 и b1 так, чтобы при подстановке их вместо β0 и β1 значение S было минимальным из возможных. Найдем частные производные (∂):

 

S

2

m

y

 

x

2 ,

 

 

 

 

 

0

 

i

 

 

 

0

1 1

 

 

i 1

 

 

 

 

 

 

S

2 m

x y

 

x 2 .

 

1

i 1

 

i

 

 

0

1

1

 

 

 

i

 

Наименьшее значение суммы квадратов отклонений достигается в том случае, когда коэффициенты β0 и β1 удовлетворяют условию

S S 0.0 1

Имеющиеся экспериментальные данные в виде пар (хi, yi) являются лишь ограниченной выборкой из общего числа состояний исследуемого объекта. Поэтому можно определить только оценки коэффициентов β0 и β1,которые обозначают соответственно b0 и b1.

ŷ = b0 + b1x.

Такие модели часто называют однофакторными регрессионными моделями. Коэффициент регрессии b1 определяется по формуле

30

Соседние файлы в папке книги