Активные эксперименты
Современная теория многофакторного эксперимента (МФЭ) зародилась в конце тридцатых годов. Именно в этот период появились первые публикации Фишера. Он предложил метод дисперсионного анализа, позволяющий получать зависимость выходной величины исследуемого объекта сразу от нескольких количественных переменных. В основе методологии МФЭ лежит системный подход, предполагающий изучение состояния объекта при одновременном изменении большого числа независимых переменных.
МФЭ позволяет решать следующие задачи:
· раскрытие механизма процесса или явления, т.е. построение математической модели в условиях неопределенности;
· выделение факторов, существенно влияющих на выходную величину;
· идентификацию объектов; т.е. определение их состояния и параметров в процессе функционирования. Решение этой задачи является предпосылкой оптимального управления объекта.
· экстраполяцию объектов в пространстве и во времени.
Рассмотрим сущность и основные понятия МФЭ. Пусть имеем однооткликовую модель т. е.
y = f (x1,x2,…,xk) (2.48)
Эта зависимость заранее неизвестна, но предполагается, что функция f(x1,…,xk) - аналитическая (гладкая) в окрестности точки и может быть разложена в ряд Тейлора. В этом случае функция f(x1,…,xk) может быть представлена в виде полинома первой, второй и т. д. степени. Пространство, образованное факторами , называется факторным пространством.
Каждому набору значений факторов в факторном пространстве соответствует точка, которой, в свою очередь, соответствует некоторое значение отклика y (см. рис.2.11).
Рис. 2.11. Графическое изображение двухоткликовой модели y=f(x1,x2)
Здесь x1Ox2– двухфакторное пространство. Точки 1,2,3,4 определяют четыре набора факторов. В каждой такой точке производится одно или несколько измерений отклика y1, y2, y3, y4. Полученные значения отклика используют для построения поверхности , которую называют поверхностью отклика, а наборы значений факторов (точки 1–4) образуют область эксперимента .
Для повышения точности в каждой точке факторного пространства проводят несколько независимых опытов. Такие опыты называются параллельными.
Точность аппроксимации экспериментальных точек y1, y2, y3, y4 поверхностью отклика зависит от ряда условий, в том числе и от размеров области эксперимента . При большой кривизне поверхности отклика ( велика) с увеличением области степень аппроксимирующего полинома надо увеличивать, а это усложняет эксперимент и обработку результатов. С другой стороны, эта область не может быть и слишком малой. В большинстве практических случаев она должна быть меньше области возможных значений . Такую область будем называть область исследования . Если , то применяют принципы дискретного обзора факторного пространства (рис.2.12).
Рис.2.12. Сканирование двухфакторного пространства
В начале эксперимент ставится в некоторой области с центром О1. Опыты проводятся в вершинах этой области. Затем, если цель эксперимента не достигнута, переходят к области и т. д. Область , , должны принадлежать области исследований . В последней области отклик для повышения точности измеряется в восьми точках.
Организация эксперимента. Непосредственному проведению МФЭ предшествует подготовительная работа – предпланирование или организация эксперимента, которая состоит из:
· изучения объекта и формулировки цели исследования;
· выбора откликов;
· выбора факторов и интервалов варьирования;
· разработки экспериментальной установки, метрологического и программного обеспечения;
· составления таблицы условий и плана эксперимента.
Рассмотрим подробнее каждый из пунктов.
Формулировка цели эксперимента и выбор отклика.
Эксперимент ставится с целью получения модели объекта, которая позволяет определять количественное влияние факторов на отклик.
В общем случае задача эксперимента бывает многокритериальной, в которой необходимо искать компромиссные решения . Это обусловлено многооткликовостью реальных объектов и необходимостью получения оптимального решения.
Отклик определяется объектом исследования и задачей поставленной перед экспериментатором, но, в конечном итоге, четкое формулирование цели и выбор отклика остается за экспериментатором, т. е. здесь присутствует элемент субъективизма, однако существует ряд общих требований к отклику:
· он должен быть количественной величиной, доступной непосредственному или косвенному измерению с необходимой точностью;
· иметь простой физический смысл, т. к. в дальнейшем будет необходимо интерпретировать полученные результаты;
· обладать однозначностью, т. е. одному набору факторов должно соответствовать одно (с точностью до погрешностей опыта) значение отклика;
· быть достаточно универсальным, т. е. наиболее полно характеризовать объект, его функциональную сущность.
Выбор и кодирование факторов.
В большинстве технических приложений МФЭ факторы это независимые переменные, которые в процессе эксперимента могут изменяться по воле экспериментатора и могут быть измерены с оговоренной точностью. Следует заметить, что существует класс задач, где факторы не могут быть выражены количественно (сорт или класс продукта, квалификация оператора, препараты различных партий или заводов изготовителей и т. п.). Это относится к проведению экспериментов в области сельского хозяйства и биомедицины, экономики, социальной сферы.
На этапе предпланирования, анализируя все факторы влияющие на отклик, необходимо выбрать доминирующие, существенно влияющие на отклик. Если в ходе эксперимента не будет учтен какой-либо фактор, то это может существенно исказить результат, т. е. модель не будет отвечать критерию адекватности. С другой стороны, включение в эксперимент факторов, слабо влияющих на отклик, приводит лишним затратам, усложняет обработку результатов и делает модель излишне сложной, неудобной к применению.
В МФЭ могут быть сотни факторов, по-разному действующих на отклик. Существуют различные методики, позволяющие выделить существенные факторы. Для экспериментов с числом факторов, не превышающим пятнадцати, это осуществляется методом однофакторного эксперимента.
Все факторы изменяют в пределах 10-20% от номинальных значений. К числу значимых относят те, которые в одинаковой степени влияют отклик. Если некоторые факторы изменяют отклик на 50-100%, а большинство остальных на 10-15%, то интервал варьирования сильно действующих факторов изменяют так, чтобы отклик изменялся как от воздействия остальных.
В общем случае факторы должны отвечать требованиям:
· при изменении любого фактора остальные не должны изменяться;
· в процессе эксперимента каждый фактор может принимать два или более дискретных значений, устанавливаемых экспериментатором, поэтому они должны быть изменяемыми;
· факторы считают детерминированными, точно известными величинами, которые должны измеряться с точностью на порядок больше точности измерения отклика;
· факторы и их сочетания не должны выходить за пределы допустимых значений т. к. это может создать аварийную ситуацию. Это требование называется свойством совместимости факторов в области эксперимента .
После выбора откликов и факторов приступают к разработке плана эксперимента. Планирование и обработка данных эксперимента осуществляется не в физических, а в кодированных (приведенных) переменных , где –основной уровень i–го фактора, –интервал варьирования i–го фактора.
Рис.2.13. Физические и кодированные переменные
Основной уровень находится в середине диапазона изменения фактора
.
Интервал варьирования - это половина диапазона изменения фактора
.
В МФЭ наиболее часто применяют двухуровневые полные и дробные факторные эксперименты В них каждый фактор варьируется на двух уровнях и . Кодированные значения фактора в этом случае принимают значения +1 и -1, т.е. интервал варьирования всех кодированных факторов будет один и тот же и равен 1.
Для кодированных факторов в двухуровневом МФЭ необходимо знать две величины – основной уровень и интервал варьирования . Рассмотрим как выбираются эти величины.
Основной уровень определяет центр или положение области эксперимента в факторном пространстве. Изменяя можно исследовать интересующую часть пространства. Обычно такой частью является область номинальных значений параметров.
Интервал варьирования определяет размер области эксперимента и существенно влияет на достоверность и информативность экспериментальных данных. С точки зрения повышения информативности необходимо увеличивать . Однако увеличение может нарушить требование к адекватности модели. Это видно из рис. 2.14. Здесь выбрано два интервала варьирования и , которым соответствуют две линейные модели и . Видно, что для интервала степень близости к истинной зависимости (адекватность) выше, чем для интервала .
Рис. 2.14. К выбору интервала варьирования переменных
Пример. Необходимо выбрать основной уровень и интервал варьирования питающего напряжения операционного усиления. Номинальное напряжение питания , т.е. .
Предположим, что точность измерения напряжения соответствует «трехсигмовому» закону , т.е.
или ,
где - предельное значение погрешности измерения напряжения данным прибором . Если класс точности вольтметра равен 2.5, а предельное значение шкалы - 20 В, то
,
тогда
.
Следовательно, интервал варьирования будет равен
или
Аналогично можно вычислить значения , и для любых факторов. Результаты заносят в таблицу .
Например, для четырехфакторного эксперимента интервалы варьирования для факторов R1, C1, R2 и Uп могут быть представлены в виде таблицы условий эксперимента.
Величина | Фактор | |||
Основной уровень | ||||
Интервал варьирования | ||||
Нижний уровень | ||||
Верхний уровень |
Практическую реализацию этих условий для электрических цепей осуществляют с помощью последовательного или параллельного подсоединения соответствующих элементов (см. рис. 2.15).
Рис. 2.15. Электрическая схема реализации варьирования переменных
МФЭ, к которым относятся полные и дробные факторные эксперименты, наиболее часто применяются для построения линейных относительно параметров полиномиальных моделей. Вид полинома структура выбирается на этапе предпланирования до проведения эксперимента, а его параметры (коэффициенты) вычисляются по полученным экспериментальным данным.
Распространение полиномиальных моделей объясняется тем, что исследуемая экспериментальными методами функция многих переменных y=f(x1,x2,…,xk) в ограниченной области эксперимента , при некоторых допущениях, можно разложить в ряд Тейлора.
Например, разложение функции двух переменных y=f(x1,x2) в окрестности центра плана x1=0, x2=0 имеет вид
.
Здесь и все частные производные вычисляются для центра плана, т.е. при x1=x2=0. Вводя соответствующие обозначения, получим модель вида
В практических случаях всегда можно ограничиться полиномами, включающими первые степени переменных и их различные произведения или первые и вторые степени переменных и крайне редко более высокие степени.
Полные и дробные факторные эксперименты, в которых каждый фактор принимает только два значения (уровня), применяются для отыскания параметров полиномиальных моделей без учета квадратов. Теоретическое уравнение такой модели, в общем случае, имеет вид:
(2.50)
где –свободный член; –коэффициенты, учитывающие влияние на отклик (эффекты) линейных членов, парных, тройных и т. д. взаимодействий факторов.
В силу ограниченности статистического материала, получаемого в результате эксперимента, применение МНК для определения –коэффициентов позволяют найти только их оценки. В этом случае (2.50) запишется как
здесь коэффициенты являются оценками соответствующих –коэффициентов модели (2.50), а –оценка отклика у.
Для упрощения и формализации экспериментальной процедуры в теории планирования экспериментов применяют специальные планы.
Эксперимент, реализующий все возможные наборы факторов называется полным факторным экспериментом (ПФЭ). Тогда при варьировании всех k параметров (факторов) на двух уровнях будем иметь ПФЭ 2k. В таком эксперименте количество точек факторного пространства, в которых измеряется отклик, равно 2k.
Наборы факторов, которые реализуются в эксперименте, записываются в виде таблицы или матрицы. Эта матрица называется матрицей планирования.
Рассмотрим процедуру составления матриц планирования ПФЭ 2k для различных значений числа факторов k. Матрицу записывают в кодированных переменных xi.
Рис. 2.16. Двухфакторное пространство
Рассмотрим ПФЭ 22. Четыре набора факторов в кодированной системе координат запишутся как: 1(–1–1), 2(+1–1), 3(–1+1),4(+1+1). В соответствии с этими значениями можно построить план, в котором каждому и набору соответствует отклик .
План ПФЭ 2k
Номер набора u | Факторы | Отклик | |
–1 | –1 | Y1 | |
+1 | –1 | Y2 | |
–1 | +1 | Y3 | |
+1 | +1 | Y4 |
Для этого плана матрица планирования имеет вид
Аналогично можно записать матрицу для трех факторов.
План ПФЭ 23
Номер набора u | Факторы | Отклик | ||
–1 | –1 | –1 | Y1 | |
+1 | –1 | –1 | Y2 | |
–1 | +1 | –1 | Y3 | |
+1 | +1 | –1 | Y4 | |
–1 | –1 | +1 | Y5 | |
+1 | –1 | +1 | Y6 | |
–1 | +1 | +1 | Y7 | |
+1 | +1 | +1 | Y8 |
Матрица планирования:
Из приведенных примеров следует общий прием построения матриц более высокого порядка. В первом столбце знак меняется поочередно, во втором - чередуется через два, а в третьем - через четыре, в четвертом - через восемь и далее по степеням двойки.
Матрицы планирования обладают тремя свойствами.
1) Свойство симметрии заключается в том, что все наборы факторов (точки плана) симметричны относительно центра плана
, , (2.51)
где u – номер опыта; N – число опытов; i - номер фактора.
Это свойство означает, что сумма элементов любого столбца матрицы планирования равна нулю
2) Свойство нормировки. Сумма квадратов элементов любого столбца равна количеству строк N, т.е.
, . (2.52)
3) Свойство ортогональности. Сумма по членных произведений любых двух столбцов матрицы планирования равна нулю
, . (2.53)
Матрица планирования показывает: в каких точках факторного пространства надо произвести измерение отклика. Каждый u-ый опыт состоит в установке определенных значений факторов и измерения отклика, соответствующего этому набору.
Требуемые наборы кодированных факторов устанавливаются изменением соответствующих значений физических величин из таблицы условий эксперимента.
+1 соответствует ,
+ соответствует
–1 соответствует .
В полном факторном эксперименте опыты реализуются при всех возможных наборах уровней факторов, т. е. для двухуровнего k-факторного эксперимента опыты производятся в 2k точках факторного пространства.
На основе таких опытов можно найти 2k коэффициента уравнения регрессии. Если число факторов k 4, эффекты взаимодействия высокого порядка становятся статистически малозначимыми. Практика экспериментов показывает, что при q 4 влияние сомножителей x1x2… xq на отклик у взаимно компенсируются и соответствующий коэффициент уравнения регрессии становится статистически незначимым. Этот опытный факт позволяет априорно считать, что в уравнении регрессии с большим числом факторов b–коэффициенты высоких порядков взаимодействия равны нулю. Следовательно, при большом количестве факторов можно построить такие планы, которые позволяют определить линейные эффекты факторов, эффекты их парных и редко тройных взаимодействий.
Такие процедуры позволяют существенно сократить трудоемкость проведения экспериментов.
Пример. Пусть количество факторов k=10. Тогда полный факторный эксперимент необходимо осуществить в точек. Если ограничиться только линейными и первыми взаимодействиями, то , т. е. условная трудоемкость эксперимента может быть уменьшена в раз. Поэтому уменьшение количества определяемых коэффициентов уравнения регрессии очень актуально с точки зрения затрат на проведение эксперимента и обработки получаемых данных.
Таким образом, в экспериментах с большим количеством факторов число определяемых коэффициентов может быть значительно меньше опытных точек ПФЭ =2k. Отсюда возникает задача – построить такой план, в котором количество опытных точек будет равно количеству определяемых b–коэффициентов. Этому отвечают часть (реплики) ПФЭ 2k , кратные 2р, где р –целое положительное число.
Такие эксперименты называются дробными факторными экспериментами ДФЭ2k-р. Количество опытных точек в ДФЭ 2k-з в 2р раз меньше, чем в ПФЭ2k . Здесь k–общее количество факторов; р–число факторов, введенных путем замены незначимых взаимодействий; (k–p)–количество исходных факторов. Так как ДФЭ2k-р является частью ПФЭ2k , то его называют дробной репликой ПФЭ. Например ДФЭ, составляющий половину ПФЭ2k обозначается ДФЭ2k и называется полурепликой ПФЭ2k . Действительно 2k-1 = 2k . ДФЭ2k-2 содержит 2k опытных точек и называется одной четвертой репликой ПФЭ2k .
Обратимся к ПФЭ22 . Для него уравнение регрессии имеет вид
а матрица планирования
Номер набора u | Факторы | Отклик | |||
+1 | –1 | –1 | +1 | y1 | |
+1 | +1 | –1 | –1 | y2 | |
+1 | –1 | +1 | –1 | y3 | |
+1 | +1 | +1 | +1 | y4 |
Здесь – вектор-столбец фиктивной переменной перемещенной, которая во всех опытах принимает значение +1; вектор-столбец x3= x1x2 образован путем перемножения соответствующих столбцов.
Если предположить, что эффект от взаимодействия x1x2статически незначим ( 0), то в выбранных интервалах варьирования исследуемый процесс может быть описан линейной моделью, т. е. в этом случае достаточно определить три коэффициента: . Поскольку , то освободившийся столбец x1x2 можно использовать для построения плана ДФЭ3-1. Для этого используем новый фактор x3= x1x2. Заметим, что вектор-столбец x3, совпадает с вектором x1x2 , вектор столбец x1x2x3 , а x2 с x1x3 , т. е. соответствующие оценки коэффициентов смешиваются. Это означает, что коэффициент b1 включает в себя, кроме оценки коэффициента , еще и оценку коэффициента от взаимодействия x2x3 – и т. д. Символически это можно записать
Однако мы постулировали линейную модель и, следовательно, все парные взаимодействия статистически незначимы, т. е. можно полагать, что
т. е. оценки достоверны.
Таким образом, вместо восьми опытов для изучения влияния трех факторов достаточно осуществить всего четыре.
На основе плана, содержащего четыре строки, нельзя определить больше четырех коэффициентов уравнения регрессии. План, в котором, количество переменных (столбцов) меньше на единицу количества опытных точек (строк) называется насыщенным.
На основе плана ПФЭ 23 можно построить следующие дробные реплики:
Число факторов | Дробные реплики | Обозначения | Число опытное | |
Для дробной реплики | Для ПФЭ | |||
½ реплика от 23 | 23–1 | |||
½ реплика от 24 | 24–1 | |||
½ реплика от 25 | 25–2 | |||
½ реплика от 26 | 26–3 | |||
½ реплика от 27 | 27–4 |
Последний план – насыщенный, т. к. число факторов на единицу меньше количества строк .
На основе плана ПФЭ 23 можно построить уравнение регрессии
Оно содержит три парных и одно тройное взаимодействие. Если какое-либо одно взаимодействие является статистически незначимым, то строят полуреплику ДФЭ24–1. Если незначимы два взаимодействия, то строят ¼-реплику от ПФЭ 25, т. е. ДФЭ25–2 и т. д.
Построим ¼-реплику для случая, когда статистически незначимы коэффициенты и . Два дополнительных фактора и можно ввести с помощью соответствующих
а) б) в) г)
Эти соотношения называются генерирующими.
Составим план ДФЭ25–2
Номер набора | Отклик | ||||||||
+1 | –1 | –1 | –1 | +1 | –1 | +1 | –1 | у1 | |
+1 | +1 | –1 | –1 | –1 | +1 | +1 | +1 | у2 | |
+1 | –1 | +1 | –1 | –1 | –1 | –1 | +1 | у3 | |
+1 | +1 | +1 | –1 | +1 | +1 | –1 | –1 | у4 | |
+1 | –1 | –1 | +1 | +1 | +1 | –1 | +1 | у5 | |
+1 | +1 | –1 | +1 | –1 | –1 | –1 | –1 | у6 | |
+1 | –1 | +1 | +1 | –1 | +1 | +1 | –1 | у7 | |
+1 | +1 | +1 | +1 | +1 | –1 | +1 | +1 | у8 |
Для такого плана пяти факторов выделяют восемь точек факторного пространства, в которых необходимо построить отклик. В соответствии с ДФЭ25–2 можно построить линейную модель вида:
Таким образом, мы существенно сократим число опытов (8 вместо 32), однако при этом имеет место нежелательные эффекты смешивания оценок b–коэффициентов. Это означает, что при вычислении b–коэффициентов по данным МФЭ иногда получаются не оценки отдельных коэффициентов, а их различных комбинаций, например, b0 является оценкой не только модели
но и коэффициентов при квадратах факторов, т. е. квадратичных эффектов , которые в уравнение модели не входят, но в действительности имеют место.
Если все коэффициенты равны нулю, то является оценкой истинного значения . Это можно символически записать
.
Если некоторые не равны нулю, то является оценкой и всех, отличных от нуля
Рассмотрим подробнее эффект смешивания на примере ДФЭ23–1. Для него уравнение регрессии будет иметь вид:
Составим для ДФЭ3–1 две структурные матрицы, отличающиеся только знаками в столбцах для .
Таблица 1
Номер набора | ||||||||
+1 | –1 | –1 | +1 | +1 | –1 | –1 | +1 | |
+1 | +1 | –1 | –1 | –1 | –1 | +1 | +1 | |
+1 | –1 | +1 | –1 | –1 | +1 | –1 | +1 | |
+1 | +1 | +1 | +1 | +1 | +1 | +1 | +1 |
Таблица 2
Номер набора | ||||||||
+1 | –1 | –1 | –1 | +1 | +1 | +1 | –1 | |
+1 | +1 | –1 | +1 | –1 | +1 | –1 | –1 | |
+1 | –1 | +1 | +1 | –1 | –1 | +1 | –1 | |
+1 | +1 | +1 | –1 | +1 | –1 | –1 | –1 |
Из табл.1 видно, что имеются эквивалентные столбцы 5–6,4–7,3–8,2–9. Это означает, что вычисляя по данным эксперимента коэффициенты и , мы получим оценки сумме коэффициентов
(2.54)
В табл.2 эти же столбцы имеют противоположные знаки, т.е. , и т. д. Тогда
Если число факторов k>3, процедура анализа смешивания оценок становится очень громоздкой, поэтому вводят понятие контраст.
Для рассмотренных планов генератор дает контраст (т. к. ) С его помощью можно легко найти смешивание оценок. Умножая обе части контраста последовательно на получим соотношения
Эти равенства указывают на эквивалентность соответствующих столбцов планирования, из которых следует (2.54).
Аналогично можно провести анализ смешивания для генератора , которому соответствует контраст . Анализ смешивания оценок b–коэффициентов проводят для того, чтобы не допустить нежелательных смешиваний. В частности, к большим искажениям может привести смешивание линейных эффектов и парных взаимодействий , т. к. они в большинстве случаев имеют один порядок.
Итак мы познакомились с планированием ПФЭ и ДФЭ. План состоит из ряда строк, каждая из которых определяет набор значений факторов, т. е. ту точку факторного пространства, в котором должно быть произведено измерение отклика.
Очевидно, что результаты МФЭ – есть выборка из некоторой генеральной совокупности, т. е. по сути являются случайными величинами. Основной задачей обработки полученного статистического материала является оценка параметров п
Дата добавления: 2020-10-14; просмотров: 444;