Интерпретация уравнения регрессии
Проводя статистический анализ и получив адекватное уравнение приближенной регрессии, приступают к его интерпретации. Под интерпретацией обычно понимают перевод полученной математической модели (уравнения регрессии) на язык экспериментатора. Задача интерпретации достаточно сложна и многообразна, однако общие рекомендации могут быть сведены к следующему.
Сначала устанавливают, в какой мере каждый из входных исследуемых факторов системы влияет на выходной параметр (параметр оптимизации). Модуль коэффициента регрессии – это количественная мера данного влияния. О характере влияния входных факторов говорят знаки коэффициентов регрессии. Знак «+» свидетельствует о том, что с увеличением значения данного входного фактора будет расти и величина выходного параметра системы; при знаке «–» увеличение значения данного фактора приведет к уменьшению выходного параметра (параметра оптимизации).
Проведя анализ коэффициентов при всех линейных эффектах. Переходят к интерпретации коэффициентов при парных взаимодействиях факторов. Физически взаимодействие между факторами означает, что изменение выходного параметра У на различных уровнях одного входного фактора не одинаково для всех уровней другого входного фактора. Характер влияния парных взаимодействий на выходной параметр системы также определяется знаком соответствующего коэффициента регрессии.
При этом, если знак «+», то одновременное увеличение или уменьшение данных факторов вызывает увеличение выходного параметра. Для его уменьшения необходимо одновременно изменять величины факторов в различных направлениях.
Если эффект взаимодействия имеет знак «–», то одновременно увеличение или уменьшение факторов вызывает уменьшение выходного параметра. Для его увеличения необходимо одновременно изменять величины данных факторов в разных направлениях.
Интерпретацию коэффициентов при взаимодействиях более высокого порядка, как правило, не проводят из-за сложности понимания их физической сущности.
После интерпретации результатов моделирования переходят к принятию решений о дальнейших исследованиях. При этом количество возможных ситуаций перечислить невозможно. Остановимся лишь на наиболее часто встречающихся.
1 Если линейная модель адекватна и коэффициенты регрессии значимы, то можно либо закончить исследование, либо продолжить с целью подробного исследования области оптимума.
2 Если линейная модель адекватна, а большая часть коэффициентов уравнения регрессии незначима, то можно либо изменить интервал варьирования факторов, либо отсеять незначимые факторы, либо увеличить число параллельных опытов, а если область оптимума близка, то можно закончить исследования.
Необходимо подчеркнуть, что изменение интервалов варьирования приводит к изменению коэффициентов регрессии. Абсолютные величины коэффициентов регрессии увеличиваются с увеличением интервалов. Не изменяются лишь знаки коэффициентов, однако и они могут измениться на противоположные, если при движении мы «перешагнули» экстремальную точку.
3 Если линейная модель адекватна, а все коэффициенты уравнения регрессии незначимы, кроме b0 , необходимо либо увеличить точность эксперимента, либо расширить интервалы варьирования. Если область оптимума близка, то можно закончить исследование.
4 Если линейная модель неадекватна, это значит, что не удается аппроксимировать поверхность отклика плоскостью. В этом случае изменяют (уменьшают) интервалы варьирования, выбирают другую точку в качестве базового уровня, либо используют нелинейную модель. Если область оптимума близка, то можно закончить исследование.
5 Особый случай имеет место при использовании насыщенных планов. При значимости всех коэффициентов (линейных и нелинейных) ничего нельзя сказать об адекватности при неадекватности модели, так как в этом случае невозможно рассчитать дисперсию адекватности, в силу того, что число степеней свободы будет равно нулю.
В этом случае при близости области оптимума можно закончить исследование, а в противном случае – продолжить.
В случае продолжения исследования с целью изучения области оптимума наиболее распространенными методами являются:
Метод Гаусса – Зейделя и метод «крутого восхождения» Бокса-Уилсона. Второй метод является более предпочтительным, так как дает возможность найти оптимальную область за меньшее число опытов.
Закончив интерпретацию уравнения регрессии и приняв решение на окончание исследований, целесообразно осуществить обратный переход от кодированных факторов xi к натуральным переменным zi(1). Переход можно осуществить по линейному преобразованию вида:
где zi – значение i – го входного фактора в натуральном масштабе;
zi0 – базовый уровень i-го входного фактора в натуральном масштабе;
– интервал варьирования i-го входного фактора в натуральном масштабе.
Следует отметить, что после осуществления обратного перехода заменятся величины и знаки коэффициентов уравнения приближенной регрессии и пропадет возможность интерпретации влияния факторов по величине и знакам данных коэффициентов. Однако появляется возможность исследования поведения выходного параметра в зависимости от натуральных величин входных факторов без проведения экспериментов с изучаемой системой.
При этом следует, остановиться ещё на одной важной проблеме, которая связана с обработкой результатов активного эксперимента, проведённого на ЭВМ с помощью математической или имитационной модели исследуемой системы.
Эта проблема состоит в определении пространства выводов о реальной системе, сделанных на основе данных модели, или насколько смело можно использовать полученные выводы и результаты.
Так как математическая или имитационная модель никогда не бывает тождественна реальной системе и не передаёт всех её свойств и особенностей, то и результаты, полученные при анализе модели, всегда носят для объекта приближенный характер. Их точность определяется степенью соответствия, адекватности модели и объекта. Поэтому, делая определённые выводы и давая практические рекомендации, мы должны постоянно помнить, что они с достаточной степенью достоверны лишь в тех ограничениях, в которых была разработана наша математическая (имитационная) модель, и в тех интервалах варьирования входных факторов системы, в которых проводился вычислительный (имитационный) эксперимент.
Задача.
Оценить характер и величину влияния ошибок определения основных баллистических параметров – начальной скорости полёта снаряда , угла бросания , баллистического коэффициента на отклонение центра группирования снарядов от точки прицеливания по дальности при стрельбе из 152-мм С1` 2С3 на заряде первом, снарядом 540. Начальные значения исследуемых входных факторов и срединные ошибки их определения, по данным таблиц стрельбы ТС РГ 153, соответственно равны:
= 603 м/с; E [dV0] = 0,23 % V0 = 1,39 м/с;
= 45 град; E [dq0] = 0,25 тыс. = 0,015 град.;
= 0,5232; E[dC] = 0.72 % C = 0,0038.
Задачу исследования решить на основе проведения вычислительного эксперимента с использованием математической модели движения центра масс артиллерийского снаряда. С этой целью спланировать и провести ПФЭ и обработать его результаты методом множественного регрессионного анализа.
Решение
1 Выполняем мероприятия этапа предпланирования эксперимента.
Согласно задаче исследования, необходимо оценить влияние ошибок определения трёх независимых входных факторов , и на выходной параметр – отклонение центра группирования снарядов от точки прицеливания по дальности . С этой целью на начальном этапе исследования попытаемся аппроксимировать поверхность отклика математической моделью вида:
. (3.36)
Следовательно, каждый из входных факторов моно варьировать только на двух уровнях – верхнем и нижнем, а количество опытов N будет равно 8:
N = 23 = 8.
Для определения дисперсии воспроизводимости экспериментов проведём по три параллельных опыта в каждой точке плана. За центр плана – базовый уровень – принимаем начальные значения исследуемых факторов. Интервал варьирования входных факторов выбираем широкий и равный четырём срединным ошибкам определения исследуемых входных факторов. Значения перечисленных параметров в натуральном масштабе приведены в таблице 3.3.
Таблица 3.3 – Исходный статистический материал в натуральном масштабе
Уровни факторов | Входные факторы | ||
, м/с | , град | С | |
Базовый уровень | 0,5232 | ||
Интервал варьирования | 5,560 | 0,06 | 0,0152 |
Верхний уровень | 608,56 | 45,06 | 0,5384 |
Нижний уровень | 597,44 | 44,94 | 0,5080 |
Для построения модели вида (3.36) осуществим кодирование входных факторов, построим матрицу планирования ПФЭ 23 и после рандомизации проведем 24 опыта с использованием математический модели движения центра масс снаряда.
Матрица планирования и результаты вычислительного эксперимента приведены в таблице 3.4.
Таблица 3.4. – Матрица планирования и результаты вычислительного эксперимента
№ опыта | Кодированные входные факторы | Выходной параметр | |||||
x0 | x1 | x2 | x3 | y1 | y2 | y3 | |
+ + + + + + + + | - + - + - + - + | - - + + - - + + | - - - - + + + + | -88 -405 -28 -350 | -72 -429 -15 -362 | -63 -392 -41 -310 |
В таблице 3.4. приняты следующие обозначения:
X0 – фиктивная переменная;
X1 – фактор в кодированном виде;
X2 – фактор в кодированном виде;
X3 – фактор С в кодированном виде;
yij, где i-1.8; j-1.3 – значения выходного параметра в метрах и в ij- опыте.
В качестве входных неуправляемых случайных факторов, создающих «шум» при проведении вычислительного эксперимента, были заданы случайные воздействия внешней среды – метеофакторы, как суммы соответствующих постоянных и случайных составляющих.
2 Проверка возможности проведения обработки результатов эксперимента методом множественного регрессионного анализа.
Выполнение основных предпосылок возможности проведения регрессионного анализа предопределено порядком проведения эксперимента. Так как эксперимент вычислительный, то ошибка фиксации (измерения) значений входных исследуемых факторов равна нулю. «Шум» эксперимента является случайной величиной, распределенной по нормальному закону с параметрами N(M[ ] = 0, ), так как разброс метеофакторов моделировался нормальным законом распределения. Следовательно, и выходной параметр Д - также будет подчиняться данному закону распределения (это следует из-за того, что в результате композиции нескольких нормальных законов получается нормальное суммарное распределение). Таким образом, следует проверить предпосылку – однородность оценок дисперсии выходного параметра.
Как было отмечено ранее, фактически это проверка постоянства дисперсии «шума»:
.
Считается, что это условие выполнено, если справедлива гипотеза:
.
Проверка данной гипотезы при конкурирующей H1 хотя бы одна дисперсия не равна остальным, для одинакового числа параллельных опытов в каждой точке плана эксперимента, производится с помощью критерия Кохрена. Статистика G этого критерия имеет вид:
, (3.37)
где – оценка дисперсии выходного параметра для j-го опыта.
Например, для первого опыта имеем:
Проведя аналогично вычисления, получим оценки и , значения которых приведены в таблице 3.5.
Таблица 3.5 – Исходный материал для проверки однородности оценок
дисперсий
№ опыта | ||||||||
Оценка | -74,3 | -408,7 | -28,0 | -341,0 | 350,7 | 43,3 | 347,3 | 93,0 |
Оценка | 160,3 | 352,3 | 169,0 | 751,0 | 324,3 | 444,3 | 466,3 | 351,0 |
Определяем расчетное значение G - критерия по формуле (3.37):
.
С целью проверки нулевой гипотезы H0: по таблице значений G – критерия (приложение А) выбираем его критическое табличное значение для уровня значимости l = 0.05 числа степеней свободы f = l – 1 = 3 – 1 = 2 и числа суммируемых оценок дисперсий, равного N:
Сравниваем расчетное и табличное значение G – критерия:
.
Так как расчетное значение меньше табличного критического значения, то гипотеза об однородности ряда выборочных дисперсий выходного параметра не отвергается. Это означает, что значимых различий и в качестве оценки дисперсии воспроизводимости эксперимента можно взять среднюю дисперсию, то есть:
;
.
Таким образом, все предпосылки для проведения множественного регрессионного анализа выполняются и можно приступить к расчету коэффициентов уравнения регрессии.
3 Определяем оценки коэффициентов регрессии:
,
,
,
,
Таким образом, уравнение приближенной регрессии будет иметь вид:
.
4 Проводим статистический анализ уравнения регрессии.
Проверка адекватности уравнения регрессии результатам эксперимента:
Определим значения оценок выходного параметра по результатам вычислений с использованием полученного уравнения приближенной регрессии:
Вычисляем оценку дисперсии адекватности:
Вычисляем расчетное значение F-критерия:
C целью проверки статистической гипотезы вида:
определяем из таблицы приложения Б критическое значение F – критерия для уровня значимости α = 0.05 и степеней свободы числителя
f1= N – h = 8 – 4 = 4
и знаменателя f2 = 16;
.
Сравниваем расчетное и табличное значения F – критерия:
Fрасч. = 4,5926 > Fтабл. = 3,7294.
Так как расчетное значение F – критерия больше табличного, то гипотеза об адекватности полученного значения приближенной регрессии экспериментальным данным отвергается.
Как было отмечено выше, в данном случае можно уменьшить интервалы варьирования факторов, выбрать другую базовую точку либо перейти к нелинейной модели – к полиному второго порядка. Однако в рассматриваемых условиях целесообразно учесть, что один из часто встречающихся видов нелинейности связан с тем, что эффект одного фактора зависит от уровня, на котором находится другой фактор. ПФЭ позволяет количественно оценить все эффекты взаимодействия факторов. Дополнительных экспериментов при этом проводить не требуется, следует лишь расширить исходную матрицу планирования. Вид такой матрицы приведен в таблице 3.6.
Таблица 3.6 – Расширенная матрица планирования ПФЭ 23
№ опыта | Кодированные входные факторы | Выходной параметр | |||||||
X0 | X1 | X2 | X3 | X1X2 | X1X3 | X2X3 | X1X2X3 | ||
+ | - | - | - | + | + | + | - | -74,3 | |
+ | + | - | - | - | - | + | + | -408,7 | |
+ | - | + | - | - | + | - | + | -28,0 | |
+ | + | + | - | + | - | - | - | -341,0 | |
+ | - | - | + | + | - | - | + | 350,7 | |
+ | + | - | + | - | + | - | - | 43,3 | |
+ | - | + | + | - | - | + | - | 347,3 | |
+ | + | + | + | + | + | + | + | 93,0 |
5 Определяемоценки коэффициентов регрессии при взаимодействиях факторов.
Планирование по матрице, представленной в таблица 3.6, позволяет получить математическую модель вида:
.
Определяем неизвестные оценки коэффициентов регрессии:
Выполняя аналогичные вычисления, можно получить следующие величины оценок коэффициентов регрессии: b13 = +10.7; b23 = -8.46; b123 = +3.96.
Записываем аналогичные вычисления приближенной регрессии:
6 Проводим статистический анализ уравнения регрессии.
Так как в полученном уравнении число оцениваемых коэффициентов регрессии равно числу опытов N и степеней свободы для проверки его адекватности нет, то статистический анализ начнем с проверки значимости коэффициентов.
6.1 Проверка значимости оценок коэффициентов регрессии.
C целью проверки статистической гипотезы вида:
определяем из таблицы приложения Г критическое значение t – критерия для уровня значимости 0.05 и числа степеней свободы:
Сравниваем расчетные значения t – критерия с критическим табличным значением. Коэффициенты, для которых выполняется условие
,
следует признать статистически значимыми и оставить в уравнении регрессии, а все остальные исключить.
Уравнение регрессии принимает вид:
6.2 Проверка адекватности уравнения регрессии результатам эксперимента:
Таким образом, полученное уравнение приближенной регрессии адекватно описывает исследуемый процесс, то есть математическая модель (полином) хорошо согласуется с экспериментальными данными.
7 Интерпретация уравнения регрессии.
Обработав результаты ПФЭ, мы получили уравнение приближенной регрессии (полином первой степени):
которое адекватно описывает зависимость отклонения центра группирования снарядов от точки прицеливания до дальности Д от ошибок определения основных баллистических параметров . Коэффициенты данного уравнения являются частными производными выходного параметра по соответствующим переменным. Их геометрический смысл – тангенсы углов наклона гиперплоскости к соответствующей оси.
Поэтому больший по абсолютной величине коэффициент соответствует большему углу наклона и, следовательно, более существенному изменению выходного параметра при изменении данного фактора.
Анализ величин коэффициентов регрессии показывает, что преобладающий вклад в выходной параметр вносит фактор x3-ошибка определения баллистического коэффициента С и фактор -ошибка определения начальной скорости полета снаряда . Следует отметить, что наряду с линейными эффектами на величину Д оказывают влияние и парные взаимодействия факторов, вклад которых в исследуемый процесс незначителен и приблизительно одинаков.
Так как величину отклонения центра группирования снарядов от точки прицеливания за счет ошибок определения основных баллистических параметров следует минимизировать, то благоприятным является увеличение фактора x1 и уменьшение факторов x2 и x3. Для уменьшения влияния взаимодействий факторов x1, x2, x3данные факторы должны изменяться одновременно в разных направлениях. Учитывая влияние линейных эффектов, следует фактор x1 увеличивать, а x2 и x3 уменьшать. Коэффициент регрессии при взаимодействии x2x3имеет знак минус, поэтому для уменьшения влияния данного эффекта следует одновременно увеличивать или уменьшать факторы x2 и x3. С учетом влияния их линейных эффектов следует одновременно уменьшить данные факторы.
Следует отметить, что результаты интерпретации иногда могут расходиться с априорными теоретическими представлениями об изучаемом процессе. В этом случае (при корректном эксперименте) нужно иметь в виду, что эксперимент проводится в локальной области факторного пространства, и коэффициенты регрессии отражают влияние факторов только в этой области. Заранее неизвестно, в какой мере можно распространить полученный результат на другие области, а теоретические представления имеют обычно более общий характер. Кроме того, априорная информация часто основывается на однофакторных зависимостях. При переходе к многофакторному пространству ситуация может измениться.
На заключительном этапе интерпретации можно построить уравнение регрессии для натуральных значений факторов, то есть осуществить обратный переход от безразмерной к размерной системе координат:
По полученному уравнению можно предсказывать (вычислять) величину отклонения центра группирования снарядов от точки прицеливания до дальности Д при изменении входных исследуемых факторов в пределах области экспериментирования.
Дата добавления: 2021-11-16; просмотров: 482;