Регрессионный анализ.
Величина коэффициента корреляции позволяет вытеснить тесноту (силу) и направление связи, однако этим не исчерпываются возможности изучения сопряжённости между признаками. Более того, во многих исследованиях возникает необходимость изучить не столько меру корреляции, сколько форму её и характер изменения одного признака в зависимости от изменения другого. Последнее особенно важно в тех случаях, когда фактические наблюдения не охватывают всего разнообразия признака и цель исследования заключается в том, чтобы выяснить взаимозависимости между недостающими данными. Например, при изучении влияния дозы азотного удобрения, вносимого под ячмень, на содержание белка в зерне, научный интерес представляет не только установление тесноты связи и её направленность между этими изучаемыми показателями, но и на сколько повышается белковость зерна от каждого килограмма внесённого в почву азота.
Регрессионный анализ заключается в том, чтобы отыскать линию (прямую в случае линейной корреляции, параболу первого, второго и т.д. порядка при криволинейной зависимости) наиболее точно выражающую зависимость одного признака от другого. Кроме того, при помощи регрессионного анализа можно выяснить ошибку опытных данных, влияющих на конечные результаты исследования.
Существует множество аналитических методов определения регрессии, которые зависят от типа регрессии (парная или множественная), а также от типа, по которому отмечается взаимосвязь (прямая линия, гипербола, парабола и т.д.).
Парная регрессияхарактеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:
прямой ;
гиперболы
параболы и т.д.
Определить тип уравнения можно, исследуя зависимость графически, однако в практике не часто прибегают к этому методу определения уравнения.
Оценка параметров уравнений регрессии (а, b1, b2…) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
SS = → min
Рисунок 8. Прямая линия регрессии на графике зависимости содержания белка в зерне ячменя от дозы азотного удобрения
Рисунок 9. Параболическая линия регрессии на графике зависимости содержания белка в зерне ячменя от дозы азотного удобрения
В отношении установленной зависимости между дозами азотного удобрения и содержания белка в зерне ячменя данное правило можно интерпретировать так: прямая линия должна быть максимально приближена ко всем значениям ху или ух, что отчётливо отмечается на графике (рисунок 2 и рисунок 3)
Задача регрессионного анализа состоит в том, чтобы установить параметры уравнения регрессии (а, b1, b2…) или иными словами, описать взаимосвязь между изучаемыми показателями с помощью уравнения, оценить на какую величину изменяется значение результативного признака, при изменении факторного на единицу.
Нахождение параметров линейной парной регрессии общепринятым методом осуществляется решением системы нормальных уравнений следующего вида:
, (65)
где n – объём исследуемой совокупности (число единиц наблюдений).
В уравнениях регрессии параметр a показывает усреднённое влияние на результативный признак неучтённых в уравнении факторных признаков: коэффициент регрессии b показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения. Таким образом, решая данную систему нормальных уравнений задача состоит именно в определении параметров уравнения регрессии a и b.
Уравнение линейной регрессии , в сельскохозяйственных и биологических исследованиях нередко представляют несколько в другом виде:
, (66)
или аналогично для нахождения теоретической линии регрессии х по у: , (67)
где и - средние арифметические для ряда х и у;
- коэффициент регрессии у по х,
- коэффициент регрессии х по у .
Коэффициенты регрессии вычисляются по формулам:
; (68)
. (69)
Числители этих формул представляют собой сумму произведений отклонений значений х и у от своих средних (то есть числитель формулы (64) расчёта коэффициента корреляции), а знаменатели – сумму квадратов отклонений от средних. Таким образом, связь между коэффициентов корреляции и коэффициентом регрессии можно математически выразить так:
; . (70, 71)
Произведение коэффициентов регрессии равно коэффициенту детерминации:
=RI (72)
При регрессионном анализе проводят обычно две оценки выборочных коэффициентов регрессии: а) оценки величины отклонений от линии регрессии и б) оценку существенности b, то есть значимость отклонения его от нуля.
Ошибка коэффициента регрессии вычисляется по формуле:
и . (73, 74)
Критерий существенности коэффициента регрессии определяют по формуле:
(75)
Существенность коэффициента регрессии оценивают по приложению II, число степеней свободы df принимают равным n–2.
Дата добавления: 2021-01-26; просмотров: 370;