Теоретические распределения. Дисперсионный анализ. Корреляционный и регрессионный анализ.


В основе эмпирических распределений (распределение результатов измерений, полученных при изучении выборки) лежат определенные математические закономерности, которые в генеральной совокупности (при n→∞) характеризуются некоторыми теоретическими закономерностями. На основе теоретических распределений построены статистические критерии, которые используются для проверки некоторых гипотез. Чаще всего в НИР опираются на нормальное распределение или специальные распределения, полученные из нормального, для конкретно поставленной задачи и при ограниченном числе степеней свободы (критерий t, F, χ2, Пуассона).

Для нормального (гауссового) распределения характерно:

в области µ ± ϭ лежит 68,26% (2/3) всех значений всех наблюдений;

внутри пределов µ ± 2ϭ – 95,46% всех значений случайной величины;

интервал µ ± 3ϭ охватывает 99,73% => практически все значения, где

µ - генеральная средняя, которая находится в центре распределения;

ϭ – стандартное отклонение, измеряет вариацию отдельных наблюдений около средней генеральной совокупности.

В практике агрономических исследований можно пользоваться вероятностями 0,95 – 95% и 0,99-99%, которые соответствуют 0,05-5%-ному и 0,01-1%-ному уровням значимости.

Чем стандартное отклонениеϭ больше , => больше варьирует изучаемый материал, и => более пологой становится вариационная кривая, а при малых значениях ϭ она приобретает иглообразную форму.

Рис. 1. Нормальныекривые (1, 2, 3) при разныхзначениях параметра s (Лакин Г.Ф., 1990).

t-распределение Стьюдента.Закон нормального распределения проявляется при n> 20-30. Однако часто экспериментатор проводит ограниченное число измерений, основывает свои выводы на малых выборках. В 1908г. английский химик В.Госсет открыл закон t-распределения для выборочных средних, определяемый по формуле:

х - µ х - µ

t = = ,

S Sx

√ n

где в числителе отклонение выборочной средней от средней генеральной совокупности, а в знаменателе – стандартная ошибка всей генеральной совокупности.

При увеличении n> 30распределение t приближается к нормальному и переходит в него при n→∞.

Распределение t-Стьюдента очень важно в работе с малыми выборками: позволяет определить доверительный интервал, накрывающий среднюю арифметическую всей совокупности µ, и проверить ту или иную гипотезу относительно генеральной совокупности.

F-распределение Фишера. Если у нормально распределенной совокупности взять 2 независимые выборки объемом n1 и n2 и подсчитать дисперсии S12и S22 со степенями свободы ν1 = n1 - 1и ν2 = n2 – 1, то можно определить отношение дисперсий: F = S12/ S22. Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и =>F≥ 1.

В дисперсионном анализе соотношение дисперсии вариантов SV2 / SZ2, является основным критерием, дающим общую оценку достоверности разниц между средними арифметическими или общую оценку достоверности опыта. F = SV2 : SZ2. Вычисленный критерий F05 (фактический) сравнивают с теоретическимFтабл.. ЕслиFфакт. ≥ Fтеор., в опыте доказана достоверность различий между средними арифметическими, т.е. в опыте одна или несколько пар вариантов, между средними х которых есть достоверная разница, а если Fфакт.<Fтеор, то она отсутствует.

Дисперсионный анализ – основной и наиболее распространённый метод математической обработки результатов исследований. Он позволяет оценить методику исследований по величине относительной ошибки (точности) – S %, и достоверность разницы между вариантами.

Если Sx% менее 2%, точность отличная, нарушений методики нет.

Если 2 <Sx% < 4% - хорошая точность;

если 4 <Sx% < 5% - удовлетворительная точность;

если Sx% более 5% - точность опыта низкая.

Если разница между вариантами больше (с плюсом или минусом) НСР – она существенна, меньше НСР – несущественна.

1. Пример статистической обработки урожайных данных исследований методом дисперсионного анализа в однофакторном полевом опыте: ”Влияние боронования на урожай подсолнечника”

Условные (статистические) обозначения:

l– число вариантов в опыте;

n – количество повторений;

Х – поделяночный урожай;

Х– средний урожай по вариантам;

Хp- средний урожай по повторениям;

Х0– средний урожай по опыту;

d – разница между вариантами и контролем;

А – произвольное начало (округленное до целого числа значение 0 );

V – сумма по вариантам;

Р – сумма по повторениям;

VA – cумма отклонений от А по вариантам;

РА – сумма отклонений от А по повторениям;

С – корректирующий фактор;

СУ – общее варьирование (общая дисперсия);

СV - варьирование вариантов (дисперсия вариантов);

СР – варьирование повторений (дисперсия повторений);

СZ – случайное варьирование (остаточная дисперсия);

n - число степеней свободы;

Sx – ошибка опыта;

Sx% - точность опыта (относительная ошибка);

НСР05 – наименьшая существенная разность (для 5%-го уровня

значимости);

å - сигма, знак суммирования;

F05критерий Фишера F;

t05 - критерий Стьюдента t;

Н0 – нулевая гипотеза.

Исходные данные и расчетные показатели оформляются в таблицу.

№ вар. Варианты Х V X d X-A VA (X-A)2 V2A
І ІІ ІІІ IV І ІІ ІІІ IV І ІІ ІІІ IV
              å(X-A)2 åV2A
    P XP             åp2A [å(X-A]2

Порядок проведения расчетов по дисперсионному анализу.

І. Средний урожай по опыту = 0=ΣХ/n∙l = 263,1 / 4.3=21,9 (табл. 5).

ІІ. Произвольное начало = А = 22 (округлённое до целого числа 0).

ІІІ. Общая сумма квадратов отклонений от А = å(Х-А)2 =

=2,25+2,25+0,36+0,01+0,01+1,00+0,16+0,09+0,36+0,64+0,64 = 7,77.

IV. Сумма квадратов отклонений от А по вариантам = VA2 =

=13.64+2.25+1.69 = 17,63.

V. Сумма квадратов отклонений от А по повторениям = РА2 =

=1,44+4,00+1,44+1,21 = 8,09.

VI. Квадрат суммы отклонений от А = [å(X-A)]2 = 0,92 = 0,81.

VII. Корректирующий фактор = С = [å(X-A)]2/l×n = 0,81/12 = 0,07.

VIII. Общая дисперсия = СУ = Σ(Х-А)2-С = 7,77-0,07 = 7,70 =100%.

IX. Дисперсия повторений = СР = ΣР2А/l – C = 8,09 : 3 – 0,07 = 2,63=34%.

Х. Дисперсия вариантов = СV = ΣV2A/n – C = 17,63 : 4 – 0,07 = 4,34=56%.

ХІ. Остаточная дисперсия = СZ = CУ – (СР + СV) = 7,70 – 6,97 = 0,73=10%.

Результаты дисперсионного анализа

Дисперсия Сумма квадратов Число степеней свободы Средний квадрат S2 F05
факт. табл.
Общая – СУ Повторений-СР Вариантов - СV 7,70 2,63 4,34 (ln-1) = 11 (n-1) = 3 (l-1) = 2 - - СV :(L-1)=2,17 18,08 5,14
Остаточная-СZ 0,73 (l-1)(n-1)=6 СZ/(n-1)(L-1)= =0,12 - -

 


 

Таблица 5. Статистическая обработка урожайных данных методом дисперсионного анализа

 

Варианты опыта Х V d X – A VА (X – A)2 VА2
I II III IV I II III IV I II III IV
Без боронования 20,5 20,5 21,4 21,9 84,3 21,1 - -1,5 -1,5 -0,6 -0,1 -3,7 2,25 2,25 0,36 0,01 13,69
Боронование до всходов 22,0 22,1 23,0 22,4 89,5 22,4 +1,3 0,0 +0,1 +1,0 +0,4 +1,5 0,00 0,01 1,00 0,16 2,25
Боронование по всходам 22,3 21,4 22,8 22,8 89,3 22,3 +1,2 +0,3 -0,6 +0,8 +0,8 +1,3 0,09 0,36 0,64 0,64 1,69
Р 64,8 64,0 67,2 67,1 263,1 21,9 РА -1,2 -2,0 +1,2 +1,1 -0,9 1,44 4,00 1,44 1,21 0,81
р 21,6 21,3 22,4 22,4 0 21,9                      

 


Вывод 1-й. Если Fфакт>Fтабл, то нулевая гипотеза отвергается, между

вариантами есть существенные различия, а если Fфакт<Fтабл,

то нулевая гипотеза подтверждается и между вариантами нет

существенных различий. В нашем опыте Fфактзначительно

больше Fтабл, следовательно, нулевая гипотеза отвергается и

между вариантами имеются существенные различия.

Расчеты. S = = = ±0,17 ц/га (ошибка опыта).

S % = S / 0× 100 = 0,17/21,9×100 = 0,8 % (точность опыта).

НСР05 = S × ×t05 = 0,17×1,4×2,45 = 0,6ц/га.

n = (n-1)(l-1) = 3×2 = 6 t05 = 2,45.

Значение критерия Стьюдента (t05)

ν
t05 12,27 4,30 3,18 2,78 2,57 2,45 2,37 2,31 2,26 2,23 2,20 2,18 2,16 2,15


Дата добавления: 2021-01-26; просмотров: 477;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.022 сек.