К вычислению коэффициента корреляции между продолжительностью вегетации и массой 1000 семян ячменя
Вегетационный период, дни, х | |||||||||||
Масса 1000 семян, г у | 57,5-62,4 | 62,5-67,4 | 67,5-72,4 | 72,5-77,4 | 77,5-82,4 | 82,5-87,4 | 87,5-92,5 | ау | fy | ayfy | a2yfy |
75=AX | |||||||||||
55-61 58 | -6 | -6 | +3 | 14 | |||||||
49-54,9 52 | -20 | -16 | +2 | 38 | |||||||
43-48,9 46 | -14 | -10 | +1 | 71 | |||||||
37-42,9 40=Ay | 58 | ||||||||||
31-36,9 34 | -5 | -2 | -1 | 26 | -26 | ||||||
25-30,9 28 | -2 | 6 | -12 | ||||||||
19-24,9 22 | -3 | 1 | -3 | ||||||||
ax | -3 | -2 | -1 | +1 | +2 | +3 | ∑= | ∑=408 |
fx | N= | 214 | |||||||||
axfx | -6 | -58 | -34 | ∑=4 | |||||||
a2xfx | ∑=310 | ||||||||||
fxyaxay | -14 | -27 | ∑= 66 |
Вычисления производим в следующем порядке:
1. Варианты по обоим признакам разбиваются на классы и производится разноска вариант совместно обоих рядов по клеткам корреляционной решетки. Аргумент (х) располагается в горизонтальном ряду таблицы слева направо. Значения функции (у) возрастают снизу вверх.
2. Вычисляется эмпирическая линия регрессии для выяснения степени криволинейности данной связи. Если эмпирическая линия регрессии близка к прямой линии и не является двускатной, можно вычислять коэффициент корреляции, в противном случае вычисляется показатель корреляции для криволинейных связей.
3. В корреляционной таблице произвольно выбирается условный центр. Обычно это близкая к центру клетка, содержащая наибольшую частоту (в нашем примере- клетка с частотой 20 вариант). В ряду х против нее находится условная средняя Ах =75, а в ряду у –Ау =40.
4. Вычисляем условные отклонения ах: (60-75)/5 = -3; (65-75)/5= - 2; (70-75)/5 = - 1; (75-75) /5 = 0; (80-75)/5 =+1 и т.д.
Условные отклонения (ах) записываем в горизонтальной строке.
5. Также вычисляем и условные отклонения ау от условной средней Ау= 40. Условные отклонения записываем в вертикальной графе табл. 14.
6. Условные отклонения умножаем на соответствующие им частоты: ахfx = -3 x 2 = -6; -2 х 29 = - 58; -1 х 34 = -34 и т.д.; ауfу = +3 х 14 = 42; +2 х 38 = 76 и т.д.
7. Квадраты условных отклонений умножаем на их частоты: а2хfx = (-3)2 х 2 = 18; (-2)2 х 29 = 116; (-1)2 х 34 =34 и т.д.
Аналогично проводим вычисления и для вариационного ряда у: a2yfy=32 x 14= 126; 22 x 38 =152 и т.д.
8. Находим произведения условных отклонений между собой и на имеющуюся совместную для них частоту. Вычисления начинаем по столбцам слева направо;
первый столбец: axayfxy = (-3) x 0 x 1 =0; (-3) x 1 x (-1) =3;
второй столбец: (-2) х 3 х 1 = -6; (-2) х 2 х 5 = -20; (-2) х 1 х 7 = -14. Записываем результаты в правом верхнем углу соответствующих клеток табл. 14.
9. Суммируем совместные частоты по столбцам и записываем в горизонтальной строке снизу таблицы: 3; -14; -27; 0; 71; 18; 15.
10. Получаем суммы по строкам (ряд х) и по столбцам (ряд у):
∑fx=N=214; ∑axfx=4; ∑fy=N=214; ∑a2xfx=310; ∑fxyaxay= 66; ∑ayfy = 148; ∑a2yfy= 408.
11. Для проверки наших вычислений находим сигму ряда х и сигму ряда у по формулам:
,
12. Подставляя вычисленные значения в формулу коэффициента корреляции, получаем:
Для небольших групп вариационного ряда N < 100 ошибку коэффициента корреляции вычисляем по формуле mz = , а для больших групп N > 100 - по формуле , где mr- ошибка коэффициента корреляции; r – коэффициент корреляции; N- объем выборки (N > 100).
Для рассматриваемого примера mr = (1- 0,20552) / критерий достоверности Стьюдента: Число степеней свободы при определении значимости коэффициента корреляции равно: . По таблице на доверительном уровне 95% он составляет 2,0.
Ввиду того, что вычисленное значение выше табличного, можно сделать заключение о имеющейся положительной небольшой, но достоверной зависимости между массой зерен ячменя и продолжительностью вегетации.
При расчете коэффициента корреляции на ЭВМ как для малых, так и для больших выборок Г.Н.Зайцев рекомендует формулу:
где r – коэффициент корреляции; x – M x – отклонения значений ряда аргумента от его средней; у - М у - отклонения значений ряда функции от ее средней величины.
Дата добавления: 2020-10-25; просмотров: 414;