Коэффициент корреляции Пирсона


Еще один часто используемый коэффициент корреляции, называемый коэффициентом корреляции Пирсона (r), используется для измерения связи между двумя переменными на интервальных шкалах. Используется только в случае линейной зависимости. Формула для приблизительного вычисления r.

.

´Задача 2.28.Какова корреляция между количеством отработанных часов (X7) и СБ осенним (X5) испытуемого? Начните анализ с построения столбцов для номера, СБ (Xi) и отработанных часов (Yi). Далее найдите отклонения DX и DY , затем квадраты отклонений DX2 и DY2. Затем вычислите суммы квадратов отклонений ΣDX2 и ΣDY2, а также сумму произведений отклонений ΣDXDY.

X1 X5 X7          
СБ Отработанные часы          
Xi Yi DX DY DX2 DY2 DXDY
3,9 38,0 0,5 14,5 0,3 209,4 7,5
4,6 15,0 0,2 8,5 0,0 72,8 1,6
4,7 10,0 0,3 13,5 0,1 183,0 3,8
4,2 30,0 0,2 6,5 0,0 41,9 1,4
5,0 12,0 0,6 11,5 0,3 132,9 6,7
3,7 35,0 0,7 11,5 0,5 131,6 8,2
3,7 30,0 0,7 6,5 0,5 41,9 4,6
4,4 30,0 0,0 6,5 0,0 41,9 0,1
4,6 20,0 0,2 3,5 0,0 12,5 0,6
4,9 10,0 0,5 13,5 0,2 183,0 6,5
5,0 20,0 0,6 3,5 0,3 12,5 2,1
4,0 35,0 0,4 11,5 0,2 131,6 4,8
4,6 30,0 0,2 6,5 0,0 41,9 1,2
4,2 30,0 0,2 6,5 0,0 41,9 1,4
4,0 35,0 0,4 11,5 0,2 131,6 4,8
4,9 10,0 0,5 13,5 0,2 183,0 6,5
4,7 10,0 0,3 13,5 0,1 183,0 3,8
n = 17 4,4 23,5 0,0 0,0 3,3 1776,2 63,4

Полученные значения подставьте в формулу

.

Примечание. Знак «минус» перед коэффициентом корреляции отражает направление связи, а не значение. В данном случае зависимость обратная – чем больше человек занимается, тем ниже его СБ осенний (естественно, это шуточный пример). Чтобы найти уровень значимости для r, нам необходимо подсчитать степени свободы, или df = (n – 2), а затем обратиться к табл. П 3.2. Имея df = 15 и используя уровень значимости 0,05, мы можем определить, превышает ли полученная нами величина r = 0,846 критическое значение, приведенное в таблице. Критическое значение равно 0,456 и меньше полученной нами величины 0,846; таким образом, между количеством отработанных часов и СБ осенним имеет место статистически значимая отрицательная корреляция.

Регрессионно-корреляционный анализ

 

Графическое решение задачи выявляет регрессию (форму зависимости) и уравнение связи.Линейная зависимость описывается уравнением

y = a + bx,

где: а и b – коэффициенты, определяемые по формулам:

a = y – bx,

.

 

´Задача 2.2.18. Для задачи 2.1.4построить график и определить уравнение регрессии.

r2 = 0,719 как на графике.

, a = 23,5 – 4,4(–20,15) = 112,54.

Итак, уравнение регрессии

y = 112,54 – 20,15x.


Но так ли это на самом деле? Оказывается, в данном примере была (умышленно) допущена неточность. Все уравнения, по которым проводились расчеты, применяются только в случае линейной зависимости. На графике же точки расположены явно не на одной линии, и мы можем предположить, что регрессия может быть иной, нелинейной. Если зависимость y от x нелинейная, то иногда эту зависимость можно линеаризовать с помощью преобразования переменных x и y. Линеаризацию можно провести с помощью формул табл. П 3.8. Но для данного случая остановимся на полигональной зависимости

y = b0 x0 + b1 x1 + b2 x2 + b3 x3 + … + bn xn

где n – степень функции. Используя электронную таблицу MS Excel, строим полигональную линию тренда (n = 3) и получаем r =– 0,906 (r2 = 0,820). Это выше, чем при расчетах линейной зависимости. Если вы не можете принять решение, какую формулу подобрать для конкретной регрессии, то выберете ту, при которой получается максимальный коэффициент корреляции.


Контрольные вопросы

1. Опишите схему классического экспериментального плана с большими объемами выборок n.

2. Перечислите и охарактеризуйте шкалы представления данных.

3. Что такое совокупность исходных данных «объекты-признаки»?

4. Как пользоваться таблицей случайных чисел?

5. Как строится полигон распределения частот?

6. Как строится гистограмма распределения частот?

7. Как строится кумулята распределения частот?

8. Как выявляется аномальность числа в выборке?

9. Как группируются данные в вариационный ряд?

10. Перечислите меры центральной тенденции.

11. Вычисление средней арифметической (простой и взвешенной).

12. Вычисление средней гармонической (простой и взвешенной).

13. Вычисление средней квадратической (простой и взвешенной).

14. Вычисление средней кубической (простой и взвешенной).

15. Вычисление средней геометрической (простой и взвешенной).

16. Вычисление коэффициента вариации.

17. Определение медианы.

18. Определение моды.

19. Как оценивается изменчивость параметра?

20. Какой критерий используется для определения того, отличается ли наблюдаемая частота результатов от ожидаемой частоты?

21. Нормальное распределение и его определение по эксцессу и асимметрии.

22. Нормальное распределение и его определение по z-критерию Колмогорова-Смирнова.

23. Параметрические критерии, условия их применения.

24. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для одной выборки)?

25. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для независимых выборок)?

26. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для зависимых выборок)?

27. Какой вид анализа используется в экспериментах с межгрупповыми и внутригрупповыми планами?

28. Какой вид анализа используется в экспериментах, которые имеют несколько уровней категориальной независимой переменной, но только одну количественную зависимую переменную?

29. Непараметрические критерии, условия их применения.

30. Сравнение двух независимых выборок (критерий U-Манна-Уитни).

31. Сравнение двух связанных выборок (критерий W-Вилкоксона).

32. Как оценивается связь между двумя переменными (в ранговых шкалах)?

33. Как оценивается связь между двумя переменными (в интервальных шкалах)?

34. Регрессионный анализ.

35. Корреляционный анализ.

36. Линеаризация функций.




Дата добавления: 2020-10-25; просмотров: 391;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.017 сек.