Линейная парная корреляция. Коэффициент корреляции


Если обе линии регрессии =f(x) и = j(у) являются прямыми линиями, то корреляция называется линейной.

Эмпирическое (выборочное) уравнение прямой линии регрессии У на X имеет вид:

(11)

где выборочные средние признаков Х и У, - условная средняя (среднее арифметическое наблюдавшихся значений У, соответствующих конкретному значению X=х; sх и sу - выборочные средние квадратические отклонения; rв =rху - выборочный коэффициент корреляции, служащий для оценки степени линейной корреляционной связи:
(-1 £ rв £ 1). Чем ближе |rв| к единице, тем это связь сильнее, и наоборот, чем ближе |rв| к нулю, тем связь слабее. Равенство коэффициента корреляции нулю означает отсутствие линейной корреляционной зависимости между СВ Хм У, но не отсутствие корреляции вообще, которая может оказаться нелинейной. Если |rв|, =1 , то между X и У имеется линейная функциональная зависимость - каждому значению х соответствует только одно значение у.

Для нахождения , sх, sу и rв используются формулы:

(12)

(13)

- выборочный коэффициент корреляции, где - корреляционный момент.

Эмпирическое уравнение прямой линии регрессии X на У соответственно записывается в виде

. (14)

Обе прямые эмпирической регрессии пересекаются и проходят через точку
M( ), являющуюся центром распределения. Это две разные прямые. Эмпирические прямые регрессии и совпадают только в случае линейной функциональной зависимости между СВ Х и У, т. е. |r| =1.

При проведении соответствующего расчета сначала определяется величина коэффициента корреляции rв (-1 < rв < 1). Пусть rв ¹ 0. Коэффициент rв вычисляется по данным выборки и, в отличии от коэффициента корреляции генеральной совокупности r, является случайной величиной. Для выяснения значимости rв проверяется гипотеза Н0 об отсутствии линейной корреляционной связи между СВ X и У, т.е. Н0: r = 0.

При справедливости этой гипотезы статистика

(15)

имеет распределение Стьюдента с k = n- 2 степенями свободы. Гипотеза Н0 отвергается, если |t| > t1-a; k, где t1-a; k - табличное значение распределения Стьюдента, определенное на уровне значимости a (1 - а = g, где g - доверительная вероятность) при числе степени свободы k= n- 2.

Таким образом, основной задачей корреляционного анализа является выявление связи между случайными величинами и оценка ее тесноты с помощью коэффициентов корреляции.

Установление формы зависимости и изучение зависимости между переменными является основной задачей регрессионного анализа.

Корреляционный анализ и регрессионный анализ является смежными, взаимосвязанными разделами математической статистики и предназначены для изучения по данным выборки статистической зависимости ряда величин.

Решение типового варианта инлдивидуального расчетного задания

Пример 1.

 

Дана выборка:

Для заданной выборки из генеральной совокупности СВ Х (n=100) необходимо:



Дата добавления: 2021-11-16; просмотров: 315;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.008 сек.