Измерение тесноты связи
Чтобы измерить тесноту прямолинейной связи между двумя признаками, пользуются парным коэффициентом корреляции, который обозначается r
Так как при корреляционной связи имеют дело не с приращением функции в связи с изменением аргумента, а с сопряженной вариацией результативных и факторных признаков, то определение тесноты связи, по существу, сводится к изучению этой сопряженности, т.е. того, в какой мере отклонение от среднего уровня одного признака сопряжено с отклонением другого. Это значит, что при наличии полной прямой связи все значения (х —X) и (у — Y) должны иметь одинаковые знаки, при полной обратной — разные, при частичной связи знаки в преобладающем числе случаев будут совпадать, а при отсутствии связи — совпадать примерно в равном числе случаев.
Для оценки существенности коэффициента корреляции пользуются специально разработанной таблицей критических значений г.
Коэффициент корреляции rxy. применяется только в тех случаях, когда между явлениями существует прямолинейная связь.
(8.16.)
Если же связь криволинейная, то пользуются индексом корреляции, который рассчитывается по формуле:
(8.17)
где у — первоначальные значения; — среднее значение; Y— теоретические (выравненные) значения переменной величины.
Показатель остаточной, случайной дисперсии определяется по формуле:
(8.18)
Она характеризует размер отклонений эмпирических значений результативного признака y от теоретических Y, т.е. случайную вариацию.
Общая дисперсия
(8.19)
характеризует размер отклонений эмпирических значений результативного признака у от , т.е. общую вариацию. Отношение случайной дисперсии к общей характеризует долю случайной вариации в общей вариации, а
(8.20.)
есть не что иное, как доля факторной вариации
(8.21)
в общей, потому что по правилу сложения дисперсий общая дисперсия равна сумме факторной и случайной дисперсий:
s=sY2+s02 (8.22)
Подставим в формулу индекса корреляции соответствующие обозначения случайной, общей и факторной дисперсий и получим:
(8.23)
Таким образом, индекс корреляции характеризует долю факторной вариации в общей:
(8.24)
однако с той лишь разницей, что вместо групповых средних берутся теоретические значения Y.
Индекс корреляции по своему абсолютному значению колеблется в пределах от 0 до 1. При функциональной зависимости случайная вариация å(y-Y)2=0, индекс корреляции равен 1. При отсутствии связи R = 0, потому что Y = у.
Коэффициент корреляции является мерой тесноты связи только для линейной формы связи, а индекс корреляции — и для линейной, и для криволинейной. При прямолинейной связи коэффициент корреляции по своей абсолютной величине равен индексу корреляции:
(8.25)
Если индекс корреляции возвести в квадрат, то получим коэффициент детерминации
(8.26)
Он характеризует роль факторной вариации в общей вариации и по построению аналогичен корреляционному отношению з2. Как и корреляционное отношение, коэффициент детерминации R2 может быть исчислен при помощи дисперсионного анализа, так как дисперсионный анализ позволяет расчленить общую дисперсию на факторную и случайную. Однако при дисперсионном анализе для разложения дисперсии пользуются методом группировок, а при корреляционном анализе — корреляционными уравнениями.
Коэффициент детерминации является наиболее конкретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного в основание группировки.
При прямолинейной парной связи факторную дисперсию можно определить без вычисления теоретических значений Y по следующей формуле:
(8.27)
Дата добавления: 2016-07-22; просмотров: 2763;