Парный корреляционный анализ. Построение модели линейной регрессии лингвистической информации

Цель: Овладеть умением оценивать величину корреляционной зависимости лингвистических величин, практического построения простой линейной регрессии по экспериментальным данным и проверки её адекватности в пакете анализа данных SPSS.

Задание:На основе полученных статистических данных о числе существительных и местоимений в выбранных фрагментах проверить гипотезу о статистической зависимости частот появления в русских литературных текстах имён существительных и местоимений.

План выполнения работы :

1) Сформировать нулевую Н₀ и альтернативную Н₁ гипотезы.

2) Найти выборочный коэффициент корреляции по формуле

Сделать вывод о величине и знаке корреляционной зависимости.

3) Проверить значимость связи: если , то выборочный коэффициент корреляции значимо отличается от нуля, те связь значима с уровнем значимости α

( ‑ критическое значение распределения Стьюдента с n-2 степенями свободы, соответствующее уровню значимости α).

Сделать вывод о значимости корреляционной зависимости.

4) Построить корреляционное поле, т.е. изобразить в координатной плоскости все выборочные точки (получим общую картину взаимной изменчивости случайных величин).

5) Найти и построить уравнения выборочных линий регрессии (уравнения прямых, с помощью которых приближённо можно описать зависимость Y(x) и X(y)) .Уравнения линий регрессий:

(у по х) ;

(х по у)

Сделать вывод о принятии или опровержении гипотезы Н₀.

Для решения задачи в программе SPSS выполнить следующее.

1. Построить корреляционную матрицу для переменных Х (частсущ) и Y (частмест), предназначенную для оценки степени их зависимости. Войти в меню Анализ – корреляции – парные. В открывшемся окне "Парные корреляции" перенести с помощью стрелки переменные Х (частсущ) и Y(частмест) в окно "переменные". По умолчанию в окне "коэффициенты корреляции» отмечен коэффициент Пирсона - нажать ОК. В открывшемся окне вывода получаем квадратную корреляционную матрицу, в верхней строчке которой выведены коэффициенты корреляции, далее – уровень значимости и N – число наблюдений.

2. Для того чтобы наглядно увидеть существующую зависимость переменных, построим график двумерного рассеивания. Откроем меню Графика – устаревшие диалоговые окна – рассеяния/точки – простая диаграмма рассеяния – задать. В окне Диаграммы рассеяния переместить переменную Y(частмест) в окно Ось Y, а переменную Х(частсущ) - в окно Ось Х. Нажать ОК.

3. Построим линии регрессии. Откроем меню Анализ >Регрессия> Подгонка кривых.

В открывшемся диалоговом окне переместим в окно "Зависимые" переменную "Частмест", а в окно "Независимые" переменные переменную "Частсущ".В окне"Модели"поставим флажок в квадратике"Линейная" Нажать ОК.

В окне вывода получим точки двумерного рассеяния и линию регрессии Z(Y)

«Одной из закономерностей работы языкового механизма современного русского языка является отрицательное коррелирование имён существительных и местоимений, т. е. увеличение активности одной из этих частей речи за счёт другой».