H-критерий Крускала-Уоллиса


 

Критерий предназначен для оценки различия одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.

Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978). Иногда его называют критерием «суммы рангов» (Носенко И. А., 1981).

Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой – высокие, а в третьей – средние, то критерий Н позволит установить эти различия.

Гипотезы

H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.

H1: Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.


Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них n = 3, а двух других n = 2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р < 0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровне значимости (р < 0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других – по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

2. Критические значения критерия Н и соответствующие им уровни значимости приведены в таблице 4 приложения 1. Таблица предусмотрена только для трех выборок и {n1, n2, n3} ≤ 5. При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ2, поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению χ2. Количество степеней свободы при этом определяется по формуле:

ν = c – l,

где с – количество сопоставляемых выборок.

3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться 1/2∙[c∙(c – 1)] (с – количество выборок). Для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ*.

Пример.В эксперименте по исследованию интеллектуальной настойчивости (Е. В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в таблице 11.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.

Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?

 

Таблица 11.5

 

Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N = 22)

№ п/п Группа 1: анаграмма ФОЛИТОН (n1 = 4) Группа 2: анаграмма КАМУСТО (n2 = 8) Группа 3: анаграмма СНЕРАКО (n3 = 6) Группа 4: анаграмма ГРУТОСИЛ (n4 = 4)
   
   
     
     
Суммы
Средние

Сформулируем гипотезы.

Н0: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.

Н1: 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток их решения.

Теперь познакомимся с алгоритмом расчетов.

 

АЛГОРИТМ

подсчета критерия Н. Крускала-Уоллиса

 

1. Перенести все показатели испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых группы 1 определенным цветом, например, красным, карточки испытуемых группы 2 – синим, карточки испытуемых групп 3 и 4 – соответственно, зеленым и желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5. Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

6. Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.

7. Подсчитать значение критерия Н по формуле:

,

где N – общее количество испытуемых в объединенной выборке; n – количество испытуемых в каждой группе;

Tj – суммы рангов по каждой группе.

8а. При количестве групп с = 3, n1, n2, n3 ≤ 5, определить критические значения и соответствующий им уровень значимости по таблице 10 приложения 1. Если Нэмп равен или превышает критическое значение H0,05, H0 отвергается.

8б. При количестве групп с > 3 или количестве испытуемых n1, n2, n3 > 5, определить критические значения χ2 по таблице 16 приложения 1. Если Нэмп равен или превышает критическое значение χ2, H0 отвергается.

Воспользуемся этим алгоритмом при решении задачи о неразрешимых анаграммах. Результаты работы по 1-6 шагам алгоритма представлены в таблице 11.6.

Общая сумма рангов = 38,5 + 82,5 + 68 + 64 = 253. Расчетная сумма рангов:

.

Равенство реальной и расчетной сумм соблюдено.

 


Таблица 11.6

 



Дата добавления: 2021-11-16; просмотров: 342;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.01 сек.