Тема 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

<9 10 11 12 13 1415>

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположений (гипотез) относительно природы и величины неизвестных параметров анализируемой генеральной совокупности (совокупностей). Например, исследователь высказывает предположение: "выборка извлечена из нормальной генеральной совокупности" или "генеральная средняя анализируемой совокупности равна пяти". Такие предположения называются статистическими гипотезами.

Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется проверкой статистических гипотез.

Выдвинутая гипотеза называется нулевой (основной). Ее принято обозначать Н₀.

По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую), противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н₁.

Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н₀.

Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой, например: "среднедушевой совокупный доход населения России составляет 650 рублей в месяц"; "уровень безработицы (доля безработных в численности экономически активного населения) в России равна 9%" . В других случаях гипотеза называется сложной.

В качестве нулевой гипотезы Н₀ принято выдвигать простую гипотезу, т.к. обычно бывает удобнее проверять более строгое утверждение.

По своему содержанию статистические гипотезы можно подразделить на несколько основных типов[6]:

- гипотезы о виде закона распределения исследуемой случайной величины;

- гипотезы о числовых значениях параметров исследуемой генеральной совокупности[7];

- гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;

- гипотезы об общем виде модели, описывающей статистическую зависимость между признаками и др.

Так как проверка статистических гипотез осуществляется на основании выборочных данных, т.е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н₀ имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.

Так, в какой-то небольшой доле случаев α нулевая гипотеза Н₀ может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой первого рода. А ее вероятность принято называтьуровнем значимости и обозначать α.

Наоборот, в какой-то небольшой доле случаев β нулевая гипотеза Н₀ принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н₁. Такую ошибку называют ошибкой второго рода. Вероятность ошибки второго рода принято обозначать β. Вероятность 1 - β называют мощностью критерия.

При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок α или β. Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки первого рода α - уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости α: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью α отклонить правильную в действительности гипотезу Н₀, следует принять тот, который сопровождается меньшей ошибкой второго рода β, т.е. большей мощностью. Снижения вероятностей обеих ошибок α и β можно добиться путем увеличения объема выборки.

Правильное решение относительно нулевой гипотезы Н₀ также может быть двух видов:

- будет принята нулевая гипотеза Н₀, тогда как и на самом деле в генеральной совокупности верна нулевая гипотеза Н₀; вероятность такого решения 1 - α;

- нулевая гипотеза Н₀будет отклонена в пользу альтернативной Н_1, тогда как и на самом деле в генеральной совокупности нулевая гипотеза Н₀отклоняется в пользу альтернативной Н₁; вероятность такого решения 1 - β - мощность критерия.

Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью таблицы 8.1.

Таблица 8.1

Нулевая гипотеза Н₀ Результаты решения относительно нулевой гипотезы Н₀

отклонена принята

верна ошибка первого рода, ее вероятность Р(Н₁/Н₀) = α правильное решение, его вероятность Р(Н₀/Н₀) = 1 - α

не верна правильное решение, его вероятность Р(Н₁/Н₁) = 1 - β ошибка второго рода, ее вероятность Р(Н₀/Н₁) = β

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющего функцией от результатов наблюдения.

Статистический критерий - это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н₀.

Статистический критерий, как и всякая функция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н₀подчинена некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения f(k).

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н₀, чтобы при заданном уровнем значимости α можно было бы найти критическую точку К_кр.распределения f(k), которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н₀.

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выборочным данным наблюдаемое значение критерия К_набл.и определить является ли оно наиболее или менее правдоподобным в отношении нулевой гипотезы Н₀.

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона χ²; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей - с помощью критерия F - Фишера; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z - нормальной распределенной случайной величины и критерия T- Стьюдента и т.д.

Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия (К_набл.).

Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н₀) и критическую область (область значений, менее правдоподобных в отношении таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками(К_кр.).

Областью допустимых значений (областью принятия нулевой гипотезы Н₀) называют совокупность значений критерия К, при которых нулевая гипотеза Н₀не отклоняется.

Критической областью называют совокупность значений критерия К, при которых нулевая гипотеза Н₀отклоняется в пользу конкурирующей Н₁.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Если конкурирующая гипотеза - правосторонняя, например, Н₁: а > а₀, то и критическая область - правосторонняя (рис 1). При правосторонней конкурирующей гипотезе критическая точка (К_{кр. правосторонняя})принимает положительные значения.

Если конкурирующая гипотеза - левосторонняя, например, Н₁: а < а₀, то и критическая область - левосторонняя (рис 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (К_{кр. левосторонняя}).

Если конкурирующая гипотеза - двусторонняя, например, Н₁: а ¹ а₀, то и критическая область - двусторонняя (рис 3). При двусторонней конкурирующей гипотезе определяются две критические точки (К_{кр. левосторонняя}и К_{кр. правосторонняя}).

Область допустимых Критическая

значений область

0 К_кр.

Рис 8.1. Правосторонняя критическая область.

Критическая Область допустимых

область значений

К

-К_кр.0 К_кр.

Рис 8.2. Левосторонняя критическая область.

Критическая Область допустимых Критическая

область значений область

К

-К_кр.0 К_кр.

Рис 8.3. Двусторонняя критическая область.

Основной принцип проверки статистических гипотез состоит в следующем:

- если наблюдаемое значение критерия (К_набл.) принадлежит критической области, то нулевая гипотеза Н₀ отклоняется в пользу конкурирующей Н₁;

- если наблюдаемое значение критерия (К_набл.) принадлежит области допустимых значений, то нулевую гипотезу Н₀ нельзя отклонить.

Можно принять решение относительно нулевой гипотезы Н₀путем сравнения наблюдаемого (К_набл.) и критического значений критерия (К_кр.).

При правосторонней конкурирующей гипотезе:

Если К_набл.£ К_кр., то нулевую гипотезу Н₀ нельзя отклонить;

если К_набл.> К_кр., то нулевая гипотеза Н₀ отклоняется в пользу конкурирующей Н₁.

При левосторонней конкурирующей гипотезе:

Если К_набл.³ - К_кр., то нулевую гипотезу Н₀ нельзя отклонить;

если К_набл.< - К_кр., то нулевая гипотеза Н₀ отклоняется в пользу конкурирующей Н₁.

При двусторонней конкурирующей гипотезе:

Если - К_кр. £ К_набл.£ К_кр., то нулевую гипотезу Н₀ нельзя отклонить;

если К_набл.> К_кр. или К_набл.< - К_кр., то нулевая гипотеза Н₀ отклоняется в пользу конкурирующей Н₁.

Алгоритм проверки статистических гипотез сводится к следующему:

1. Сформулировать нулевую Н₀ и альтернативную Н₁ гипотезы;

2. Выбрать уровень значимости a;

3. В соответствии с видом выдвигаемой нулевой гипотезы Н₀ выбрать статистический критерий для ее проверки, т.е. - специально подобранную случайную величину К, точное или приближенное распределение которой заранее известно;

4. По таблицам распределения случайной величины К, выбранной в качестве статистического критерия, найти его критическое значение К_кр. (критическую точку или точки);

5. На основании выборочных данных по специальному алгоритму вычислитьнаблюдаемое значение критерия К_набл.;

6. По виду конкурирующей гипотезы Н₁ определить тип критической области;

7. Определить, в какую область (допустимых значений или критическую) попадает наблюдаемое значение критерия К_набл., и в зависимости от этого - принять решение относительно нулевой гипотезы Н₀.

Следует заметить, что даже в том случае, если нулевую гипотезу Н₀ нельзя отклонить, это не означает, что высказанное предположение о генеральной совокупности является единственно подходящим: просто ему не противоречат имеющиеся выборочные данные, однако таким же свойством наряду с высказанной могут обладать и другие гипотезы.

Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:

- если в результате проверки нулевую гипотезу Н₀ нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью отклонить нулевую гипотезу Н₀, вероятность нулевой гипотезы Н₀ больше α, а конкурирующей Н₁ - меньше 1 - α;

- если в результате проверки нулевая гипотеза Н₀ отклоняется в пользу конкурирующей Н₁, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью принять нулевую гипотезу Н₀, вероятность нулевой гипотезы Н₀ меньше α, а конкурирующей Н₁ - больше 1 - α.

В справочной таблице приведены критерии проверки гипотез.

[1] Выводы формул для числа размещений, а в последующем изложении - для числа сочетаний, - опускаются. Их можно найти в курсе элементарной алгебры.

[2] В учебниках по математической статистике вместо термина “статистическая совокупность” используется термин “набор данных”, а вместо термина “единица совокупности” используется термин “элемент выборки”.

[3] Для того, чтобы любые статистики служили хорошими оценками параметров генеральной совокупности, они должны обладать рядом свойств: несмещённости, эффективности, состоятельности, достаточности. Всем указанным свойствам отвечает выборочная средняя. s²_выб. -смещённая оценка. Для устранения смещения при малых выборках вводится поправка n¤ n-1 (cм. 7.1.).

[4] В литературе ( 1 - n /N ) иногда называется "поправкой на бесповторность отбора".

[5] Для нормально распределенной случайной величины а . Поэтому справедливо: .

[6] В этой работе рассматриваются первые два типа гипотез.

[7] Эти гипотезы часто называют параметрическими, тогда как все остальные - непараметрическими.

<9 10 11 12 13 1415>

Дата добавления: 2016-10-26; просмотров: 3111;

Тема 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по истории

Публикации по медицине

Нулевая гипотеза Н₀	Результаты решения относительно нулевой гипотезы Н₀
отклонена	принята
верна	ошибка первого рода, ее вероятность Р(Н₁/Н₀) = α	правильное решение, его вероятность Р(Н₀/Н₀) = 1 - α
не верна	правильное решение, его вероятность Р(Н₁/Н₁) = 1 - β	ошибка второго рода, ее вероятность Р(Н₀/Н₁) = β