Раздел 2. Оценивание свойств изделий по результатам испытаний


Лекция 3. Виды оценок. Методы получения точечных и интервальных оценок.Доверительный интервал и доверительная вероятность.

Статические гипотезы.

1). Основные определения и понятия.

2). Основные статистики.

3). Понятия о критической области.

4). Общая схема проверки статических гипотез.

 

Основные определения и понятия

В практике испытаний весьма распространенной является теория статических гипотез. Как и рассмотренные ранее принципы принятия статистических решений, эта теория призвана обеспечить анализ и оценку результатов испытаний с последующей формулировкой определенных выводов и решений.

Статической гипотезой называется любое предположительное суждение о вероятностных характеристиках одной или нескольких случайных величин.

Различают два вида статистических гипотез: о законах определения и о числовых характеристиках случайных величин (моментах, характеристиках положения).

Примеры статистических гипотез:

-случайная величина Х подчиняется нормальному закону распределения;

-математическое ожидание случайной величины Х равна а.

Гипотезы подлежат проверкt на основе результатов испытаний. Сущность проверки заключается в том, чтобы установить, согласуются ли опытные данные с выдвинутой гипотезой.

Дело в том, что на практике всегда будет иметь место расхождение между гипотезой и результатом выборочных наблюдений (число опытов всегда ограничено). Причинами такого расхождения могут быть либо случайные погрешности, обусловленные механизмом случайного отбора, либо систематически действующий фактор или факторы. Ответ на вопрос, какая из этих двух причин проявилась в ходе испытаний объекта, как раз и призвана дать теория проверки статистических гипотез. В зависимости от того, какой ответ будет получен, применяется то или иное статистическое решение, которое решающим образом предопределяет последующие за этим инженерные решения (например, доработать объект).

Гипотезы проверяются по определенным правилам. Эти правила называются статистическими критериями.

Критерии формируются на основе так называемых статистик.

Статистикой называется функция, зависящая от результатов выборочных наблюдений и служащая мерой расхождения между опытными и гипотетическими значениями вероятностных характеристик случайной величины.

Подлежащая проверке гипотеза называется основной. Как правило, она предполагает отсутствие систематического расхождения между опытными и гипотетическими данными. Поэтому ее также называют нулевой гипотезой и обозначают через Hₒ. Содержание гипотезы записываются после двоеточия. Например, запись Hₒ: mₓ= а означает, что выдвинута основная гипотеза, заключающаяся в предположении: математическое ожидание случайной величины Хравно а. Каждой основной гипотезе противопоставляется альтернативная гипотеза H1.

Различают простые и сложные гипотезы. Простая гипотеза, относящаяся к одной из числовых характеристик случайной величины, оценивает эту характеристику однозначно, как это имеет место в вышеприведенном примере. В сложных гипотезах указывается некоторая область возможных значений характеристики, например:

Hₒ: mₓ>a ; или Hₒ: mₓ≠a.

Основная и альтернативная гипотезы образуют систему рабочих гипотез. Обычно при формировании системы гипотез придерживаются правила: основная гипотеза является простой, а конкурирующая (альтернативная) может быть как простой, так и сложной. При этом очевидно, что любая сложная гипотеза является множеством (набором) простых. Так сложная гипотеза вида H1: mₓ> a может быть заменена множеством простых: H1': mx = a' >a, H1": mx= a" > a' и т.д.

Каждой основной гипотезе может быть противопоставлено несколько альтернативных. В результате проверки может оказаться, что выборочные данные (результаты испытаний, наблюдений, измерений) не согласуются с гипотезой Hₒ, противоречат ей. Тогда основная гипотеза отклоняется и принимается альтернативная. Решение об отклонении (или принятии) основной гипотезы всегда связано с риском, т.к. всегда существует вероятность того, что расхождение между гипотетическими и опытными данными не являются случайной погрешностью, а обусловлено воздействием кого-то систематического фактора.

Если гипотеза Hₒ отклоняется, когда она верна, то совершается ошибка первого рода. Вероятность этого события равна α. Ошибка второго рода будет иметь место в тех случаях, когда принимается альтернативная гипотеза H1, хотя в действительности она неверна. Вероятность такого события равна β.

Разность (1-β) представляет собою вероятность обусловленного отклонения основной гипотезы и называется мощностью критерия.

Чем больше мощность критерия, тем меньше вероятность совершить ошибку второго рода (принять "ложь" за "истину").

Увеличению мощности критерия способствует правильная формулировка системы рабочих гипотез и правильный выбор критерия. Если эти условия соблюдают, то для увеличения мощности критерия есть только один путь - увеличение числа испытаний.

Существенным является понятие кривых эффективности критерия.

Такие кривые представлены на рисунке ниже. Как видно, они представляют собой зависимость вероятности β от |∆| при фиксированном объеме выборки n. Здесь |∆|= |a-a'|, где а соответствует основной гипотезе и а' - альтернативной. Для одних и тех же значений |∆| вероятность β тем меньше, чем больше объем выборки.

 

Основные статистики

 

В общем случае любая статистика Ѳ есть непрерывная случайная величина с известным законом распределения, функционально связанная с результатами испытаний. Отличительной особенностью статистик является то, что их значения могут быть представлены с гораздо большей точностью, нежели отдельные выборочные значения исследуемой случайной величины. Типичным примером статистики является выборочное среднее - оценка математического ожидания.

Особую роль среди статистик играют те, которые используются в случаях, когда исследуемая случайная величина Х подчинена нормальному распределению. Основные из них имеют свои собственные обозначения и наименования. Таковыми являются:

Z -статистика (условно - статистика Гаусса),

T -статистика (статистика Стьюдента),

V -статистика (статистика Пирсона)

F -статистика (статистика Фишера)

 

Расчетные формулы для этих статистик имеют вид:

где mx и sx2 - математическое ожидание и дисперсия величины Х,

и Sx2 - оценки математического ожидания и дисперсии,

n - число опытов (объем выборки),

S12 и S22 - оценки дисперсий случайных величин X1 и X2.

Каждая из этих статистик имеет связь с опытными данными, в чем нетрудно убедиться на примере Z - статистики:

где xi - опытные реализации случайной величины X.

Точно также каждая из них имеет известный закон распределения:

Сопоставим этот закон с законом распределения исследуемой случайной величины X:

Нетрудно видеть, что не содержит параметров . Это общий признак основных статистик: их законы распределения не содержат параметров закона распределения исходной случайной величины.

Каждая из основных статистик имеют свою область применения, т.е. свой круг задач: статистики Z, T и F используются при проверке гипотез о числовых характеристиках случайных величин, а статистика V, кроме того, используется еще и при проверке гипотез о законах распределения.

 

Понятие о критической области

Это понятие относится к статистике Ѳ и заключается в следующем:

Критической областью (КО) статистики Ѳ называется такое подмножество ω0 ее возможных значений, при попадании в которое основная гипотеза отклоняется.

Соответственно, то множество возможных значений Ѳ, при попадании в которое гипотеза Hₒ не отклоняется, называется допустимой областью или областью принятия основной гипотезы.

Точки, разделяющие критическую и допустимую области, называются критическими и обозначаются Ѳкр.

Критическая область может быть односторонней (правосторонняя или левосторонняя) и двусторонней. В последнем случае вместо обозначения Ѳкр обычно используют обозначения Ѳ1 (левая граница) и Ѳ2 (правая граница), как показано на рисунке:

Критические точки должны быть определены. В основу их определения положен принцип практической невозможности маловероятных событий, который реализуется следующим образом.

Задаются достаточно малой вероятностью проявления статистики Ѳ. Обозначают эту малую вероятность через α и называют уровнем значимости критерия проверки. Тогда критическая область ω0 определяется из условия:

т.е. ω0 рассматривается как область, вероятность попадания в которую возможных значений Ѳ равна α.

Таким образом, попадание Ѳ в область ω0 рассматривается как маловероятное событие. Поэтому в тех случаях, когда значение Ѳр, рассчитанное по опытным данным, все же попадает в область ω0, гипотеза Hₒ отклоняется. Если же Ѳр не попадает в область ω0, то гипотеза Hₒ принимается, т.е. полагают, что опытные данные ей не противоречат.

Нетрудно видеть, что уровни значимости α представляют собою количественную меру ошибки 1-ого рода, т.к. именно с вероятностью α гипотеза Hₒ отклоняется, даже если она верна.

Обычно .

Чем меньше α, тем менее вероятность допустить ошибку первого рода. Однако с уменьшением α уменьшается критическая область, а следовательно, становится менее возможным попадание в нее Ѳр даже когда гипотеза Hₒ неверна (при α = 0 гипотеза Hₒ всегда будет приниматься независимо от результатов испытаний). Поэтому уменьшение α влечет за собой увеличение вероятности принять неверную гипотезу, т.е. совершить ошибку второго рода (увеличение вероятности β). В этом смысле ошибки 1-ого и 2-ого рода являются конкурирующими.

Обратимся теперь непосредственно к вопросу об определении критических точек.

Если КО является левосторонней, то имеем:

откуда

В случае правосторонней КО:

откуда и .

Для двусторонней КО полагают:

Поэтому:

 

Общая схема проверки статистических гипотез

В общем случае процедура проверки статистических гипотез включает пять основных этапов, содержание которых представлено в таблице:



Дата добавления: 2022-05-27; просмотров: 98;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.016 сек.