Задачи дисперсионного анализа
При исследовании однотипных величин возникают задачи их сравнения. Сравнение случайных величин производится путем сопоставления законов распределения или их моментов.
Законы распределения можно сопоставить на основе критерия Вилкоксона при нулевой гипотезе Н0 о равенстве законов распределениядвух случайных величин Fx = Fy и конкурирующей гипотезе Н1 в виде: Fx < Fy или Fx > Fy. В этих случаях критическая область является односторонней. Поэтому нижнюю критическую точку и квантиль распределения находят при уровне значимости a. Содержание остальных этапов проверки гипотез сохраняется. Следует отметить, принятие гипотезы Н1 о том, что
Fx < Fy , означает X > Y.
Действительно, неравенство Fx (x) < Fy(x) равносильно неравенству
P(X < x)< P(Y < x),
следовательно, X>Y.
Аналогично, если справедлива гипотеза Fx >Fy, то X<Y.
Вполне естественно сопоставление случайных величин на основе моментов проводить путем сравнения их математических ожиданий. Однофакторный дисперсионный анализ позволяет установить, оказывает ли существенное влияние некоторый фактор Φ, который имеет несколько уровней, на исследуемую случайную величину.
Задача сравнения выборок случайных величин формулируется следующим образом.
Имеются результаты наблюдений в виде совокупности слоев типа (6.1), задан уровень значимости a для проверки статистической гипотезы. В данном случае отдельные слои трактуются как выборки одной и той же случайной величины, полученные по результатам наблюдения за одним объектом при различных значениях фактора Φ (количество уровней фактора равно m).
Требуется проверить нулевую гипотезу Н0 о равенстве математических ожиданий случайных величин всех выборок. Иначе говоря, требуется установить, значимо или незначимо различаются выборочные средние значения, вычисленные для каждого слоя.
Допущения: генеральные совокупности, соответствующие каждому слою, распределены нормально; дисперсии слоев одинаковы; математические ожидания, дисперсии, законы распределения случайных величин для различных слоев неизвестны, сами случайные величины являются непрерывными. Вполне понятно, что первые два условия являются наиболее существенными и весьма ограничивают область применения методов дисперсионного анализа.
Основная идея дисперсионного анализа состоит не в сопоставлении математических ожиданий случайных величин, а в сравнении оценки "факторной дисперсии", порождаемой воздействием фактора, и оценки "остаточной дисперсии", обусловленной случайными причинами. Если различие между этими оценками значимо, то фактор оказывает существенное влияние на случайную величину, в противном случае влияние фактора несущественно. Если установлено существенное влияние фактора, то каждому слою соответствует своя оценка математического ожидания. Упорядочение значений оценок математического ожидания позволит выявить влияние фактора.
Эту же задачу можно было бы решить путем проверки нулевой гипотезы о равенстве минимального и максимального значений оценок математического ожидания, вычисленных по всем слоям. Но такое сопоставление выборок игнорирует информацию, содержащуюся во всех слоях, кроме выбранных, и поэтому нецелесообразно.
Дисперсионный анализ выполняется поэтапно. Такими этапами являются следующие:
проверка выборок на принадлежность к нормальному закону распределения. Этап необходим, когда нет априорной информации о законах распределения слоев. Сущность такой проверки была рассмотрена в разделе 2 настоящего курса лекций. Если принадлежность нормальному закону не подтвердится, то аппарат дисперсионного анализа, вообще говоря, применять нельзя. Некоторые исследователи допускают его применение при больших объемах выборок (объем каждой выборки должен быть не менее 30) независимо от вида закона распределения;
· проверка равенства оценок дисперсий во всех слоях выборки (проверка однородности дисперсий). Если однородность не подтвердится, то методы дисперсионного анализа не применимы;
· вычисление оценки факторной и остаточной дисперсии;
· сравнение средних значений величин методом дисперсионного анализа и формирование выводов по результатам сравнения.
Дата добавления: 2022-02-05; просмотров: 246;