Сущность и схема дисперсионного анализа
Дисперсионный анализ основан на работах знаменитого математика Р.А.Фишера. Несмотря на достаточно солидный «возраст», данный метод до сих пор остается одним из основных при проведении биологических и сельскохозяйственных исследований. Идеи, положенные в основу дисперсионного анализа, широко используются во многих других методах математического анализа экспериментальных данных, а также при планировании биологических и сельскохозяйственных экспериментов.
Дисперсионный анализ позволяет:
1) сравнивать две или несколько выборочных средних;
2) одновременно изучать действие нескольких независимых факторов, при этом можно определить как эффект каждого фактора в изменчивости изучаемого признака, так и их взаимодействие;
3) правильно планировать научный эксперимент.
Изменчивость живых организмов проявляется в виде разброса или рассеяния значений отдельных признаков в пределах, которые определяются степенью биологической выравненности материала и характером взаимосвязей с условиями среды. Признаки, изменяющиеся под воздействием тех или иных причин, называют результативными.
Факторы это любые воздействия или состояния, разнообразие которых может так или иначе отражаться на разнообразии результативного признака. Под статистическим влиянием факторов в дисперсионном анализе понимается отражение в разнообразии результативного признака того разнообразия изучаемых факторов, которое организовано в исследовании.
Под разнообразием будем понимать наличие неодинаковых значений каждого признака у разных особей, объединенных в группу. Разнообразие группы особей по изучаемому признаку может иметь разную степень, которая обычно измеряется показателями разнообразия (или изменчивости): лимитами, средним квадратическим отклонением, коэффициентом вариации. В дисперсионном анализе степень разнообразия индивидуальных и средних значений признака измеряется и сравнивается особыми способами, составляющими специфику этого общего метода.
Организация факторов заключается в том, что каждому изучаемому фактору придается несколько значений. В соответствии с этими значениями каждый фактор разбивается на несколько градаций; для каждой градации подбирается по принципу случайной выборки несколько особей, у которых впоследствии и измеряется величина результативного признака.
Для того, чтобы выяснить степень и достоверность влияния изучаемых факторов, надо измерить и оценить ту часть общего разнообразия, которая вызывается этими факторами.
Факторы, влияющие на степень варьирования результативного признака, делятся на:
1)регулируемые
2) случайные
Регулируемые (систематические) факторы вызываются действием изучаемого в эксперименте фактора, который имеет в опыте несколько градаций. Градация фактора – это степень его воздействия на результативный признак. В соответствии с градациями признака выделяется несколько вариантов опыта для сравнения. Поскольку эти факторы предварительно обусловлены, их называют регулируемыми в исследованиях, т.е. заданными, зависящими от организации опыта. Следовательно, регулируемые факторы – факторы, действие которых изучается в опыте, именно они и обусловливают различия между средними выборочными разных вариантов–межгрупповую (факториальную) дисперсию.
Случайные факторы определяются естественным варьированием всех признаков биологических объектов в природе. Это неконтролируемые в опыте факторы. Они оказывают случайное влияние на результативный признак, обусловливают экспериментальные ошибки и определяют внутри каждого варианта разброс (рассеяние) признака. Этот разброс носит название внутригрупповой (случайной) дисперсии.
Таким образом, относительная роль отдельных факторов в общей изменчивости результативного признака характеризуется дисперсией и может быть изучена с помощью дисперсионного анализа или анализа рассеяния
Дисперсионный анализ основан на сравнении межгрупповой и внутригрупповой дисперсий. Если межгрупповая дисперсия не превышает внутригрупповую, значит, различия между группами имеют случайный характер. Если межгрупповая дисперсия существенно выше, чем внутригрупповая, то между изучаемыми группами (вариантами) существуют статистически значимые различия, обусловленные действием изучаемого в опыте фактора.
Из этого следует, что при статистическом изучении результативного признака при помощи дисперсионного анализа следует определить его варьирование по вариантам, повторениям, остаточное варьирование внутри этих групп и общее варьирование результативного признака в опыте. В соответствии с этим различают три вида дисперсий:
1) Общую дисперсию результативного признака (Sy2);
2) Межгрупповую, или частную, между выборками (Sy2);
3) Внутригрупповую, остаточную (Sz2).
Следовательно, дисперсионный анализ – это расчленение общей суммы квадратов отклонений и общего числа степеней свободы на части или компоненты, соответствующие структуре эксперимента, и оценка значимости действия и взаимодействия изучаемых факторов по F-критерию. В зависимости от числа одновременно исследуемых факторов различают двух-, трех-, четырехфакторный дисперсионный анализ.
При обработке полевых однофакторных статистических комплексов, состоящих из нескольких независимых вариантов, общая изменчивость результативного признака, измеряемая общей суммой квадратов (Сy), расчленяется на три компонента: варьирование между вариантами (выборками) – СV, варьирование повторений (варианты связаны между собой общим контролируемым условием – наличием организованных повторений) – Сp и варьирование внутри вариантов Сz. В общей форме изменчивость признака представлена следующим выражением:
Сy = СV +Сp + Сz.
Общее число степеней свободы (N -1) также расчленяется на три части:
степени свободы для вариантов (l – 1);
степени свободы для повторений (n – 1);
случайного варьирования (n – 1) × (l – 1).
Суммы квадратов отклонений, по данным полевого опыта – статистического комплекса с вариантами – l и повторениями – n, находят следующим образом. Сначала с помощью исходной таблицы определяют суммы по повторениям – Σ P , вариантам – Σ V и общую сумму всех наблюдений - Σ X.
Затем вычисляют следующие показатели:
Общее число наблюдений N = l × n;
Корректирующий фактор (поправку) Скор = (Σ X1)2 / N;
Общую сумму квадратов Cy = Σ X12 – Cкор;
Сумму квадратов для повторений Cp = Σ P2 / (l –Cкор);
Сумму квадратов для вариантов CV = Σ V2 / (n – 1);
Сумму квадратов для ошибки (остаток) CZ = Cy - Cp - CV .
Полученные суммы квадратов CV и CZ делят на соответствующие им степени свободы и получают два средних квадрата (дисперсии):
Вариантов Sv2 = CV/ l – 1;
Ошибки SZ2 = CZ / (n – 1)×(l – 1).
Оценка существенности разностей между средними.Полученные средние квадраты используют в дисперсионном анализе для оценки значимости действия изучаемых факторов путем сравнения дисперсии вариантов (Sv2) с дисперсией ошибки (SZ2) по критерию Фишера (F = SY2 / SZ2). За единицу сравнения принимают средний квадрат случайной дисперсии, который определяет случайную ошибку эксперимента.
Применение критерия Фишера позволяет установить наличие или отсутствие существенных различий между выборочными средними, но не указывает конкретных различий между средними.
Проверяемой Ho – гипотезой является предположение - все выборочные средние являются оценками одной генеральной средней и различия между ними несущественны. Если Fфакт = SY2 / SZ2 ≤ Fтеор, то нулевая гипотеза не отвергается. Между выборочными средними нет существенных различий, и на этом проверка заканчивается. Нулевая гипотеза отвергается при Fфакт= SY2 / SZ2 ≥ FтеорЗначение F- критерия для принятого в исследовании уровня значимости находят в соответствующей таблице с учетом степеней свободы для дисперсии вариантов и случайной дисперсии. Обычно пользуются 5%-ным уровнем значимости, а при более строгом подходе 1% - ным и даже 0,1%-ным.
Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS(от английского Sum of Squares – Сумма квадратов). Далее слово выборочная мы часто опускаем, прекрасно понимая, что рассматривается выборочная дисперсия или оценка дисперсии. В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты.:
SS ошибок и SS эффекта. Внутригрупповая изменчивость (SS) обычно называется остаточной компонентой или дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффекта (или компоненту дисперсии между группами) можно объяснить различием между средними значениями в группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.
Основная логика дисперсионного анализа. Подводя итоги, можно сказать, что целью дисперсионного анализа является проверка статистической значимости различия между средними (для групп или переменных). Эта проверка проводится с помощью разбиения суммы квадратов на компоненты, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.
Зависимые и независимые переменные.Переменные, значения которых определяется с помощью измерений в ходе эксперимента (например, балл, набранный при тестировании), называются зависимыми переменными. Переменные, которыми можно управлять при проведении эксперимента (например, методы обучения или другие критерии, позволяющие разделить наблюдения на группы или классифицировать) называются факторами или независимыми переменными.
Множество факторов. Мир по своей природе сложен и многомерен. Ситуации, когда некоторое явление полностью описывается одной переменной, чрезвычайно редки. Например, если мы пытаемся научиться выращивать большие помидоры, следует рассматривать факторы, связанные с генетической структурой растений, типом почвы, освещенностью, температурой и т.д. Таким образом, при проведении типичного эксперимента приходится иметь дело с большим количеством факторов. Основная причина, по которой использование дисперсионного анализа предпочтительнее повторного сравнения двух выборок при разных уровнях факторов с помощью серий t-критерия, заключается в том, что дисперсионный анализ существенно более эффективени, для малых выборок, более информативен.
Вывод.Дисперсионный анализ разработан и введен в практику сельскохозяйственных и биологических исследований английским ученым Р. А. Фишером. Сущность дисперсионного анализазаключается, в разложении общей изменчивости признака и общего числа степеней свободы на составляющие части, соответствующие структуре полевого опыта, также в оценке действующего фактора по критерию Фишера.
Где Общая изменчивость признака, обусловленная действием изучаемого вопроса, неоднородностью почвенного плодородия и случайными ошибками в опыте.
Варьирование урожаев по повторениям полевого опыта.
Варьирование урожаев по вариантам опыта, связанное с действием изучаемого вопроса.
Варьирование урожаев, связанное со случайными ошибками в опыте.
Выводв дисперсионном анализе делается согласно следующим правилам:
1. В опыте есть существенные различия, если Fфактическое ≥Fтеоритическое. В опыте нет существенных различий, если Fфактическое <Fтеоритическое.
2. НСР – Наименьшая существенная разность, используестся для определения разности между вариантами. Если разность d≥ НСР, то различия между вариантами существенные. Если d< НСР, то различия между вариантами не существенные.
Группывариантов.
1. Если разница d– существенная, и указывает на повышение урожайности, то варианты относятся к 1 группе.
2. Если разница d– не существенная, то варианты относятся ко 2 группе.
3. Если разница d– существенная, но указывает на снижение урожайности, то варианты относятся к 3 группе.
Выбор формулыдисперсионного анализа зависит от методов размещения вариантов в опыте:
1. Для организованных повторений:
2. Для неорганизованных повторений:
3. Для Латинского квадрата и Латинского прямоугольника:
Дата добавления: 2018-05-10; просмотров: 2576;