Выборочное наблюдение
Основные вопросы: 1. Понятие о выборочном наблюдении.
2. Виды выборки.
3. Основные показатели выборки.
4. Ошибки выборки. Определение необходимого объема выборки.
5. Элементы дисперсионного анализа.
1. Понятие о выборочном наблюдении. Как известно, все исследования связаны с большими материальными и временными затратами. Для оптимизации исследований производится отбор изучаемых единиц совокупности. Такие исследования принято называть несплошным наблюдением.
Совокупность единиц, из которых производится отбор, называют генеральной совокупностью,а совокупность отобранных единиц из генеральной совокупности – выборочной совокупностью.
Наиболее известным способом несплошного наблюдения является выборочное наблюдение. Выделим преимущества такого способа наблюдения:
- экономия времени и средств в результате сокращения объема работы;
- сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);
- необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);
- достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.
Можно утверждать, что выборочное наблюдение при строгом соблюдении условий случайности и достаточно большой численности отобранных единиц репрезентативно (представительно); по результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить по всей совокупности.
2. Виды выборки.
I. По степени охвата единиц изучаемой совокупности:
1) большая выборка ( ≥ 30);
2) малая выборка ( < 30).
II. По методу отбора:
1) повторная – общая численность единиц генеральной совокупности не изменяется и каждая исследуемая единица может вновь попасть в выборку;
2) бесповторная – общая численность единиц генеральной совокупности меняется (сокращается) и исследуемая единица не может вновь попасть в выборку.
III По виду отбора:
1) индивидуальная – отбираются отдельные единицы генеральной совокупности;
2) групповая – отбираются качественно однородные группы изучаемых единиц;
3) комбинированная – сочетание первого и второго видов.
IV По способу отбора (формирования):
1) собственно случайная (простая случайная) – осуществляется путем жеребьевки, на основе таблиц случайных чисел и т.п. При этом каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения.
Случайный отбор может быть проведен в двух формах:
а) в форме возвратной (повторной) выборки – вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной;
б) в форме безвозвратной (бесповторной) выборки – выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).
Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка;
2) механическая – когда упорядоченно–расположенные единицы выбираются через определенные интервалы.
Механическая выборка заключается в отборе единиц из генеральной совокупности через равные промежутки из определенного расположения их в генеральной совокупности (по алфавиту, в пространстве, последовательности появления во времени). Такая выборка применяется при контроле качества различных продуктов.
При организации механического отбора возникают две задачи:
- определение «шага отчета» (интервала выборки);
- выбор единицы, с которой надо начинать отчет.
«Шаг отчета» определяется путем деления численности генеральной совокупности на численность выборочной совокупности . Начала отчета находится путем случайного отбора из единиц первого интервала.
3) типическая (расслоенная или районированная) – всю совокупность предварительно разбивают на отдельные типические группы по какому-либо признаку, внутри группы проводится случайный или механический отбор в объеме пропорциональном численности единиц по группам в генеральной совокупности. Типический отбор обеспечивает наибольшую репрезентативность.
4) серийная (гнездовая) – производится отбор целых групп (серий, гнезд) единиц и внутри отобранных серий производится сплошное наблюдение. Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производиться в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими. На практике чаще применяется серийный отбор с равными сериями.
5) комбинированная – предполагает использование нескольких способов выборки. Можно комбинировать, например, серийную выборку и случайную. В этом случае, разбив генеральную совокупность на серии (группы) и отобрав нужное число серий, производят случайную выборку единиц в серии. Такая комбинированная выборка может быть повторной (для групп и единиц) и бесповторной.
6) многоступенчатая выборка – предполагает извлечение из генеральной совокупности сначала укрупненных групп единиц, затем групп, меньших по объему, и так до тех пор, пока не будут отобраны те группы (серии) или отдельные единицы, которые будут подвергнуты наблюдению. Выборка может быть двухступенчатой, когда генеральная совокупность разбивается на группы и производится отбор групп, а затем внутри групп — отбор единиц наблюдения. На обеих ступенях отбор может вестись в случайном порядке. В отличие от типического отбора, где отбор производится из всех без исключения групп, при многоступенчатом отборе производится отбор самих групп, и, следовательно, не все они попадают в выборку.
3. Основные показатели выборки.
Таблица 21
Показатели | Определения | Генеральная совокупность | Выборочная совокупность |
Объем генеральной совокупности | Численность единиц всей совокупности | N | – |
Объем выборки | Число обследованных единиц | – | n |
Генеральная средняя | Среднее значение признака в генеральной совокупности | – | |
Выборочная средняя | Среднее значение признака в выборке | – | |
Генеральная доля | Доля единиц обладающих данным значением признака в общем числе единиц генеральной совокупности | p | – |
Выборочная доля | Доля единиц обладающих данным значением признака в общем числе единиц в выборке | – | |
Число единиц, обладающих изучаемым признаком | – | ||
Генеральная дисперсия | Дисперсия признака в генеральной совокупности | – | |
Выборочная дисперсия | Дисперсия признака в выборке | – |
4. Ошибки выборки. Определение необходимого объема выборки Ошибка выборки (ошибка репрезентативности) – это разность соответствующих выборочных и генеральных характеристик:
– для средней количественного признака;
– для доли (альтернативного признака).
Величина этих отклонений называется ошибкой наблюдения,которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.
При помощи формул теории вероятности можно рассчитать возможную максимальную случайную ошибку – вероятный (стохастический) предел ошибки.
Максимально возможная ошибка – это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.
Величина случайной ошибки репрезентативности зависит от:
• степени колеблемости изучаемого признака в генеральной совокупности;
• способа формирования выборочной совокупности;
• объема выборки.
Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов. В каждой конкретной выборке расхождение между выборочной средней и генеральной может быть меньше средней ошибки выборки, равно ей или больше ее.
Предельную ошибку выборки можно найти на основе средней ошибки выборки:
.
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
– для средней;
– для доли.
Основные формулы для вычисления средних ошибок ( ) и необходимого объема выборки ( ) приведены в таблице, с использованием следующих обозначений:
, – межгрупповая дисперсия серийной выборки
– средние ошибки выборки на отдельных ступенях отбора,
– численность выборок на соответствующих ступенях.
Таблица 22
Формулы для вычисления средних ошибок и необходимого объема выборки
Вид отбора | Способ отбора единиц | Средняя ошибка μ | Объем выборки | ||
для средней | для доли | для средней | для доли | ||
Простая случайная выборка | повторный | ||||
бесповторный | |||||
Механическая выборка | Применяются формулы случайной бесповторной выборки | ||||
Типическая выборка | повторный | - для каждой группы; - число наблюдений в группе | |||
бесповторный | |||||
Серийная выборка | повторный | В зависимости от целей исследования | |||
бесповторный | |||||
Комбинированная выборка | повторный | В зависимости от комбинируемых методов | |||
бесповторный | |||||
Многоступенчатая выборка | В зависимости от целей исследования |
5. Элементы дисперсионного анализа. Дисперсионный анализ является одним из методов изучения влияния одного или нескольких факторных признаков на результативный признак. В зависимости от количества факторов дисперсионный анализ подразделяется на однофакторный и многофакторный. Ниже рассмотрено применение дисперсионного анализа для случая однофакторного комплекса.
В основе дисперсионного анализа лежит расчленение общей вариации изучаемого признака по источникам ее происхождения на два вида вариации:
систематическую вариацию, которая обусловлена изменением признака-фактора;
остаточную (случайную) вариацию, обусловленную действием прочих, случайных, не связанных с данным фактором обстоятельств.
Для разграничения этих вариаций всю совокупность наблюдавшихся единиц разбивают на группы (классы) по факторному признаку и исчисляют средние результативного признака по группам.
Групповые средние:
;
общая средняя:
где – индивидуальные значения признака в группе;
– число единиц, входящих в группу;
– общее число наблюдений.
Если сравнение групповых средних показывает определенное различие в их уровне, то необходимо установить, является ли это различие существенным и вызвано ли оно влиянием признака-фактора.
Для ответа на поставленный вопрос определяют два показателя дисперсии:
1) показатель , характеризующий колеблемость групповых средних вокруг общей средней (межгрупповая дисперсия);
2) показатель ,отражающий остаточную, внутригрупповую дисперсию. Полученные показатели сравнивают, получая фактическое дисперсионное отношение:
При дисперсионном анализе межгрупповую и внутригрупповую дисперсии определяют путем деления суммы квадратов отклонений на соответствующее число степеней свободы.
По таблице F-распределения Фишерапри определенном уровне значимости (или доверительной вероятности) и числе степеней свободы ( и )определяется табличное дисперсионное отношение ( ).
Если , то следует считать, что гипотеза о влиянии признака-фактора не опровергается.
Лекция 8
Дата добавления: 2016-06-22; просмотров: 2577;