Вероятностный метод выборки
Вероятностные методы выборки различаются степенью эффективности. Эффективность выборки отражает компромисс между затратами и точностью выборки. Точность выборки – это степень неопределенности, связанная с измеряемой характеристикой. Чем больше точность, тем выше стоимость. Исследователь должен разработать эффективную выборку при заданном бюджете.
Простая случайная выборка. Каждый элемент совокупности имеет известную и равную вероятность отбора. Каждая возможная выборка данного объема имеет известную и равную вероятность того, что она станет выборочной совокупностью. Это означает, что каждый элемент отбирается независимо от другого. Выборка формируется произвольным отбором элемента из основы выборки.
Сначала формируем основу выборочного наблюдения, в которой каждому элементу присваивается уникальный идентификационный номер. Затем генерируются случайные числа, чтобы определить номера элементов, которые будут включены в выборку. Эти случайные числа могут генерироваться компьютерной программой или выбираться из таблицы случайных чисел.
У этого метода четыре ограничения: сложно сформировать основу выборки; выборка может оказаться очень большой или охватывать большую территорию, что значительно увеличивает время и стоимость сбора данных; результаты отбора часто имеют низкую точность и большую стандартную ошибку; может сформироваться нерепрезентативная выборка, особенно при небольшом объеме выборки. Поэтому более популярен метод систематической выборки.
Систематическая выборка.При проведении систематической выборки сначала задают произвольную исходную (отправную) точку, а затем из основы выборочного наблюдения последовательно выбирают каждый i-тый элемент. Интервал отбора I определяется как отношение объема совокупности N к объему выборки n , с округлением результата до ближайшего целого числа.
Например, если генеральная совокупность состоит из 100 тыс. элементов, а желательный объем выборки равен 1 тыс. респондентов. Тогда интервал отбора (шаг выборки) равен 100. Выбираем случайное число между 1 и 100, например, 23. Тогда выборка состоит из элементов 23, 123, 223, 323 и т.д. Здесь также каждый элемент генеральной совокупности имеет известную и равную вероятность выбора.
Систематическая случайная выборка отличается от простой случайной тем, что только допустимые выборки объема n имеют известную и равную вероятность выбора. Остальные выборки объема n имеют нулевую вероятность выбора.
При систематической выборке исследователь предполагает, что элементы совокупности расположены в определенном порядке. Если фирмы отрасли расположены в списке в порядке увеличения их размера, то систематическая выборка увеличивает репрезентативность отбора, а простая случайная выборка в этом случае может быть нерепрезентативной. Если расположение элементов носит циклический характер, то систематическая выборка уменьшает репрезентативность отбора.
Систематическая выборка дешевле и проще, чем простая случайная, поскольку случайный отбор осуществляется только один раз. Некоторые списки содержат миллионы элементов, и использование систематического отбора значительно экономит время, снижает затраты. Еще одно важное преимущество: систематический отбор можно применять, даже не зная структуры основы выборочного наблюдения.
Стратифицированная выборка. Стратифицированная, или расслоенная, выборка – это двухэтапный метод вероятностной выборки, когда генеральная совокупность сначала делится на подгруппы или слои (страты), затем из каждого слоя случайным образом выбираются элементы. Случайный отбор элементов отличает стратифицированную выборку от квотной.
Переменные, используемые для деления генеральной совокупности на слои, называются стратификационными переменными. Слои должны взаимно исключать и взаимно дополнять друг друга, чтобы каждый элемент совокупности относился только к одному слою и ни один элемент не был упущен. Для стратификации часто используются демографические характеристики, разновидность покупателя, величина фирмы или отрасль промышленности.
Главная задача стратифицированной выборки – увеличить точность без увеличения затрат. Элементы, относящиеся к одному слою, должны быть как можно более однородными, а относящиеся к разным слоям – наоборот, как можно более разнородными. Опыт показывает, что использовать следует не больше шести слоев.
При пропорциональном стратификационном отборе объем выборки, получаемый из каждого слоя, пропорционален доле этого слоя в генеральной совокупности. Логика проста: слои большего размера больше влияют на формирование выборки, из этих слоев надо отбирать больше элементов. Когда исследователя в первую очередь интересует выявление различий между слоями, обычно создают одинаковые по объему выборки из каждого слоя, т.е. непропорциональная выборка.
Стратификационный метод обеспечивает наличие в выборке всех важных подгрупп. Это особенно важно, когда исследуемая характеристика неравномерно распределена среди элементов генеральной совокупности. Например, доходы среди семей распределены неравномерно, и если применить простую случайную выборку, то семьи с высоким доходом (их мало) могут быть неадекватно представлены. Стратифицированная выборка позволяет обеспечить соответствующее количество таких семей, поэтому данный метод весьма популярен.
Кластерная выборка. Сначала генеральная совокупность делится на взаимоисключающие и взаимодополняющие подгруппы, или кластеры. Затем с помощью вероятностного метода выборки (например, простая случайная) формируется случайная выборка кластеров. В выборку включаются либо все элементы кластера (одноступенчатая кластерная выборка), либо проводится их отбор вероятностным методом в каждом кластере (двухступенчатая кластерная выборка). Если кластерная выборка состоит из более чем двух этапов, она называется многоступенчатой.
Основное различие между кластерной и стратифицированной выборками состоит в том, что в кластерной используются только отобранные группы (кластеры), а в стратифицированной все подгруппы (слои) используются для дальнейшего отбора.
Цели данных методов различны. Цель кластерной выборки – увеличить эффективность выборки, уменьшив затраты на ее проведение. Цель стратифицированной выборки – увеличить точность. Критерии формирования кластеров прямо противоположны критериям формирования слоев. Элементы кластера должны быть максимально разнородны, а сами кластеры как можно более однородными. В идеале каждый кластер должен представлять уменьшенную модель генеральной совокупности.
Распространенная форма кластерной выборки – территориальная,в которой кластеры состоят из географических территорий (округов, жилых районов, кварталов). Если с помощью простой случайной выборки выбираются только некоторые кварталы, а затем все живущие там семьи – это одноступенчатая выборка. Если с помощью простого случайного отборы выбираются и кварталы, и семьи – это двухступенчатая выборка. Этот метод подходит в том случае, если кластеры равны по объему, т.е. каждый кластер содержит примерно равное количество единиц. Если кластеры различны, то простая двухступенчатая кластерная выборка может привести к ошибочным результатам. Иногда можно объединить кластеры, чтобы сравнять их по объему. Если объединить кластеры невозможно, следует воспользоваться пропорциональной вероятностной выборкой.
При вероятностной выборке пропорциональной объему кластеры отбираются с вероятностью пропорциональной их объему. Объем кластера определяется количеством входящих в него единиц. На первом этапе большие по объему кластеры имеют большую вероятность включения в выборку. На втором – вероятность отбора единицы из выбранного кластера обратно пропорциональна его объему. В результате вероятность включения в выборку будет равной для всех единиц.
Кластерная выборка обладает двумя преимуществами – выполнимостью (кластеры доступны всегда, а элементы – нет, их список трудно составить) и низкой себестоимостью.
Дата добавления: 2021-04-21; просмотров: 580;