Понятие выборочного наблюдения и способы формирования выборочных совокупностей.
В практике статистики широко используется выборочный метод, при котором обобщающие показатели изучаемой совокупности устанавливаются по результатам изучения только части ее единиц. Эффективность этого метода заключается в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки, с меньшими затратами труда и средств, а иногда выборочное обследование является единственно возможным (если определение характеристик связано с уничтожением или порчей продукции).
При этом вся совокупность называется генеральной, а часть ее, отобранная для обследования, - выборочной. Отбор единиц в выборочную совокупность может быть повторным и бесповторным. Повторным называется отбор, при котором каждая попавшая в выборку единица после фиксации значения изучаемого признака возвращается в генеральную совокупность и может участвовать в дальнейшем отборе. Если раз попавшая в выборку единица не возвращается в генеральную совокупность, а следовательно не участвует в дальнейшем отборе, то такой отбор будет бесповторным.
В статистике применяются различные способы формирования выборочных совокупностей.
При собственно случайной выборке отбор единиц в выборочную совокупность осуществляется по жребию. При этом для каждой единицы генеральной совокупности должна быть обеспечена равная возможность попадания в выборку.
При механической выборке отбор единиц осуществляется через строго определенный шаг из ранжированного списка единиц генеральной совокупности или из того порядка, в котором они фактически размещаются. Например, последовательность выхода готовой продукции с конвейера или поточной линии, порядок размещения единиц при хранении, транспортировке и т. д. Ширина шага равна обратной величине доли выборки. При 2%-й выборке отбирается каждая 50-я единица, при 5%-й – каждая 20-я и т. д. Механическая выборка всегда бесповторная.
При типической выборке генеральная совокупность вначале расчленяется на качественно однородные группы по тому или иному признаку, Затем из каждой типической группы производится индивидуальный отбор единиц в выборочную совокупность по методу собственно случайной или механической выборки.
При серийной выборке из генеральной совокупности отбирают не отдельные единицы, а целые их серии (гнезда), внутри которых обследуются все без исключения единицы, т. е. применяется сплошное наблюдение.
Если соблюдаются правила научной организации исследования, то выборочный метод дает достаточно точные результаты. Однако характеристики, полученные выборочным наблюдением, всегда будут отличаться от результатов сплошного наблюдения, поскольку выборочная совокупность (отобранная для обследования) не точно воспроизводит генеральную (всю исследуемую) совокупность. Разница в этих характеристиках называется ошибкой выборки или ошибкой репрезентативности (представительности выборки). Задача статистики – количественно измерить ошибку выборки. Доказано, что величина выборки зависит от объема выборки, степени вариации признака, методов отбора единиц в выборочную совокупность и принятого уровня достоверности результата исследования.
2. Определение ошибки выборочной средней.
Средняя величина признака в генеральной совокупности будет определена по следующей формуле:
,
где - средняя величина признака в выборочной совокупности;
- предельная ошибка выборки.
В математической статистике доказано, что , где t - коэффициент доверия, зависящий от значения вероятности Р и определяемый по таблице значений P(t); - средняя ошибка.
При вероятности Р=0,683 значение t=1;
при Р=0,954 t=2;
при Р=0,997 t=3.
Для собственно случайной и механической выборки средняя ошибка при повторном отборе вычисляется по формуле:
где - дисперсия количественного признака, определяемая по формуле:
или ,
n – число единиц выборочной совокупности.
При бесповторном отборе
где N – численность генеральной совокупности.
Средняя ошибка выборки для типической и серийной выборки рассчитывается по тем же формулам с той лишь разницей, что:
1) при типической выборке используется средняя из групповых дисперсий:
,
где - групповая дисперсия;
- число единиц в группе.
2) При серийной выборке – межгрупповая дисперсия:
,
где - групповая средняя
- общая средняя.
Кроме того, при серийном отборе формула средней ошибки выборки имеет следующий вид:
,
где s – число серий в выборке;
S – число серий в генеральной совокупности.
3. Определение ошибки выборочной доли.
Доля единиц, обладающих тем или иным признаком в генеральной совокупности
,
где - доля единиц, обладающих данным признаком в выборочной совокупности;
- предельная ошибка выборочной доли.
,
где - средняя ошибка выборочной доли.
Средняя ошибка выборочной доли определяется по следующим формулам:
1) для собственно случайной выборки:
при повторном отборе: ;
при бесповторном отборе: ;
2) для механической выборки: ;
3) для типической выборки: ;
4) для серийной выборки
4.Определение необходимой численности выборки
В практике организации выборочного наблюдения возникает потребность определения необходимой численности выборки для обеспечения заданной точности предельной ошибки выборки и ее вероятности. Определение необходимой численности выборки основывается на формуле предельной ошибки выборки.
Из формулы предельной ошибки выборки среднего значения признака при повторном отборе
находим .
При бесповторном случайном отборе необходимая численность выборки вычисляется по формуле: .
При типической выборке: .
При серийной выборке .
Необходимая численность выборки при определении доли исчисляется по аналогичным формулам с той разницей, что вместо дисперсии количественного признака, используется дисперсия альтернативного признака.
Так, для случайной бесповторной выборки формула необходимой численности выборки будет иметь следующий вид:
Пример 1
Из 1000 рабочих предприятия в порядке случайной бесповторной выборки обследовано 100 человек, которые по уровню дневной выработки распределились так:
Дневная выработка (шт.) | 30-40 | 40-50 | 50-60 | 60-70 | Итого |
Число рабочих |
По этим данным установить:
1) среднюю дневную выработку одного рабочего предприятия с вероятностью 0,954.
2) Долю рабочих предприятия с дневной выработкой 60 штук и более с вероятностью 0,683.
3) Объем выборки, чтобы с вероятностью 0,954 предельная ошибка выборки при определении средней выработки не превышала 2-х штук.
4) Объем выборки, чтобы с вероятностью 0,954 предельная ошибка выборки при определении доли рабочих с дневной выработкой 60 штук и более не превышала 6%.
Решение:
1)
В нашем примере объем выборки (n)=100 рабочих. Численность генеральной совокупности (N) 1000 рабочих.
Для нахождения выборочной средней ( ) и выборочной дисперсии ( ) составим расчетную таблицу:
Таблица 4
Дневная выработка, шт. | Число рабочих (f) | x | x-A (A=45) | K=10 (x’) | |||
30-40 40-50 50-60 60-70 | -10 +10 +20 | -1 +1 +2 | -30 +24 +26 | ||||
Итого | х | х | х |
При вероятности 0,954 t=2, тогда шт.
С вероятностью 0,954 можно утверждать, что средняя дневная выработка одного рабочего предприятия находится в пределах шт.,т.е. будет не меньше 45,08 и не больше 48,92 штук.
2)
Выборочная доля рабочих с дневной выработкой 60 штук и более по условию задачи равна: , а выборочная дисперсия доли
Средняя ошибка доли:
при вероятности 0,683 t=1, тогда
Следовательно, с вероятностью 0,683 можно утверждать, что доля рабочих предприятия с дневной выработкой 60 шт. и более находится в пределах 13 3,2 или от 9,8 до 16,2%.
3) рабочих.
Для того, чтобы предельная ошибка выборки с вероятностью 0,954 (при дисперсии = 102) не превышала 2-х штук, достаточно подвергнуть выборочному обследованию 93 рабочих.
4) рабочих.
Для того, чтобы предельная ошибка выборки при вероятности 0,954 не превышала 6%, необходимо подвергнуть выборочному обследованию 112 рабочих.
Пример 2
Из 2500 рабочих трёх цехов завода подвергнуто пропорциональному типическому отбору 200 человек, которые по проценту выполнения норм выработки распределились следующим образом:
Число рабочих по профессиям % выпол- нения норм выработки | Слесари | Токари | Шлифовщики | Итого |
90-100 | ||||
100-110 | ||||
110-120 | ||||
Итого |
Принимая, что в каждой группе произведена случайная повторная выборка, определить:
1. Возможные пределы среднего процента выполнения норм выработки всеми рабочими завода (с вероятностью 0,954).
2. Возможные пределы доли рабочих, выполняющих нормы выработки не менее чем на 100% (с вероятностью 0,997).
3. Необходимую численность выборки при определении среднего процента выполнения норм выработки, чтобы с вероятностью 0,954, предельная ошибка выборки не превышала 1%.
4. Необходимую численность выборки при определении доли рабочих, выполняющих нормы выработки не менее чем на 100%, чтобы предельная ошибка выборки не превышала 3% (с вероятностью 0,954).
Решение:
1) Средняя ошибка выборочной средней при типической выборке (повторный отбор) исчисляется по формуле:
где - средняя внутригрупповая дисперсия, равная средней взвешенной из дисперсий отдельных типических групп.
Для нахождения выборочной средней и средней внутригрупповой дисперсии составим расчётную таблицу:
Таблица 5
Расчетная таблица
% выполнения норм выработки | Число рабочих | ( = =105) | ( =10) | ||||||||||||
Слесари | Тока- ри | Шлифов-щики | Итого | ||||||||||||
90-100 | -10 | -1 | -2 | -20 | -18 | -40 | |||||||||
100-110 | |||||||||||||||
110-120 | +10 | +1 | +30 | +40 | +40 | +100 | |||||||||
Итого | x | x |
Определяем выборочную среднюю:
Дисперсии типических групп (внутригрупповые дисперсии) определим по формуле:
Средняя ошибка выборки будет равна:
Предельная ошибка выборки составит:
.
Следовательно, с вероятностью 0,954 можно утверждать, что средний процент выполнения норм выработки всеми рабочими завода находится в пределах , т.е. от 106,94% до 109,06%.
2) Выборочная доля
Средняя ошибка выборочной доли при типическом повторном отборе определяется по формуле:
;
;
;
Средняя ошибка доли будет равна:
.
Тогда предельная ошибка: .
Следовательно, с вероятностью 0,997, можно утверждать, что доля рабочих завода, выполняющих нормы выработки не менее, чем на 100%, находится в пределах , т. е. от 71,72% до 88,28%.
3) Объём выборки, обеспечивающий предельную ошибку выборки не более чем 1%, будет равен (с вероятностью 0,954)
рабочих.
4) Объём выборки при исчислении доли, обеспечивающий предельную ошибку выборки не более чем на 3% (с вероятностью 0,954)
рабочих.
Пример 3
Из 30 бригад (по 10 человек каждая) отобрано 3 бригады, рабочие которых распределились по возрасту следующим образом:
№ бригады | Возраст рабочих (лет) |
35, 42, 28, 23, 51, 18, 36, 29, 46, 32 | |
18, 24, 49, 32, 54, 43, 27, 38, 51, 26 | |
50, 44, 36, 28, 23, 41, 31, 24, 46, 33 |
Определить:
1) с вероятностью 0,683 средний возраст рабочих всех 30 бригад;
2) объём выборки, обеспечивающий с вероятностью 0,997 предельную ошибку выборки, не превышающую 1 года.
Средний возраст рабочих по каждой бригаде определим по формуле средней арифметической простой, как сумму возрастов всех рабочих бригады, делённую на число рабочих.
Так, средний возраст рабочих первой серии (бр. №5) будет равен
года
Аналогичным образом определяем средний возраст рабочих следующих серий:
второй = года,
третьей = года.
Средний возраст рабочих выборочной совокупности составит года.
Для серийной выборки
,
где - межгрупповая дисперсия, определяемая по формуле
.
Поскольку численность всех бригад одинаковая, можно использовать не взвешенную среднюю
Тогда
года
.
С вероятностью 0,683 мы можем утверждать, что средний возраст всех рабочих будет не меньше 34,69 года и не больше 35,71 года.
2) бригад.
Объём выборки, обеспечивающий с вероятностью 0,997 предельную ошибку выборки, не превышающую 1 года должен быть не менее 7 бригад
.
Дата добавления: 2020-10-25; просмотров: 364;