Оценка результатов выборочного наблюдения


Порядок оценки результатов выборочного наблюдения рассмотрим на примере определения генеральной средней ( ) для количественного признака и генеральной доли (p) для альтернативного атрибутивного признака.

Обозначим ошибку выборки соответственно:

;

,

где:

выборочная средняя;

w – выборочная доля.

Ошибка выборки является случайной величиной, так как заранее неизвестно, какие единицы попадут в выборочную совокупность, а какие – нет. Поэтому, оценивая точность результатов наблюдения, рассчитывают среднее и предельное значение ошибки выборки, которые связаны между собой уравнением:

;

,

где:

предельные значения ошибки выборки;

средние значения ошибки выборки;

tкоэффициент доверия. Он зависит от вероятности, с которой гарантируется предельная ошибка выборки – доверительной вероятности.

Предельное значение ошибки выборки определяет предельные границы генеральной средней (доли), образующие доверительный интервал:

;

.

Если показатель предельной ошибки выборки характеризует точность результатов выборочного наблюдения, то показатель доверительной вероятности – их достоверность. При заданном объеме выборочной совокупности между ними существует обратная связь – увеличение точности результатов наблюдения приводит к уменьшению их достоверности и наоборот.

В таблице 8.1 представлены значения доверительной вероятности, наиболее часто применяемые при проведении статистических выборок большого объёма (не менее 30 единиц), и соответствующие им значения коэффициента доверия.

Таблица 8.1

P 0,683 0,95 0,954 0,99 0,997
t 1,96 2,58

 

Порядок расчёта средней ошибки выборки зависит от способа выборочного наблюдения и метода отбора.

При собственно-случайном наблюдении среднюю ошибку выборки определяют по следующим формулам:

· при повторном отборе

;

;


 

· при бесповторном отборе

;

,

где:

– выборочная дисперсия;

– выборочная дисперсия доли;

n – объём выборочной совокупности;

N – объём генеральной совокупности.

При заданном объеме выборки средняя ошибка бесповторного наблюдения всегда меньше средней ошибки повторного наблюдения, так как при бесповторном наблюдении выборочная совокупность будет в большей степени соответствовать генеральной, чем при повторном наблюдении, при котором может быть отобрана несколько раз одна и та же единица генеральной совокупности. Математически это подтверждается тем, что объем выборки всегда меньше объема исходной статистической совокупности, то есть

.

Тогда

.

Очевидно, что появление в формуле дополнительного множителя, меньшего единицы, уменьшает окончательный результат.

Пример 8.1. В таблице 8.2 представлены данные собственно-случайного повторного выборочного наблюдения деревьев в лесу, организованного с целью определения среднего диаметра деревьев во всем лесу. Рассчитаем границы, в которых находится генеральное значение среднего диаметра деревьев, гарантировав эти границы с вероятностью 0,683.

Таблица 8.2

Диаметр дерева, см 10 – 30 30 – 50 50 – 70 70 – 90 90 - 110 Итого
Число деревьев

 

Решение.

Искомые границы среднего диаметра деревьев во всем лесу

.

Выборочный средний диаметр деревьев

.

Предельная ошибка среднего диаметра

.

При доверительной вероятности P = 0,683 табличное значение коэффициента доверия t = 1.

Выборочная дисперсия диаметра деревьев

.

Итерационную часть расчетов представим в таблице 8.3.

Таблица 8.3

Итого

 


Согласно данным итоговой строке таблицы 8.3:

см;

;

≈ 12,7 см;

= 29,3; 54,7 см.

Таким образом, с вероятностью 0,683 можно утверждать, что средний диаметр деревьев в лесу находится в пределах от 29,3 до 54,7 см.

 

При большом объёме выборочной совокупности механическое наблюдение близко к бесповторному собственно-случайному отбору. Действительно, если, например, совокупность людей большого объема предварительно упорядочить по их фамилиям в алфавитном порядке и отобрать каждого k-го человека, то нельзя заранее узнать, кто из первоначальной неупорядоченной совокупности попадет в выборку, а кто – нет. Следовательно, по своей сути такой отбор будет носить случайный характер, но с той лишь разницей, что он всегда будет бесповторным. Поэтому для механической выборки могут быть применены формулы расчёта средней ошибки бесповторной собственно-случайной выборки.

Пример 8.2. Статистическим управлением города для изучения общественного мнения о работе городской администрации в порядке механического отбора было опрошено 6400 чел., что составило 2 % населения города. Из числа опрошенных 3840 чел. положительно оценили работу администрации. Определим с вероятностью 0,954 пределы, в которых находится доля городского населения, положительно оценивающего работу администрации.


Решение.

Границы доли населения, положительно оценивающего работу администрации

.

Выборочная доля населения

.

Предельная ошибка доли населения

.

При доверительной вероятности Р = 0,954 табличное значение коэффициента доверия t = 2.

Поскольку доля опрошенных людей от всего населения города составила 2 %, то

.

Тогда

≈ 0,012;

0,588; 0,612.

Таким образом, с вероятностью 0,954 можно утверждать, что от 58,8 до 61,2 % населения города положительно оценивают работу городской администрации.

 

При типическом наблюдении средняя ошибка выборки определяется по следующим формулам:

· при повторном отборе

;

;

· при бесповторном отборе

где:

– среднее значение внутригрупповых выборочных дисперсий;

– среднее значение внутригрупповых выборочных дисперсий доли.

Условием применения этих формул является пропорциональный отбор единиц в типические группы, основанный на выполнении условия

,

где:

ni, Ni – число единиц в i-ой выборочной и i-ой генеральной типических группах.

Пример 8.3. С целью выявления удельного веса простоев из-за несвоевременного поступления на предприятие комплектующих изделий было проведено одномоментное выборочное наблюдение рабочих трёх цехов на основе 20%-го случайного бесповторного отбора. Результаты наблюдения представлены в таблице 8.4.

Таблица 8.4

№ цеха Объём выборки, чел. Удельный вес простоев
0,15
0,10
0,08
Итого

 

Определим с вероятностью 0,997 пределы, в которых находится удельный вес простоев рабочих из-за несвоевременного поступления комплектующих на предприятие в целом.

Решение.

Имеет место типический бесповторный отбор рабочих (номер цеха – это типологический признак рабочего).

Пределы удельного веса простоев

.

Общий удельный вес простоев

.

Предельная ошибка удельного веса простоев

.

Среднее значение внутригрупповых дисперсий удельного веса простоев

≈ 0,098.

При доверительной вероятности Р = 0,997 табличное значение коэффициента доверия t = 3.

Доля опрошенных рабочих в каждом цехе и, следовательно, на всем предприятии составила 20%, поэтому

.

Тогда

;

0,027; 0,185.

Таким образом, с вероятностью 0,997 можно утверждать, что удельный вес простоев рабочих из-за несвоевременного поступления комплектующих на предприятие в целом находится в пределах от 0,027 до 0,185.

Пример 8.4. В таблице 8.5 представлены результаты выборочного 10%-го механического наблюдения предприятий отрасли, сгруппированных по форме собственности и величине фондовооруженности. Определим с вероятностью 0,954 пределы, в которых находится среднее значение фондовооруженности предприятий отрасли.

Таблица 8.5

Форма собственности предприятия Фондовооруженность, тыс. руб./чел. Итого
500 – 1000 1000 – 1500 1500 – 2000
Хозяйственные товарищества
Производственные кооперативы
Государственные (муниципальные) унитарные предприятия
Итого

Решение.

Имеет место типический механический отбор (отбираемые предприятия предварительно сгруппированы в типические группы по форме собственности).

Пределы средней фондовооруженности

.

Выборочная средняя фондовооруженность

тыс. руб./чел.


Предельная ошибка средней фондовооруженности

.

Среднее значение внутригрупповых дисперсий фондовооруженности

,

где , – число предприятий и дисперсия их фондовооруженности в рамках j-ой группы.

Внутригрупповые дисперсии фондовооруженности

.

Внутригрупповые средние значения фондовооружённости:

;

тыс. руб./чел.;

тыс. руб./чел.;

≈ 1393 тыс. руб./чел.

Тогда:

;

;

≈ 157765;

≈ 151204.

При доверительной вероятности P = 0,954 табличное значение коэффициента доверия: t = 2.

Доля предприятий отрасли, попавших в выборку, составляет 10%, поэтому

.

Тогда:

≈ 62 тыс. руб./чел.;

= 1313; 1437 тыс. руб./чел.

Таким образом, с вероятностью 0,954 можно утверждать, что среднее значение фондовооруженности предприятий отрасли находится в пределах от 1313 до 1437 тыс. руб./чел.

 

При серийном наблюдении для расчета средней ошибки выборки используют следующие формулы:

· при повторном отборе

;

;

· при бесповторном отборе

;

,

где:

– межсерийная выборочная дисперсия;

– межсерийная выборочная дисперсия доли;

r – число отобранных серий;

R – число серий в генеральной совокупности.

Пример 8.5. С целью проверки качества радиоэлектронной продукции из двадцати равновеликих партий микросхем случайным бесповторным образом отобрали пять партий. В каждой из них подвергли проверке все микросхемы. В результате проверки доля бракованных микросхем в отдельных партиях составила 5; 6; 4; 2 и 3 % соответственно. Определим с вероятностью 0,997, в каких пределах находится доля бракованных микросхем во всех двадцати партиях.

Решение.

Имеет место серийный бесповторный отбор.

Границы генеральной доли бракованных микросхем

.

Общая выборочная доля бракованных микросхем

.

Предельная ошибка выборочной доли бракованных микросхем

.

Поскольку доверительная вероятность P = 0,997, то t = 3.

Межсерийная дисперсия доли бракованных микросхем

.

Тогда

;

0,024; 0,056.

Таким образом, с вероятностью 0,997 можно утверждать, что доля бракованных микросхем в целом во всех партиях находится в пределах от 2,4 до 5,6 %.

Пример 8.6. Для оценки качества работы конвейерной машины по расфасовке сахарного песка подвергли сплошному наблюдению упаковки сахарного песка в трёх контейнерах одинакового объёма. Эти контейнеры были отобраны механическим образом из девяти имеющихся в наличии. В результате наблюдения была определена средняя масса одной упаковки сахарного песка в каждом контейнере. Её величина составила соответственно 995; 1050, 1010 грамм. Определим с вероятностью 0,954 пределы, в которых находится средняя масса упаковки сахарного песка во всех девяти контейнерах.

Решение.

Границы средней массы одной упаковки

.

Общая выборочная средняя масса одной упаковки

г.

Предельная ошибка средней массы одной упаковки

.

При доверительной вероятности P = 0,954 коэффициент доверия t = 2.

Межсерийная дисперсия средней массы одной упаковки

.


Тогда:

г;

= 985; 1051 г.

Таким образом, с вероятностью 0,954 можно утверждать, что средняя масса одной упаковки сахарного песка во всех имеющихся в наличии контейнерах находится в пределах от 985 до 1051 г.

 

Определение необходимого объёма выборки

Перед проведением выборочного наблюдения необходимо определить объём будущей выборочной совокупности. Выбор объёма осуществляют, задаваясь точностью результатов наблюдения (предельной ошибкой выборки) и их достоверностью (доверительной вероятностью или коэффициентом доверия).

В таблице 8.6 представлены формулы расчёта необходимого объёма выборки при различных способах наблюдения. Применение этих формул требует знания выборочных дисперсий – общей, внутригрупповых или межсерийной. Их значения можно взять из результатов аналогичного наблюдения, проведённого ранее. Если такой возможности нет, то необходимо провести предварительное выборочное наблюдение небольшого объёма и по его результатам рассчитать выборочные дисперсии.

Пример 8.7. Планируется проведение собственно-случайного повторного наблюдения проб угля месторождения с целью определения его средней зольности (в %). При наблюдении аналогичного месторождения среднеквадратичное отклонение зольности угля составило 3%. Определим необходимое число проб угля для определения средней зольности всего месторождения наблюдения с точностью ±0,5% и доверительной вероятностью 0,954.

Таблица 8.6

Способ наблюдения Исследуемый показатель Метод наблюдения
повторный бесповторный
Собственно-случайный Среднее значение
Доля
Механический Среднее значение
Доля
Типический Среднее значение
Доля
Серийный Среднее значение
Доля

 

Решение.

Необходимый объем выборки

.

При доверительной вероятности P = 0,954 коэффициент доверия t = 2.

Тогда

пробы.

Таким образом, чтобы определить среднюю зольность угля всего месторождения с точностью ± 3% и гарантировать этот результат с вероятностью 0,954, необходимо подвергнуть собственно-случайному повторному наблюдению 144 пробы угля.

Пример 8.8. Необходимо провести серийное бесповторное наблюдение партии говяжьей тушёнки с целью определения средней массы одной банки. Партия состоит из 100 упаковок. При проверке предыдущей аналогичной партии было обследовано пять упаковок тушенки. При этом в каждой упаковке средняя масса банки составила соответственно 320; 323; 327 и 330 г. Определим, сколько упаковок надо обследовать в текущей партии, чтобы получить результат с точностью ± 3 г и доверительной вероятностью 0,683.

Решение.

Необходимый объём выборки

.

При доверительной вероятности P = 0,683 коэффициент доверия t = 1.

Межсерийная дисперсия средней массы банки тушенки по данным предыдущего наблюдения

.

Общая средняя масса банки тушенки по данным предыдущего наблюдения

г.

Тогда:

.

упаковки.

Таким образом, чтобы определить среднюю массу банки говяжьей тушёнки во всей партии с точностью ± 3 г и гарантировать этот результат с вероятностью 0,683, необходимо подвергнуть сплошному наблюдению банки из двух упаковок, отобрав эти упаковки механически или случайно-бесповторно.

Пример 8.9. В отчетном году планируется провести выборочное повторное наблюдение сотрудников государственной противопожарной службы рядового и младшего начальствующего состава, проходящих службу на территории Санкт-Петербурга и Ленинградской области, с целью определения доли сотрудников, удовлетворённых условиями своей службы. По результатам аналогичного опроса в предшествующем году были получены следующие значения доли сотрудников, удовлетворённых условиями своей службы: рядовой состав – 45%; младший начальствующий состав – 55%. При этом число опрошенных каждой категории сотрудников было одинаковым. Определим, сколько требуется опросить сотрудников, чтобы точность результатов наблюдения составила ± 5 % с доверительной вероятностью 0,954.

Решение.

Имеет место типическое повторное наблюдение.

Необходимый объём наблюдения

.

При доверительной вероятности P = 0,954 коэффициент доверия t = 2.

Среднее значение внутригрупповой дисперсии доли по данным прошлого наблюдения

= 0,2475.

Тогда

чел.


Таким образом, опросив 396 человек из числа сотрудников государственной противопожарной службы (198 человек рядового состава и 198 человек младшего начальствующего состава) и рассчитав на основе результатов опроса общую долю сотрудников, удовлетворённых условиями своей службы, можно гарантировать точность значения этого показателя на уровне ± 5 % с доверительной вероятностью 0,954.


Лекция 6 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

 



Дата добавления: 2022-07-20; просмотров: 199;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.046 сек.