Оценка параметров генеральной совокупности по ее выборке


Основные понятия математической статистики

В главе 2 были рассмотрены некоторые понятия и закономерности, которым подчинены массовые случайные явления. Одной из практических задач, связанных с этим, является создание методов отбора данных (статистические данные) из большой сово­купности и их обработки. Такие вопросы рассматриваются в математической статистике.

Математическая статистика — наука о математических методах систематизации и использования статистиче­ских данных для решения научных и практических задач.

Ма­тематическая статистика тесно примыкает к теории вероятностей и базируется на ее понятиях. Однако главным в математической статистике является не распределение случайных величин, а ана­лиз статистических данных и выяснение, какому распределению они соответствуют.

Предположим, что необходимо изучить множество объектов по какому-либо признаку. Это возможно сделать, либо проведя сплош­ное наблюдение (исследование, измерение), либо не сплошное, выбо­рочное.

Выборочное, т. е. неполное, обследование может оказаться предпочтительнее по следующим причинам. Во-первых, естест­венно, что обследование части менее трудоемко, чем обследование целого; следовательно, одна из причин — экономическая. Во-вто­рых, может оказаться и так, что сплошное обследование просто нереально. Для того чтобы его провести, возможно, нужно унич­тожить всю исследуемую технику или загубить все исследуемые биологические объекты. Так, например, врач, имплантирующий электроды в улитку для кохлеарного протезирования (см. § 6.5), должен иметь вероятностные представления о расположении улитки слухового аппарата. Казалось бы, наиболее достоверно та­кие сведения можно было получить при сплошном патологоанатомическом вскрытии всех умерших с производством соответствую­щих замеров. Однако достаточно собрать нужные сведения при выборочных измерениях.

Большая статистическая совокупность, из которой отбирается часть объектов для исследования, называется генеральной сово­купностью, а множество объектов, отобранных из нее, — выбо­рочной совокупностью, или выборкой.

Свойство объектов выборки должно соответствовать свойству объектов генеральной совокупности, или, как принято говорить, выборка должна быть представительной (репрезентативной). Так, например, если целью является изучение состояния здо­ровья населения большого города, то нельзя воспользоваться вы­боркой населения, проживающего в одном из районов города. Ус­ловия проживания в разных районах могут отличаться (различ­ная влажность, наличие предприятий, жилищных строений и т. п.) и, таким образом, влиять на состояние здоровья. Поэтому выбор­ка должна представлять случайно отобранные объекты.

Если записать в последовательности измерений все значения величины х в выборке, то получим простой статистический ряд. Например, рост мужчин (см): 170, 169, ... . Та­кой ряд неудобен для анализа, так как в нем нет последователь­ности возрастания (или убывания) значений, встречаются и по­вторяющиеся величины. Поэтому целесообразно ранжировать ряд, например, в возрастающем порядке значений и указать их повторяемость. Тогда статистическое распределение выборки:171, 172, 172, 168,

 

(3.1)

 

Здесь xi — наблюдаемые значения признака (варианта); ni — число наблюдений варианты xi (частота); рi* — относительная частота.


Общее число объектов в выборке (объем выборки)

всего k вариант. Статистическое распределение — это совокуп­ность вариант и соответствующих им частот (или относительных частот), т. е. это совокупность данных 1-й и 2-й строки или 1-й и 3-й строки в (3.1).

В медицинской литературе статистическое распределение, со­стоящее из вариант и соответствующих им частот, получило на­звание вариационного ряда.

Наряду с дискретным (точечным) статистическим распределе­нием, которое было описано, используют непрерывное (интер­вальное) статистическое распределение:

 

 

(3.2)

 

Здесь xi-1, xi - i-йинтервал, в котором заключено количественное значение признака; ni — сумма частот вариант, попавших в этот интервал; р*i — сумма относительных частот.

В качестве примера дискретного статистического распределения укажем массы новорожденных мальчиков (кг) и частоты (табл. 5).

Таблица 5

 
 

 


 

Общее количество мальчиков (объем выборки)

 

(3.3)

Можно это распределение представить и как непрерывное (интер­вальное) (табл. 6).

Таблица 6

 

2,65 — 2,75 2,75 — 2,85 2,85 — 2,95 2,95 — 3,05 3,05 — 3,15
 

Для наглядности статистические распределения изображают графически в виде полигона и гистограммы.



Полигон частот — ломаная линия, отрезки которой соединяют точки с координатами 1, п1 , (х2; п2), ... или для полигона относительных частот — с координатами 1; р1* ), (х2; р2 *), ... (рис. 3.1). Рис. 3.1 относится к распределению, представленному в табл. 5.

Гистограмма частот — совокупность смежных прямоуголь­ников, построенных на одной прямой линии (рис. 3.2), основания прямоугольников одинаковы и равны а, а высоты равны отноше­нию частоты (или относительной частоты) к а:

 

(3.4)

 

Таким образом, площадь каждого прямоугольника равна соответ­ственно


Следовательно, площадь гистограммы частот , а площадь гистограммы относительных частот

Наиболее распространенными характеристиками статистическо­го распределения являются средние величины: мода, медиана и средняя арифметическая, или выборочная средняя.

Мода (Мо) равна варианте, которой соответствует наиболь­шая частота. В распределении массы новорожденных (см. табл. 5) Мо = 3,3 кг.

Медиана (Me) равна варианте, которая расположена в середи­не статистического распределения. Она делит статистический (ва­риационный) ряд на две равные части. При четном числе вариант за медиану принимают среднее значение из двух центральных ва­риант. В рассмотренном распределении (см. табл. 5) Me = 3,4 кг.

Выборочная средняя в) определяется как среднее арифмети­ческое значение вариант статистического ряда:

(3.5)

(3.6)

Для примера (см. табл. 5)

 

Для характеристики рассеяния вариант вокруг своего среднего значения вводят характеристику, называемую выборочной дисперсией, — среднее арифметическое квадратов отклонения ва­риант от их среднего значения:

 

(3.7)

 

Квадратный корень из выборочной дисперсии называют выбороч­ным средним квадратическим отклонением:

 

(3.8)


Для примера (см. табл. 5)

Оценка параметров генеральной совокупности по ее выборке

Предположим, что генеральная совокупность является нор­мальным распределением (здесь вместо вероятности следует ис­пользовать относительную частоту). Нормальное распределение полностью определено математическим ожиданием (средним зна­чением) и средним квадратическим отклонением. Поэтому если по выборке можно оценить, т. е. приближенно найти, эти парамет­ры, то будет решена одна из задач математической статистики — определение параметров большого массива по исследованию его части.

Как и для выборки, для генеральной совокупности можно оп­ределить генеральную среднюю — среднее арифметическое значение всех величин, составляющих эту совокупность. Учиты­вая большой объем этой совокупности, можно полагать, что гене­ральная средняя равна математическому ожиданию:

(3.10)

где X — общая запись случайной величины (значения изучаемого признака) генеральной совокупности.

Рассеяние значений изучаемого признака генеральной сово­купности от их генеральной средней оценивают генеральной дис­персией

(3.11)

где N — объем генеральной совокупности, или генеральным сред­ним квадратическим отклонением

 

(3.12)

 

 

Точечная оценка. Предположим, что из генеральной совокуп­ности производятся разные выборки; делают это так, чтобы вся генеральная совокупность сохранялась неизменной. Для опреде­ленности будем считать объемы этих выборок одинаковыми и рав­ными п. Их выборочные средние являются случай­ными величинами, которые распределены по нормальному зако­ну (см. конец § 2.3), а их математическое ожидание равно математическому ожиданию генеральной совокупности, т. е. генеоалъной средней:

(3.13)

На практике иногда при достаточно большой выборке за генераль­ную среднюю приближенно принимают выборочную среднюю.

Для дисперсий положение получается несколько иным. Мате­матическое ожидание дисперсий различных выборок [M(DBi)], со­ставленных из генеральной совокупности, отличается от гене­ральной дисперсии:

(3.14)

При большом п получаем и

Dг » M(DBi) (3.14а)

 

 

Для генерального среднего квадратического отклонения соответ­ственно из (3.14) и (3.14а) получаем:

(3.15)

На практике иногда при достаточно большой выборке выбороч­ное среднее квадратическое отклонение приближенно принимают за генеральное среднее квадратическое отклонение. Так, если счи­тать, что статистическое распределение (см. табл. 5) является вы­боркой из некоторой генеральной совокупности, то на основании (3.6) и (3.9) можно заключить, что для этой генеральной совокуп­ности »3,468 кг и sг »0,3896 кг.

Такого рода оценка параметров генеральной совокупности или каких-либо измерений определенными числами называется то­чечной оценкой.

Интервальная оценка генеральной средней. Точечная оцен­ка, особенно при малой выборке, может значительно отличаться от истинных параметров генеральной совокупности. Поэтому при не­большом объеме выборки пользуются интервальными, оценками.

В этом случае указывается интервал (доверительный интер­вал, или доверительные границы), в котором с определенной (до­верительной) вероятностью р находится генеральная средняя.

Иначе говоря, р определяет вероятность, с которой осуществ­ляются следующие неравенства:

(3.16)

 

где положительное число e характеризует точность оценки.

Кроме доверительной вероятности используют «противопо­ложное» понятие — уровень значимости

b = 1 – р, (3.17)

который выражает вероятность непопадания генеральной сред­ней в доверительный интервал.

Доверительную вероятность не следует выбирать слишком ма­ленькой (не следует ее обесценивать). Наиболее часто р прини­мают равной 0,95; 0,99; 0,999. Чем больше р, тем шире интервал, т. е. тем больше e. Чтобы установить количественную связь между этими величинами, необходимо найти выражение для довери­тельной вероятности. Это можно сделать, используя (2.17), одна­ко нужно понять, что при этом следует взять за функцию распределения вероятностей и какие принять пределы ин­тегрирования. Рассмотрим этот вопрос.

Итак, генеральная совокупность распределена по нормальному закону с математическим ожиданием (средним значением) и дисперсией Dг. Если из этой генеральной совокупности брать раз­ные выборки с одинаковым объемом п, то можно для каждой вы­борки получить среднее значение . Эти средние значения сами являются случайными величинами. Их распределение, т. е. рас­пределение средних значений разных выборок, полученных из одной генеральной совокупности, будет нормальным со средним значением, равным среднему значению генеральной совокупности , дисперсией и средним квадратическим отклонением (см. конец § 2.2).

Таким образом, уже выступает как случайная величина, для нее можно записать следующую функцию распределения вероят­ностей [см. (2.22)]:

 

(3.18)

Из (3.16) можно записать для следующие неравенства:

 

(3.19)

Вероятность того, что попадает в этот интервал (доверитель­ную вероятность), можно найти по общей формуле (2.17), используя функцию (3.18). Пределы интегрирования необходимо взять из выражения (3.19):

 

(3.20)

 


(3.21)

Результаты интегрирования (3.20) найдем, используя функ­цию Ф (см. § 2.3). По формуле (2.25) получим

 

 

Обозначая

(3.22)

 

и учитывая, что Ф(-t) = 1 - Ф(t), получим из (3.21):

р = Ф(t) - Ф(-t) = Ф(t) - 1 + Ф(t) = (t) - 1.

Для нахождения р по t или t по р можно воспользоваться табл. 7 или таблицей функции Ф (см. [2]).

Таблица 7

 

т
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,4
0,9
1,4
1,9

 

Хотя неравенства (3.16) и (3.19) по существу идентичны, но для практических целей важнее запись (3.16), так как она позво­ляет решить главную задачу — при заданной доверительной веро­ятности и найденной выборочной средней найти доверительный интервал, в который попадает генеральная средняя.

Запишем неравенство (3.16), подставив в него выражение из формулы (3.22):

Практически при нахождении доверительного интервала по формуле (3.24) берут выборочную среднюю некоторой конкретной выборки (объем п ³ 30), а вместо генеральной средней квадратично» используют выборочную среднюю квадратичную этой же выборки.

Поясним это некоторым примером. Вновь обратимся к данным табл. 5, считая их выборкой. Найдем доверительный интервал для генеральной средней, из которой эта выборка получена, счи­тая доверительную вероятность равной р = 0,95. Из (3.23) для такой доверительной вероятности получаем: Ф(t) = 0,975 имеем t = 1,9 + 0,06 = 1,96. Подставляя это значение t, выборочную среднюю (3.6), выборочное среднее квадратическое отклонение (3.9) и объем вы­борки (п = 100) в выражение (3.24), имеем:

 

 

или

Интервальная оценка генеральной средней при малой вы­борке.

При достаточно большом объеме выборки можно сделать вполне надежные заключения о генеральной средней. Однако на практике часто имеют дело с выборками небольшого объема (п < 30). В этом случае в выражении доверительного интервала (3.16) точ­ность оценки определяется по следующей формуле:

(3.26)

где t — параметр, называемый коэффициентом Стьюдента (его на­ходят из распределения Стьюдента; оно здесь не рассматривает­ся), который зависит не только от доверительной вероятности р, но и от объема выборки п. Коэффициент Стьюдента можно найти из табл. 8.

Запишем неравенство (3.16), подставив в него выражение из формулы (3.26):

(3.27)

 

Таблица 8

Объем Доверительная вероятность, р
выборки, п 0,9 0,95 0,99 0,999
2 6,31 12,70 63,66 -
2,92 4,30 9,93 31,60
1,83 2,26 3,25 4,78
1,76 2,15 2,95 4,07

 

Таблица 9

Масса, кг 3,0 3,1 3,2 3,3 3,4 3,5 3,7 3,8 4,0 4,4
Частота

Отсюда можно вычислить Db = 0,19156 кг2 и sв = = 0,43767 кг. Задав доверительную вероятность р = 0,95, находим из табл. 8 для объема выборки п = 10 параметр t = 2,26. Подставляя эти данные в (3.26), получаем для доверительного интервала [см. (3.27)]:

или (3.28)

Полезно сопоставить соотношения, полученные для большой (3.25) и малой (3.28) выборок.

Интервальная оценка истинного значения измеряемой ве­личины.Интервальная оценка генеральной средней может быть ис­пользована для оценки истинного значения измеряемой величины.

Пусть несколько раз измеряют одну и ту же физическую вели­чину. При этом по разным случайным причинам, вообще говоря, получают разные значения: x1, x2, x3, ... . Будем считать, что нет преобладающего влияния какого-либо фактора на эти измерения.

Истинное значение измеряемой величины (хист) совершенно точ­но измерить невозможно хотя бы по причине несовершенства изме­рительных приборов. Однако можно дать интервальную оценку для этого значения.

Если значения х1, х2, х3, ... рассматривать как варианты выбор­ки, а истинное значение измеряемой величины хист как аналог ге­неральной средней, то можно по описанным выше правилам найти доверительный интервал, в который с доверительной вероятно­стью р попадает истинное значение измеряемой величины. Приме­нительно к малому числу измерений (п < 30) из (3.27) получим:

(3.29)

где — среднее арифметическое значение из полученных измере­ний, а s — оответствующее им среднее квадратическое отклоне­ние, t —коэффициент Стьюдента.

Более подробно и разносторонне оценка результатов измере­ний рассматривается в практикуме (см. [1]).

Проверка гипотез

В медико-биологических исследованиях актуальной является задача сравнения выборок, полученных в результате эксперимен­та, заключающегося в том или ином воздействии на объект. Фак­тически конечный результат исследования зависит от достовер­ности различий значений случайной величины в контроле (до воз­действия или без него) и опыте (после воздействия). Наиболее просто решается задача определения достоверности различий ста­тистических распределений, если предварительно для выборок рассчитаны доверительные интервалы. Положим, есть два статис­тических распределения некоторых случайных величин X и Y. Пусть генеральные средние этих распределений с доверительной вероятностью р = 0,95 находятся в доверительных интервалах и пусть при этом Если соблюдается неравенство , то не вызывает сомнения, что случайная величина Y существенно больше случайной величины X (см. рис. 3.3, а). Вероятность этого превышает 0,95.

На рис. 3.3, б представлен вариант, когда выборки частично пе­ресекаются, т. е. когда выполняется неравенство В этом случае целесообразно оценивать достоверность различий вы­борочных средних и с помощью дополнительных расчетов. Наиболее просто это сделать, предполагая, что случайные величи­ны X и Y распределены по нормальному закону. Условием сущест­венности различия двух опытных распределений, являющихся вы­борками из различных генеральных совокупностей, является вы­полнение следующего неравенства для опытного и теоретического значений критерия Стьюдента: Для нахождения значения toписпользуют следующую формулу:

(3.30)

 

 



Здесь sх и sу — выборочные средние квадратические отклоне­ния, пх и пу — число вариант в выборках (объемы выборок), и у — выборочные средние значения.

а) б)

 

Рис. 3.3

 

Теоретическое значение tтeop находят по таблице 10, входными величинами которой являются доверительная вероятность р и па­раметр f, связанный с числом вариант в выборках. Этот параметр определяют следующим образом. Если sх » sу, то f = пх + п — 2. Если же sх и sу различаются на порядок и более, то величина f оп­ределяется по формуле:

 

(3.31)

Таблица 10. Значения критерия Стьюдента tтeop при различной доверительной вероятности и значениях параметра f

 

f Доверительная вероятность, р f Доверительная вероятность, р
    0,95 0,99 0,999     0,95 0,99 0,999
12,71 63,60   2,08 2,83 3,82
4,30 9,93 31,60 2,07 2,82 3,79
3,18 5,84 12,94 2,07 2,81 3,77
2,78 4,60 8,61 2,06 2,80 3,75
2,57 4,03 6,86 2,06 2,79 3,73
2,45 3,71 5,96 2,06 2,78 3,71
2,37 3,50 5,41 2,05 2,77 3,69
2,31 3,36 5,04 2,05 2,76 3,67
2,26 3,25 4,78 2,04 2,76 3,66
2,23 3,17 4,59 2,04 2,75 3,65
2,20 3,11 4,44 2,02 2,70 3,55
2,18 3,06 4,32 2,01 2,68 3,50
2,16 3,01 4,22 2,00 2,66 3,46
2,15 2,98 4,14 1,99 2,64 3,42
2,13 2,95 4,07 1,98 2,63 3,39
2,12 2,92 4,02 1,98 2,62 3,37
2,11 2,90 3,97 1,97 2,60 3,34
2,10 2,88 3,92 1,96 2,59 3,31
2,09 2,86 3,88   1,96 2,58 3,29
2,09 2,85 3,85        

 

Используя этот способ оценки достоверности различия выбо­рочных средних значений двух выборок, следует придерживаться такой последовательности действий. Во-первых, по эксперимен­тальным данным нужно найти значения выборочных средних и средних квадратических отклонений для каждой выборки. За­тем, сравнив величины sх и sу, найти величину f. После этого сле­дует задать определенное значение доверительной вероятности и по таблице 10 найти tтeoр . Затем по формуле (3.30) рассчитать toп.

Если при сравнении теоретического и опытного критериев Стьюдента окажется, что toп > tтeoр, то различие между выборочными средними значениями случайных величин X и У можно считать существенным с заданной доверительной вероятностью. В проти­воположном случае различия несущественны.

Представленный выше способ оценки достоверности различий выборок по выборочным средним является довольно простым. Су­ществует большое число тестов и критериев для сравнения выбо­рок и составления заключения о достоверности их различий. Как правило, при этом рассматривают вероятность двух взаимоисклю­чающих гипотез. Одна из них, условно называемая «нулевой» ги­потезой, заключается в том, что наблюдаемые различия между вы­борками случайны (т. е. фактически различий нет). Альтернатив­ная гипотеза означает, что наблюдаемые различия статистически достоверны. При этом для оценки обоснованности вывода о досто­верности различий используют три основных доверительных уров­ня, при которых принимается или отвергается нулевая гипотеза. Первый уровень соответствует уровню значимости b0 < 0,05; для второго уровня b0 < 0,01. Наконец, третий доверительный уровень имеет b0 < 0,001. При соблюдении соответствующего условия ну­левая гипотеза считается отвергнутой. Чем выше доверительный уровень, тем более обоснованным он считается. Фактически значи­мость вывода соответствует вероятности р = 1 - b0. В медицинских и биологических исследованиях считают достаточным уже первый уровень, хотя наиболее ответственные выводы предпочтительнее делать с большей точностью. Одной из методик, позволяющих су­дить о достоверности различий статистических распределений, яв­ляется ранговый тест Уилкоксона. Под рангом (Ri)понимают но­мер, под которым стоят исходные данные в ранжированном ряду. Если в двух сравниваемых выборках данному номеру соответству­ют одинаковые варианты, то рангом этих вариант является сред­нее арифметическое двух рангов — данного и следующего за ним (см. пример). Покажем, как используется этот тест на примере сравнения двух равных по объему выборок.

*Измеряли массу 13 недоношенных новорожденных (в граммах) в двух районах А и Б большого промышленного центра, один из которых (Б) отличался крайне неблагоприятной экологической обстановкой. По­лучены два статистических распределения (А) и (Б):

А: 970 990 1080 1090 1110 1120 ИЗО 1170 1180 1180 1210 1230 1270

Б: 780 870 900 900 990 1000 1000 1020 1030 1050 1070 1070 1100

 

Следует решить вопрос о том, достоверны ли различия между этими статистическими распределениями.

Составим общий ранжированный ряд с указанием номеров соответст­вующих вариант (RА.Б) — рангов (строки А и Б соответствуют выборкам):

А: 970990 1080 1090 1110..

RА: 5 6,5 15 16 18

 

Б: 780 870 900 90,0 990 1000 1000 1020 1030 1050 1070 1070 1100
RБ : 1 2 3 4 6,5 8 9 10 11 12 13 14 17

Как видно, варианта 990 встречается в первой и второй выборках, по­этому для нее рангом является среднее арифметическое значение 6 и 7.

Далее в ряду остаются лишь варианты первой выборки, поэтому ряд не закончен. Нулевая гипотеза состоит в том, что различий между выбор­ками нет (они случайны и потому несущественны). Ранговый тест учиты­вает общее размещение вариант и размеры выборок, но не требует знания типа распределения. Основной вывод о верности нулевой гипотезы дела­ется на основании анализа минимальной суммы рангов (из двух сумм для сравниваемых выборок), т. е. критерием является величина (учитывая, что )- При этом пользуются специальными табли­цами. В частности, если число вариант в выборках одинаково (п1 = п2), то используется таблица 11.

Таблица 11, Критические значения величины Г (теста Уилкоксона) при п1 = n2 = n для разных значений уровня значимости

п 0,05 0,01 п 0,05 0,01 п 0,05 0,01

Примечание. Нулевая гипотеза отбрасывается при Т < Т0,05 или Т < Т0,01 .

В этой таблице указаны две входные величины: число вариант в вы­борках (п) и значение третьего и второго уровней значимости (b0 = 0,05 и 0,01). В нашем случае , что меньше табличного значе­ния для п = 13 и b0 < 0,01. Следовательно, на втором уровне значимости (р > 0,99) можно отвергнуть нулевую гипотезу. Таким образом, различия выборок достоверны с вероятностью, превышающей 0,99.



Дата добавления: 2017-01-16; просмотров: 9932;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.043 сек.