Оценка параметров законов распределения в геоэкологических исследованиях


Имеется случайная величина X, закон распределения которой содержит неизвестный параметр a. Требуется на основании опытных данных найти подходящую оценку этого параметра.

Представим себе, что в нашем распоряжении имеется ряд наблюдений бесконечной продолжительности x1, х2, . .., xN (N→∞). Этот ряд наблюдений может рассматриваться как генеральная совокупность значений исследуемого процесса X. Разобьем генеральную совокупность на l частных выборок (l→∞) объемом в п (n<<N) членов каждая. Пронумеруем значения X в соответствии с поряд­ковым номером выборки j и порядковым номером значений X в данной выборке —i.

По материалам наблюдений, представленным в первой выборке x11, х12,..., x1п, рассчитано значение параметра а. Это значение называется ста­тистической или выборочной (вычислено по выборке) оценкой параметра а.Обозначим эту оценку через , где j – номер выборки. Есте­ственно, что значение является функцией входящих в первую выборку значений, т. е. = f(x11, х12, . .., x1п). Аналогично является функцией значений, входящих в J – ую выборку, то есть = f(xj1, хj2, . .., xjп) и т.д.

Значения случайнойвеличины, очевидно, могут быть разными в разныхвыборках, и появление именно их в данной выборке совершенно случайно. Отсюда следует, что , являющееся функцией входящих в выборку значений xji , также явля­ется значением случайной величины, имеющей, как и каждая случайная величина, свой закон распределения Fa. Этот закон рас­пределения разный для различных параметров распределения и, при прочих равных условиях, зависит также от закона распределения случайной величины X и от объема выборки.

Таким образом, по каждой из l выборок может быть получена своя оценка данного конкретного параметра а. Представим эти оценки в виде кривой распределения эмпирических значений или оценок а (рис. 5.1).

 

 

Рис.5.1. Кривые распределения оценок статистического параметра.

1 – n=N; 2 – n2<n1; 3 – n3<n2; 4 – n4<n3


Будем теперь увеличивать объем выборок п. В этом случае кривая распределения будет сужаться по оси абсцисс, т. е. рассеивание выборочных оценок относительно действитель­ного значения будет в соответствии с законом больших чисел [ 13 ] уменьшаться, и при n→∞, с вероятностью p → 1, должно быть равно а, т. е. кривая распределения должна превра­титься в линию, проходящую через ось абсцисс в точке =a, равную по оси ординат 1.

Из приведенных графиков распределения оценок а при различных n видно, что при малых значениях n выборочные оценки а могут весьма существенно отличаться от действительных. Очевидно, что, чем меньше, при прочих равных условиях, отличие выборочных оценок от действительных и чем меньше вероятность больших отличий, тем лучше оценка.

Точно так же ряды данных наблюдений, используемые в науках о Земле, являются выборками из генеральной совокупности и рассчитанные по ним значения числовых характеристик (оценки), как правило, отличаются от действительных.

Принятые оценки параметров распределения, по-видимому, должны наилучшим образом отражать их действительные значе­ния. При этом, исходя из приведенных выше рассуждений, каждая оценка параметра является функцией выборки и ее следует считать наблюденным значением некоторой случайной величины. Следовательно, о качестве оценки параметра распределения с помощью данной статистики необходимо судить не по индивидуальным значениям этой статистики, а по ее выборочному распределению.

Исходя из этого, рассмотрим основные требования к выборочным оценкам.

Для того, чтобы какая-то статистическая оценка (x1, х2, ..., xп) имела наибольшую практическую ценность, она должна удовлетворять следующим требованиям.

1. Быть несмещенной.

Несмещенными называются оценки, математическое ожидание которых равно оцениваемому параметру, т. е.

 

(5.1)

 

Это означает, что центр распределения оценок числовой харак­теристики по множеству выборок (см. рис. 5.1) должен совпадать с действительным значением этой характеристики.

Естественно, что в качестве приближения неизвестного пара­метра лучше брать несмещенные оценки, чтобы не делать систе­матических погрешностей в сторону завышения или занижения.

Бывают случаи, когда возникает необходимость использовать смещенные оценки. Тогда, если оценка называется по­ложительно смещенной, а если — отрицательно сме­щенной.

2. Оценка должна быть состоятельной.│

Оценка называется состоятельной, если она сходится по ве­роятности к оцениваемому параметру при неограниченном возра­стании числа опытов, т. е.

(5.2)

где ξ— сколь угодно малое положительное число.

Для выполнения этого требования достаточно, чтобы дисперсия оценки при увеличении п стремилась к нулю, т. е.

 

(5.3)

 

и, кроме того, чтобы оценка была несмещенной.

Требование состоятельности практически означает, что с увеличением объема выборок рассеивание оценок относительно ма­тематического ожидания (см. рис. 5.1), совпадающего с действительным значением числовой характеристики, должно уменьшаться и при достаточно большом п отклонение от а с р→ 1 должно быть меньше любого наперед заданного значения.

Желательно, чтобы этому требованию удовлетворяла всякая оценка, пригодная для практического использования.

3. Оценка числовой характеристики распределения должна быть эффективной.

Оценки, обладающие свойством несмещенности и состоятельности, при ограниченном числе опытов могут иметь разные дисперсии. Очевидно, что, чем меньше дисперсия оценки, т. е. чем меньше разброс относительно действительного значения (см. рис. 5.1), тем меньше вероятность грубой погрешности при определении приближенного значения параметра.

Оценка, обладающая свойством

(5.4)

называется эффективной.

В практических приложениях теории вероятностей в для описания случайной величины X обычно применяются сле­дующие числовые характеристики: математическое ожидание тх, мода М, медиана Me, дисперсия Dx, среднее квадратическое отклонение σх, коэффициент вариации Cv , коэффициент асимметрии Csх и реже эксцесс Ех (см. гл. 3).

Эти характеристики тх, Dx, σх, Cvx, Csх разработаны на основе понятий начальных и центральных моментов распределения (см. гл. 3). Поэтому естественно, что одним из методов статистических оценок этих параметров является метод моментов. Однако этот истори­чески более ранний, часто называемый классическим, метод не полностью соответствует представленным выше требованиям к наилучшей оценке.

С середины 50-х годов в гидрологии получил широкое распро­странение графоаналитический метод (метод квантилей), предложенный Г. А. Алексеевым.

В последнее время в практику расчетов все больше входит метод наибольшего правдоподобия, разработанный Фишером.

 


МЕТОД МОМЕНТОВ

Наибольшее распространение для вычисления оценок параметров распределения получил метод моментов. До недавнего времени другие методы оценок вообще не использовались в расчетах. Формулы расчета числовых характеристик ме­тодом моментов представлены в главе 3 [см. формулы (3.36) —(3.40)].

Удовлетворяют ли оценки на основе этих формул приведенным выше требованиям. Оказывается не всегда. Так, оценки по формулам (3.37-3.40) являются смещенными и в ряде случаев неэффективными. Рассмотрим этот вопрос подробнее.

 



Дата добавления: 2020-10-25; просмотров: 171;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.01 сек.