Доверительная вероятность, доверительные интервалы
Средняя выборочная, выборочные дисперсия и среднее квадратическое отклонение являются оценками параметров генеральной совокупности, выражающимися одним числом. Такие оценки называются точечными. Они зависят от объема выборки и могут сильно отличаться от истинной величины оцениваемого параметра, т.е. приводят в некоторых случаях к грубым ошибкам. Это вызывает необходимость оценивать точность и надежность полученных по выборке точечных оценок, что производится при помощи интервальных оценок. Оценкой математического ожидания а (или, что то же самое - генеральная средняя) какого-либо количественного признака Х генеральной совокупности служит выборочная средняя . Очевидно, что тем точнее, чем меньше величина отклонения . Иначе говоря, если выбрать положительное число ε>0, и записать неравенство , то тем точнее будет оценивать а, чем меньше ε.
В таком случае ε можно считать точностью оценки. В силу случайности вариант, попадающих в выборку, говорить о выполнении неравенства , можно, лишь с некоторой вероятностью γ, которая называется надежностью или доверительной вероятностью оценки, т.е. Р( )=γ.
Эту запись следует понимать так: вероятность того, что заключает в себе (покрывает) неизвестное математическое ожидание а равна γ, а сам интервал называется доверительным интервалом.
Если заранее известна величина ε, то границы доверительного интервала для оценки математического ожидания имеют вид: , где - выборочная средняя, п - объем выборки, σ- известное среднее квадратическое отклонение генеральной совокупности, t - величина, определяемая по таблице для функции Лапласа: из соотношения с заранее выбранной доверительной вероятностью γ.
Пример 8.1.Выборочное обследование бюджета 36 семей выявило средний доход в месяц на одну семью в 3000 рублей. Найти доверительный интервал для оценки математического ожидания а - среднемесячного дохода всех 10 тысяч исследуемых семей, если известно, что он распределен по нормальному закону со средним квадратическим отклонением σ=250 руб. Величина доверительной вероятности γ, принять равной 0,9.
Решение: Найдем значение аргумента t функции Лапласа из соотношения:
и по таблице значений функции Лапласа находим t=1,645. Тогда точность оценки равна . Таким образом, значения неизвестного параметра а согласующееся с данным выборки, удовлетворяет неравенству 179,15 < а <192,85.
Доверительная вероятность связана не с величиной параметра а, а лишь с границами интервала, которые изменяются при изменении выборки. Надежность γ=0,9 указывает на то, что если произведено достаточно большое число выборок, то 90% из них определяет такие же интервалы, в которых параметр а действительно заключен и лишь в 10% случаев он может выйти за границы доверительного интервала.
Если среднее квадратическое отклонение исследуемого признака заранее неизвестно, то используется его выборочная оценка σв - эмпирическое отклонение, определяемое по данным выборки. В этом случае доверительный интервал а для имеет вид:
, где - выборочное среднее, n- объем выборки, σв - выборочное среднее квадратическое отклонение. Величина tγ определяется по таблице распределения Стьюдента для заданных объема и доверительной вероятности tγ=t(γ;n).
Пример 8.2.Найти доверительный интервал для оценки с надёжностью 0,95 неизвестного математического ожидания a нормально распределенного признака Х генеральной совокупности, если выборочное среднее квадратическое σв =1,4, выборочное среднее =10,6 и объём выборки n=25.
Решение: Найдем величину tγ. По таблице распределения Стьюдента для n=16и γ= 0,95 находим доверительные границы.
Нижняя граница: .
Верхняя граница: .
Итак, с надежностью 0,95 неизвестный параметр а заключен в интервале 9,86 < а <11,34. Наряду с доверительной вероятностью используется понятие уровня значимости, обозначаемое обычно через α. Связь между этими величинами задается соотношением γ+α=1.
Наряду со средним квадратическим отклонением в качестве характеристики рассеяния вариант выборки около среднего выборочного, иногда используется среднее абсолютное отклонение Δ, определяемое формулой:
Пример 8.3.По данным статистического распределения выборки найти выборочное среднее, квадратическое отклонение σв и среднее абсолютное отклонение Δ.
Xi | ||||
ni |
Решение:
В экономическом анализе важной характеристикой выборки является коэффициент вариации v, определяемый по формуле: .
Коэффициент вариации служит для сравнения величин рассеяния двух вариационных рядов. Тот из радов, у которого коэффициент вариации больше, имеет большее рассеяние.
Дата добавления: 2020-10-25; просмотров: 482;