ЧТО ТАКОЕ МАТЕМАТИЧЕСКАЯ СТАТИСТИКА?
Первоначально слово статистика означало просто государственный подсчёт. (Слово «статистика» происходит от латинского слова status - государство.) С древнейших времен статистику использовали для того, чтобы информировать правителей стран о величине налога, который можно собрать с их подданных, или о числе солдат, на которое можно рассчитывать в военное время. В Китае учет населения проводился более четырех тысяч лет назад. Согласно Библии, Моисей также подсчитывал всех мужчин своего народа старше 20 лет.
Сейчас статистика – это математическая дисциплина, изучающая методы сбора и анализа данных, относящихся к наблюдениям над случайными массовыми явлениями. Главная цель статистики - получение осмысленных заключений из несогласованных (подверженных разбросу) данных. Реальные данные, исключая тривиальные ситуации, всегда являются несогласованными. Разброс между наблюдениями обусловлен самыми разными причинами. Это может быть ошибка при считывании показаний прибора, если указатель расположен между двумя делениями шкалы. Это могут быть флуктуации в атмосфере случае мерцания звезд, или шум при работе электронного оборудования. Можно еще привести пример объектов, которым присуща врожденная изменчивость измеряемой характеристики (например, рост десятилетних мальчиков).
Чаще всего ситуация слишком сложна, чтобы ее можно было изучить на основе полного описания, отражающего все детали. Поэтому обычно применяется некоторая математическая модель явления. Она должна воспроизводить существенные черты явления и исключать те, которые предполагаются несущественными.
Пусть, например, проводится эксперимент по определению смертельной дозы инсектицида. Действие различных доз инсектицида измеряется числом насекомых, погибших после применения соответствующей дозы. При очень низкой дозировке насекомые не погибают, при очень высокой погибают все. В то же время при промежуточных дозах процент погибших насекомых подвержен экспериментальному разбросу и зависит от многих факторов, в среднем возрастает с увеличением дозы. Необходимо:
а) подобрать правдоподобную параметрическую модель для описания кривой роста доли погибших насекомых в зависимости от дозировки;
6) оценить параметры этой кривой и проверить, что результирующая кривая действительно является приемлемой моделью;
в) получить значение дозировки, при которой погибает 50% насекомых (эта величина будет служить принятой мерой токсичности), вместе с оценкой ее надежности.
Оценка точности должна показать, являются ли различия в оценках параметров настолько значимыми, чтобы можно было говорить о различиях между действительными (неизвестными) их значениями.
Она необходима также для того, чтобы проверить, дает ли избранное семейство распределений приемлемую модель для наблюдаемых данных.
Таковы наиболее важные черты статистического вывода.
ПОНЯТИЕ ВЫБОРКИ.
Понятие выборки и способов её получения есть одно из центральных понятий математической статистики. Говорят, что каждая третья студентка Гарвардского университета выходит замуж за одного из своих преподавателей. На самом же деле в 1901 году в университете обучались только З девушки, одна из которых вышла замуж за своего профессора. Ясно, что в данном случае недостаточен объём выборки. Но не так просто сказать, какойобъём выборки достаточен.
Рассмотрим ещё пример. Пусть имеется партия из 10000 номинально идентичных изделий. Известно, что некоторые из этих изделий дефектны: их критические размеры лежат вне допустимых границ. Требуется оценить долю (скажем, В) дефектных изделий в партии на основе результатов точного измерения размеров, проведенного на выборке из 20 изделий, взятых из партии. Рассмотрим процедуру формирования выборки. Предположим, что она организована следующим образом: 20 изделий должны быть выбраны «случайно», т. е. таким образом, чтобы при каждом акте выбора все изделия в партии имели бы одинаковый шанс быть отобранными. Так как в нашем случае партия очень велика по сравнению с объемом выборки, доля дефектных изделий в ней после извлечения выборки не будет существенно отличаться от исходной, доли В.Такой выбор называется репрезентативным.
Однако, конкретизация представления о том, что такое случайный выбор, даже в теории вероятностей очень не просто, что можно проиллюстрировать известным парадоксом Бертрана.
Получение разных результатов кажется парадоксальным, так как было убеждение, что слова «случайный выбор» однозначно определяют искомую вероятность. Парадокс показывает, что возможны различные способы выбора случайным образом, причем каждый способ выглядит по-своему «естественным». Фактически это означает, что в зависимости от того, что именно мы понимаем под словами «Случайным образом (равномерно)», вероятности могут быть выбраны многими различными способами.
Наконец, выборка должна быть статистически устойчива.Пусть в серии из опытов случайное событие А осуществлялось раз. Тогда отношение называют относительной частотой событияА в этой серии испытаний. Если при условии независимости исходов отдельных опытов различные серии испытаний (по n испытаний каждая) дают весьма близкие значения относительной частоты, то говорят, что относительная частота события обнаруживает при больших n свойство стабильности или статистической устойчивости. Статистической вероятностью события А в данном испытании называется число Р(А), около которого группируются значения относительной частоты при больших n. . Кроме того, в статистике в статистическую устойчивость включается ещё и требование отсутствия статистических взаимосвязей между явлениями. Что это такое показывает знаменитый парадокс Джиффена. В конце XIX века английский статистик Джиффен установил, что при повышении цены на дешевый, но необходимый товар (например, хлеб) спрос на него увеличивается, а не уменьшается, хотя как будто бы является очевидным, что с повышением цены на товар спрос на него должен падать.
Только в 1915 г. Е. Е. Слуцкий дал объяснение этого парадокса. Повышение цены на товар должно повлечь за собой понижение покупательной способности, однако если товар насущно необходим (каковым и является хлеб), то спрос на него не может сократиться, как бы ни менялась цена в пределах бюджета покупателя. Поэтому спрос на хлеб не уменьшился, а уменьшились возможности покупки других более дорогостоящих продуктов (мясо, масло и т. д.). Значит, вместо этих продуктов приходится покупать более дешевый продукт, т. е. хлеб.
Дата добавления: 2016-07-27; просмотров: 2404;