Способы получения измерительной информации 3 глава
кривой распределения. Следовательно, рассмотренное выше условиенормирования означает, что вероятность попадания величины х в интервал[− ∞; + ∞] равна единице, т.е. представляет собой достоверное событие. Вероятность этого события называется функцией распределенияслучайной величины и обозначается F (x ) . Функцию распределения F (x )иногда называют также интегральной функцией распределения. Втерминах интегральной функции распределения имеем P{x1 ≤ x ≤ x2 } = F ( x1 ) − F ( x2 ) ,т.е. вероятность попадания результата наблюдений или случайнойпогрешности в заданный интервал равна разности значений функциираспределения на границах этого интервала. Рис.4.3. Интегральная (а) и дифференциальная (б) функции распределения случайной величины Интегральной функцией распределения F (x ) называют функцию, каждоезначение которой для каждого х является вероятностью события,заключающегося в том, что случайная величина x i в i -м опыте принимаетзначение, меньшее х. График интегральной функции распределенияпоказан на рис. 4.3, а. Она имеет следующие свойства: − неотрицательная, т.е. F ( x) ≥ 0 ; − неубывающая, т.е. f ( x 2 ) ≥ F ( x1 ) , если x2 ≥ x1 ; − диапазон ее изменения: от 0 до 1, т.е. F (−∞) = 0; F (+∞) = 1 ; − вероятность нахождения случайной величины х в диапазоне от x1 до x 2 : P{x1 < x < x 2 } = F ( x 2 ) − F ( x1 ) . Запишем функцию распределения через плотность: x F ( x ) = ∫ f ( x ) dx . −∞ Площадь, ограниченная кривой распределения, лежащая левее точки x (х– текущая переменная) (рис. 4.4), отнесенная к общей площади, есть не чтоиное, как интегральная функция распределения F ( x ) = P{xi < x}. Рис. 4.4. Кривая плотности распределения вероятностей(дифференциальная функция распределения случайной величины) Плотность распределения вероятностей f (x ) называютдифференциальной функцией распределения: d F (x ) f (x ) = . dx Пример распределения дискретной случайной величины приведен нарис. 4.5. Рис. 4.5. Распределение дискретной случайной величины 4.2. Числовые параметры законов распределения. Центрраспределения. Моменты распределений Функция распределения является самым универсальным способом описания поведения результатов измерений и случайных погрешностей.Однако для их определения необходимо проведение весьма длительных и кропотливых исследований и вычислений. В большинстве случаев бывает достаточно харак-теризовать случайные величины специальными параметрами, основными из которых являются: − центр распределения; − начальные и центральные моменты и производные от них коэффициенты - математическое ожидание (МО), среднее квадратическое отклонение (СКО), эксцесс, контрэксцесс и коэффициент асимметрии. Координата центра распределения X ц определяет положение случайнойвеличины на числовой оси и может быть найдена несколькими способами. Наиболее фундаментальным является определение центра по принципусимметрии вероятностей, т.е. нахождение такой точки XM на оси х, слеваи справа от которой вероятности появления различных значенийслучайных погрешностей равны между собой и составляют P = P2 = 0,5 : 1 XM +∞ F(X M ) = ∫ f ( x)dx = ∫ f ( x)dx = 0,5 . −∞ XM Точка X M называется медианой, или 50%-ным квантилем. Для егонахождения у распределения случайной величины должен существоватьтолько нулевой начальный момент. Координата Хц может быть определена и как центр тяжести распре-деления, т.е. как математическое ожидание случайной величины. Этотакая точка X , относительно которой опрокидывающий моментгеометрической фигуры, огибающей которой является кривая f ( x ) , равеннулю: +∞ X = m1 = ∫ x f ( x)dx . −∞У некоторых распределений, например, у распределения Коши, несуществует МО, так как определяющий его интеграл расходится. При симметричной кривой плотности распределения вероятностей f ( x )оценкой центра распределения может служить абсцисса моды распреде-ления, т.е. координата максимума плотности распределения X m . Однакоесть распределения, у которых не существует моды, например,равномерное. Распределения с одним максимумом называютсяодномодальными, с двумя – двухмодальные. Те распределения, у которых в средней части расположен не максимум, а минимум, называютсяантимодальными. Для двухмодальных распределений применяется оценка центра в видецентра сгибов: xc1 + xc 2 Xc = , 2где xc1 , xc 2 – сгибы, т.е. абсциссы точек, в которых распределениедостигает максимумов. Для ограниченных распределений применяется оценка в виде центраразмаха: x1 + x 2 Xp = , 2где x1 , x 2 – первый и последний члены вариационного ряда,соответствующего распределению. При выборе оценки центра распределения необходимо учитывать еечувствительность к наличию промахов в обрабатываемой совокупностиданных. Исключительно чувствительны к наличию промахов: оценка ввиде центра размаха X p (определяется по наблюдениям, наиболееудаленным от центра, каковыми и являются промахи); оценка в видесреднего арифметического (ослабляется лишь в n раз). Защищенными отвлияния промахов являются квантильные оценки: медиана X M и центрсгибов X c , поскольку они не зависят от координат промахов. При статистической обработке данных важно использовать наиболееэффективные, т.е. имеющие минимальную дисперсию, оценки центрараспределения, так как погрешность в определении X ц влечет за собойнеправильную оценку СКО, границ доверительного интервала, эксцесса ит.д. Все моменты представляют собой некоторые средние значения, причем,если усредняются величины, отсчитываемые от начала координат,моменты называются начальными, а если от центра распределения – тоцентральными. Начальные моменты k-го порядка определяются формулами +∞ mk = ∫ x k f ( x ) dx ; −∞ n mk = ∑ xik pi , i =1где pi – вероятность появления дискретной величины. Здесь и ниже первая формула относится к непрерывным, а вторая кдискретным случайным величинам. Из начальных моментов наибольший интерес представляет матема-тическое ожидание МО случайной величины (k = 1): +∞ m1 = ∫ x f ( x ) dx ; −∞ (4.1) n m1 = ∑ xi pi . i =1 Центральные моменты k-го порядка рассчитываются по формулам +∞ μ k = ∫ ( x − m1 ) f ( x ) dx ; k −∞ n μ k = ∑ ( xi − m1 ) pi . k i =1 Из центральных моментов особенно важную роль играет второй момент(k=2), дисперсия случайной величины D +∞ D = ∫ ( x − m1 ) f ( x ) dx ; 2 −∞ (4.2) n D = ∑ ( xi − m1 ) pi . 2 i =1 Дисперсия случайной величины характеризует рассеяние отдельных еезначений. Дисперсия имеет размерность квадрата случайной величины ивыражает как бы мощность рассеяния относительно постояннойсоставляющей. Однако чаще пользуются положительным корнемквадратным из дисперсии – средним квадратическим отклонением (СКО)σ = D , которое имеет размерность самой случайной величины. Третий центральный момент +∞ μ 3 = ∫ ( x − m1 ) f ( x ) dx ; 3 −∞ n μ 3 = ∑ ( xi − m1 ) pi 3 i =1служит характеристикой асимметрии, или скошенности распределения. Сего использованием вводится коэффициент асимметрии υ = μ 3 σ3 . Длянормального распределения коэффициент асимметрии равен нулю. Видзаконов распределения при различных значениях коэффициентаасимметрии приведен на рис. 4.6, а. Четвертый центральный момент +∞ μ 4 = ∫ ( x − m1 ) f ( x ) dx ; 4 −∞ n μ 4 = ∑ ( xi − m1 ) pi 4 i =1служит для характеристики плосковершинности или островершинностираспределения. Эти свойства описываются с помощью эксцесса ε = μ 4 σ 4 . Его значения лежат в диапазоне от 1 до ∞ . Для нормальногораспределения ε = 3 . Вид дифференциальной функции распределения приразличных значениях эксцесса показан на рис. 4.6, б. Рис. 4.6. Вид дифференциальной функции распределения при различных значениях коэффициента асимметрии (а) и эксцесса (б) Дадим более строгое определение постоянной систематической ислучайной погрешностей. Систематической постоянной погрешностью называется отклонениематематического ожидания результатов наблюдений от истинногозначения измеряемой величины: Θ = m1 − Q ,а случайной погрешностью – разность между результатом единичногонаблюдения и математическим ожиданием результатов: Δx = xi − m1 . В этих обозначениях истинное значение измеряемой величинысоставляет Q = xi − Θ − Δx . 4.3. Оценка результата измерения Задача состоит в том, чтобы по полученным экспериментальным путемрезультатам наблюдений, содержащим случайные погрешности, найтиоценку истинного значения измеряемой величины – результат измерения.Будем полагать, что систематические погрешности в результатахнаблюдений отсутствуют или исключены. На практике все результаты измерений и случайные погрешностиявляются величинами дискретными, т.е. величинами xi , возможныезначения которых отделимы друг от друга и поддаются счету. Прииспользовании дискретных случайных величин возникает задачанахождения точечных оценок параметров, их функций распределения наосновании выборок – ряда значений xi , принимаемых случайнойвеличиной x в n независимых опытах. Используемая выборка должнабыть репрезентативной (представительной), т.е. должна достаточнохорошо представлять пропорции генеральной совокупности. Оценка параметра называется точечной, если она выражается однимчислом. Задача нахождения точечных оценок – частный случайстатистической задачи нахождения оценок параметров функциираспределения случайной величины на основании выборки. К оценкам, получаемым по статистическим данным, предъявляютсятребования состоятельности, несмещенности и эффективности. Оценканазывается состоятельной, если при увеличении числа наблюдений онастремится к истинному значению оцениваемой величины. Оценка называется несмещенной, если ее математическое ожиданиеравно истинному значению оцениваемой величины. В том случае, когдаможно найти несколько несмещенных оценок, лучшей из них считается та,которая имеет наименьшую дисперсию. Чем меньше дисперсия оценки,тем более эффективной считают эту оценку. Точечной оценкой математического ожидания МО результатаизмерений является среднее арифметическое значение измеряемойвеличины 1 n X = ∑ xi . (4.3) n i =1 При любом законе распределения оно является состоятельной инесмещенной оценкой, а также наиболее эффективной по критериюнаименьших квадратов. Точечная оценка дисперсии, определяемая по формуле ~ D [x ] = ( 1 n ) 2 ∑ xi − X , n − 1 i =1 (4.4)является несмещенной и состоятельной. Оценка среднего квадратического отклонения СКО ~ ~ σ = S x = D [x ] = ( 1 n ) 2 ∑ xi − X . n − 1 i =1 (4.5) Полученные оценки МО и СКО являются случайными величинами. Этопроявляется в том, что при повторении несколько раз серий из nнаблюдений каждый раз будут получаться различные оценки X и σ . ~Рассеяние этих оценок целесообразно оценивать СКО S x . Оценка СКОсреднего арифметического значения Sx 1 ( ) n 2 Sx = = ∑ xi − X . (4.6) n n (n − 1) i =1 Полученные оценки позволяют записать итог измерений в виде Q = X ± Sx .Интервал, определяемый правой частью этого равенства, с некоторойвероятностью «накрывает» истинное значение Q измеряемой величины.Однако точечные оценки ничего не говорят о значении этой вероятности. Рассмотренные точечные оценки параметров распределения даютоценку в виде числа, наиболее близкого к значению неизвестногопараметра. Такие оценки используют только при большом числеизмерений. Чем меньше объем выборки, тем легче допустить ошибку привыборе параметра. Способы нахождения оценок результата зависят от вида функциираспределения и от имеющихся соглашений по этому вопросу, регла-ментируемых в рамках законодательной метрологии. Распределения погрешностей результатов наблюдений, как правило,являются симметричными относительно центра распределения, поэтомуистинное значение измеряемой величины может быть определено каккоордината центра рассеивания X ц , т.е. центра симметрии распределенияслучайной погрешности (при условии, что систематическая погрешностьисключена). Отсюда следует принятое в метрологии правило оцениванияслучайной погрешности в виде интервала, симметричного относительнорезультата измерения (X ц ± Δx ) . В практике измерений встречаются различные формы кривыхраспределения случайных величин, целесообразно классифицировать ихследующим образом [27]: − трапецеидальные, например, равномерное, треугольное (Симпсона); − экспоненциальные, например, распределение Лапласа, распределение Гаусса (нормальное); − семейство распределений Стьюдента (предельное распределение семейства законов Стьюдента – распределение Коши); − двухмодальные, например, дискретное двузначное распределение, арксинусоидальное распределение, остро- и кругло-вершинные двухмодальные распределения. Однако чаще всего имеют дело с нормальным и равномернымраспределением плотности вероятностей. Учитывая многовариантность подходов к выбору оценок и в целяхобеспечения единства измерений, правила обработки результатов на-блюдений обычно регламентируются нормативно-техническими доку-ментами (стандартами, методическими указаниями, инструкциями). Так, встандарте на методы обработки результатов прямых измерений с мно-гократными наблюдениями указывается, что приведенные в нем методыобработки установлены для результатов наблюдений, принадлежащихнормальному распределению [31]. 4.4. Характеристики нормального распределения Нормальное распределение плотности вероятности или распределениеГаусса (рис. 4.7) характеризуется тем, что, согласно центральной пре-дельной теореме теории вероятностей, такое распределение имеет суммабесконечно большого числа бесконечно малых случайных возмущений слюбыми распределениями. Рис. 4.7. Кривые нормального распределения Применительно к измерениям это означает, что нормальное распределениеслучайных погрешностей возникает тогда, когда на результат измерениядействует множество случайных возмущений, ни одно из которых неявляется преобладающим. Практически, суммарное воздействие дажесравнительно небольшого числа возмущений приводит к законураспределения результатов и погрешностей измерений, близкому кнормальному. В аналитической форме нормальный закон распределения выражаетсяформулой 1 ⎡ ( x − mx )2 ⎤ f (x ) = exp ⎢− ⎥, (4.7) σ 2π ⎣ 2σ 2 ⎦ где х – случайная величина; mx – математическое ожидание случайнойвеличины; σ – среднее квадратическое отклонение (СКО); е=2,71828 –основание натурального логарифма; π = 3,14159 . Перенеся начало координат в центр распределения mx , и откладывая пооси абсцисс погрешность Δx = x − mx , получим кривую нормальногораспределения погрешностей 1 ⎡ Δx 2 ⎤ f (Δx ) = exp ⎢− 2 ⎥ . (4.8) σ 2π ⎣ 2σ ⎦ Для группы из n наблюдений, распределённых по нормальному закону 1 n mx = ∑ xi ; (4.9) n i =1 n ∑ ( xi − mx ) 2 i =1 σ= . (4.10) n −1 Обсудим несколько свойств нормального распределения погрешностей. Кривая нормального распределения погрешностей симметрична отно-сительно оси ординат. Это означает, что погрешности, одинаковые повеличине, но противоположные по знаку, имеют одинаковую плотность ве-роятностей, т.е. при большом числе наблюдений встречаются одинаковочасто. Математическое ожидание случайной погрешности равно нулю. Из характера кривой следует, что при нормальном законе распределениямалые погрешности будут встречаться чаще, чем большие. Так,вероятность появления погрешностей, укладывающихся в интервал от 0 доΔx1 (рис. 4.7) , характеризуемая площадью S1 , будет значительно больше,чем вероятность появления погрешностей в интервале от Δx2 до Δx3 (пло-щадь S2). На рис. 4.8 изображены кривые нормального распределения с раз-личными средними квадратическими отклонениями, причем σ1 > σ 2 > σ3 . Рис. 4.8. Рассеяние результатов наблюдений
Сравнивая кривые между собой можно убедиться, что чем меньше СКО,тем меньше рассеяние результатов наблюдений и тем больше вероятностьтого, что большинство случайных погрешностей в них будет мало.Естественно заключить, что качество измерений тем выше, чем меньшеСКО случайных погрешностей. Если в формуле (4.3) вместо случайной величины ввести такназываемую нормированную случайную величину x − mx t= , (4.11) σто она также будет распределена по нормальному закону с центромраспределения mx , абсцисса которого mx = 0, а σ = 1 . Поэтому формулу(4.7), определяющую плотность вероятности, а также формулу функциираспределения величины t можно записать так: t2 1 − f (t ) = ⋅e 2 ; 2π 2 (4.12) t −t 1 F (t ) = ∫ dt. e 2 2 π −∞ Определенный интеграл с переменным верхним пределом, имеющийвид t2 1 t −2 Ф(t ) = ∫ e dt (4.13) 2π 0и определяющий значение площади под кривой плотности вероятности,называют функцией Лапласа. Для нее справедливы следующие равенства: Ф(− ∞ ) = −0,5 ; Ф(0 ) = 0 ; Ф(+ ∞ ) = 0,5 ; Ф(t ) = −Ф(t ) . Функция распределения F (t ) связана с функцией Лапласа формулой F (t ) = 0,5 + Ф(t ) . (4.14) Эта формула позволяет при наличии таблицы значений Ф(t ) ,соответствующих различным значениям t , рассчитать F (t ) . Таблицыплотности вероятностей f (t ) и функции Ф(t ) нормированной случайнойвеличины, распределенной по нормальному закону, дают возможностьнайти плотность вероятности f ( x ) и значения функции распределенияF ( x ) любой случайной величины, распределенной по нормальному закону,если известны значения ее центра распределения mx и параметра σ . Если случайная величина х принимает значения лишь в пределах не-которого конечного интервала от x1 , до x2 с постоянной плотностьювероятностей (рис. 4.9), то такое распределение называется равномерным и описывается соотношениями ⎧ f ( x ) = c, при x1 ≤ x ≤ x2 ; ⎨ (4.15) ⎩ f ( x ) = 0 , при x < x1 и x > x2 . Рис. 4.9. Равномерное распределение случайной величины 4.5. Оценка случайных погрешностей. Доверительная вероятность и доверительный интервал Для количественной оценки случайных погрешностей и установленияграниц случайной погрешности результата измерения могутиспользоваться: предельная погрешность, интервальная оценка, числовыехарактеристики закона распределения. Выбор конкретной оценкиопределяется необходимой полнотой сведений о погрешности,назначением измерений и характером использования их результатов.Комплексы оценок показателей точности установлены стандартами. Предельная погрешность Δ m – погрешность, больше которой в данномизмерительном эксперименте не может появиться. Теоретически, такаяоценка погрешности правомерна только для распределений, границыкоторых четко выражены и существует такое значение ± Δ m , котороеограничивает возможные значения случайных погрешностей с обеихсторон от центра распределения (например, равномерное). На практике такая оценка есть указание наибольшей погрешности,которая может встретиться при многократных измерениях одной и той жевеличины. Недостатком такой оценки является то, что она не содержитинформации о характере закона распределения случайных погрешностей.При арифметическом суммировании предельных погрешностейполучаемая сумма может значительно превышать действительныепогрешности. Более универсальными и информативными являются квантильныеоценки. Площадь, заключенная под всей кривой плотности распределенияпогрешностей, отражает вероятность всех возможных значений погрешности и по условиям нормирования равна единице. Эту площадьможно разделить вертикальными линиями на части. Абсциссы такихлиний называются квантилями. Так, на рис. 4.10 Δx1 , есть 25%-наяквантиль, так как площадь под кривой f (Δx ) слева от нее составляет 25%всей площади. Абсцисса Δx2 соответствует 75%-ной квантили. Между Δx1 ,и Δx2 заключено 50% всех возможных значений погрешности, а остальныележат вне этого интервала. Рис. 4.10. Квантильные оценки случайной величины Квантильная оценка погрешности представляется интервалом от− Δx(P ) до + Δx(P ) , на котором с заданной вероятностью Ρ встречаютсяΡ⋅100% всех возможных значений случайной погрешности. Интервал сграницами ± Δx(P ) называется доверительным интервалом случайнойпогрешности, между границами которого с заданной доверительнойвероятностью P{xН < x < xВ } = 1 − q ,где q – уровень значимости; xН , xВ – нижняя и верхняя границыинтервала, находится истинное значение оцениваемого параметра. Принято границы доверительного интервала (доверительные границы)указывать симметричными относительно результата измерения. В метрологической практике используют главным образом квантильныеоценки доверительного интервала. Под Р-процентным квантилем xPпонимают абсциссу такой вертикальной линии, слева от которой площадьпод кривой плотности распределения равна Р %. Иначе говоря, квантиль –это значение случайной величины (погрешности) с заданнойдоверительной вероятностью Р. Так как квантили, ограничивающие доверительный интервал по-грешности могут быть выбраны различными, то при оцениваниислучайной погрешности доверительными границами необходимо одно- временно указывать значение принятой доверительной вероятности(например, ±0,3 В при Ρ = 0,95). Доверительные границы случайной погрешности Δx(P ) , соответст-вующие доверительной вероятности Р, находят по формуле Δx(P ) = t σ , (4.16)где t – коэффициент, зависящий от Ρ и формы закона распределения. Рис. 4.11. К понятию доверительных интервалов На графике нормального распределения погрешностей (рис. 4.11) по осиабсцисс отложены интервалы с границами ±σ, ±2σ, ±3σ, ±4σ.Доверительные вероятности для этих интервалов приведены в табл. 4.2. Таблица 4.2. Границы доверительных интервалов и соответствующие им доверительные вероятности tσ Р ±1σ 0,68 ± 2σ 0,95 ± 3σ 0,997 ± 4σ 0,999 Как видно из этой таблицы, оценка случайной погрешности группынаблюдений интервалом ±1σ соответствует доверительной вероятности0,68. Такая оценка не дает уверенности в высоком качестве измерений, по-скольку 32% от всего числа наблюдений может выйти за пределы указан-ного интервала, что совершенно неприемлемо при однократных измере-ниях и дезинформирует потребителя измерительной информации. Довери-тельному интервалу ±3σ соответствует Ρ = 0,997. Это означает, что прак-тически с вероятностью очень близкой к единице ни одно из возможныхзначений погрешности при нормальном законе ее распределения не выйдетза границы интервала. Поэтому, при нормальном распределении по-грешностей, принято считать случайную погрешность с границами ±3σ предельной (максимально возможной) погрешностью. Погрешности, вы-ходящие за эти границы, классифицируют как грубые или промахи. В целях единообразия в оценивании случайных погрешностей ин-тервальными оценками при технических измерениях доверительнаявероятность принимается равной 0,95. Лишь для особо точных и от-ветственных измерений (важных, например, для безопасности и здоровьялюдей) допускается применять более высокую доверительнуювероятность. Итак, для получения интервальной оценки многократных наблюденийнормально распределенной случайной величины необходимо: − определить точечные оценки МО и СКО S x случайной величины по формулам (4.3) и (4.6) соответственно; − выбрать доверительную вероятность Р из рекомендуемого ряда значений 0,90; 0,95; 0,99; − найти верхнюю xВ и нижнюю xH границы в соответствии с уравнениями F ( xH ) = q 2 = 1 − P 2 и F ( xВ ) = 1 − q 2 = 1 + P 2 . Значения xН и xВ определяются из таблиц значений интегральнойфункции распределения F (t ) или функции Лапласа Ф(t ) . Полученный доверительный интервал удовлетворяет условию Р ⎨ X − z р x ≤ x ≤ X + z р x ⎬ = 2 Ф(z р ) , ⎧ S S ⎫ (4.17) ⎩ n n⎭где n – число измеренных значений; z р – аргумент функции Лапласа Ф(t ) ,отвечающей вероятности P 2 . В данном случае z р называетсяквантильным множителем. Половина длины доверительного интервала SΔx(P ) = z р называется доверительной границей погрешности nрезультата измерений. При отличии закона распределения случайной величины от нормальногонеобходимо построить его математическую модель ММ и определятьдоверительный интервал с ее использованием. Рассмотренный способ нахождения доверительных интерваловсправедлив для достаточно большого числа наблюдений n , когда σ = S x .Следует помнить, что вычисляемая оценка СКО S x является лишьнекоторым приближением к истинному значению σ . Определениедоверительного интервала при заданной вероятности оказывается темменее надежным, чем меньше число наблюдений. Расчет доверительных интервалов для случая, когда распределениерезультатов наблюдений нормально, но их дисперсия неизвестна, т.е. прималом числе наблюдений n , можно выполнить с использованием распределения Стьюдента S (t , k ) . Оно описывает плотность распределенияотношения (дроби Стьюдента): X − mx X − Q X −Q t= = = n , Sx Sx Sxгде Q – истинное значение измеряемой величины. Величины вычисляютсяна основании опытных данных и представляют собой точечные оценкиМО, СКО результатов измерений и СКО среднего арифметическогозначения. Вероятность того, что дробь Стьюдента в результате выполненных [наблюдений примет некоторое значение в интервале − t р ; + t р , ] ⎧ X −Q ⎫ ⎧ t р Sx ⎫ Р ⎨− t р ≤ ≤ +t р ⎬ = Р ⎨ X − Q ≤ ⎬= ⎩ Sx ⎭ ⎩ n ⎭ +t р +t р (4.18) = ∫ S (t , k ) dt = 2 ∫ S (t , k ) dt , −t р −t р где k – число степеней свободы, равное (n − 1) . Величины t р (называемыекоэффициентами Стьюдента), рассчитанные с помощью двух последнихформул для различных значений доверительной вероятности и числаизмерений, табулированы. Следовательно, с помощью распределенияСтьюдента можно найти вероятность того, что отклонение среднегоарифметического от истинного значения измеряемой величины не Sпревышает Δx(P ) = ε = ±t р S x = ±t р x , ε – половина длины nдоверительного интервала, или доверительная граница погрешностиизмерений. В тех случаях, когда распределение случайных погрешностей неявляется нормальным, все же часто пользуются распределениемСтьюдента с приближением, степень которого остается неизвестной.Распределение Стьюдента применяют при числе измерений n < 30 ,поскольку уже при n = 20 , K, 30 оно переходит в нормальное и вместоуравнения (4.18) можно использовать уравнение (4.17). Результатизмерения записывается в виде: S Q = X ± t x ; P = PД , nгде PД – конкретное значение доверительной вероятности. Множитель tпри большом числе измерений n равен квантильному множителю z р . Прималом n он равен коэффициенту Стьюдента. Полученный результат измерения не является одним конкретнымчислом, а представляет собой интервал, внутри которого с некоторой вероятностью PД находится истинное значение измеряемой величины.Выделение середины интервала X вовсе не предполагает, что истинноезначение находится ближе к нему, чем к остальным точкам интервала. Ономожет находится в любом месте интервала, а с вероятностью 1 − PД дажевне его. Недостатком оценивания случайной погрешности доверительныминтервалом при произвольно выбираемых доверительных вероятностяхявляется невозможность суммирования нескольких погрешностей, так какдоверительный интервал суммы не равен сумме доверительных ин-тервалов. В то же время необходимость в суммировании случайных по-грешностей существует, когда нужно оценить погрешность суммирова-нием ее составляющих, подчиняющихся к тому же разным законам рас-пределения. В теории вероятностей показано, что суммирование статистическинезависимых случайных величин осуществляется путем суммирования ихдисперсий n D∑ = ∑ Di , i =1 n σ ∑ = ∑ σ i2 . (4.19) i =1 Таким образом, для того чтобы отдельные составляющие случайнойпогрешности можно было суммировать расчетным путем, они должныбыть представлены своими СКО, а не предельными или доверительнымиграницами. Формула (4.19) правомерна только для некоррелированных случайныхвеличин. В том случае, когда суммируемые составляющие погрешностикоррелированны, расчетные соотношения усложняются, так как требуетсяучет корреляционных связей. Методы выявления корреляционных связей иих учет являются предметом изучения в теории вероятностей [2, 4, 7, 12]. Рассмотренные свойства распределений следует понимать как«идеальные», полученные на основе бесконечно большого числаопытов. В реальных условиях результат измерения получают либопутем обработки ограниченной группы наблюдений, либо на основеоднократного измерения. Правила обработки данных для полученияоценок результата и погрешности статистических измерений определеныстандартами Государственной системы обеспечения единстваизмерений. 4.6. Грубые погрешности и методы их исключения Грубая погрешность, или промах, – это погрешность результатаотдельного измерения, входящего в ряд измерений, которая для данных условий резко отличается от остальных результатов этого ряда.Источником грубых погрешностей нередко бывают ошибки, допущенныеоператором во время измерений. К ним можно отнести: − неправильный отсчет по шкале измерительного прибора, происходящий из-за неверного учета цены малых делений шкалы; − неправильная запись результата наблюдений, значений отдельных мер использованного набора, например гирь. Грубые погрешности, как правило, возникают при однократныхизмерениях и обычно устраняются путем повторных измерений. Ихпричинами могут быть внезапные и кратковременные изменения условийизмерения или оставшиеся незамеченными неисправности в аппаратуре. Корректная статистическая обработка выборки возможна только при ееоднородности, т.е. в том случае, когда все ее члены принадлежат к одной итой же генеральной совокупности. В противном случае обработка данныхбессмысленна. «Чужие» отсчеты по своим значениям могут существенноне отличаться от «своих» отсчетов. Их можно обнаружить только по видугистограмм или дифференциальных законов распределения. Наличиетаких аномальных отсчетов принято называть загрязнениями выборки,однако выделить члены выборки, принадлежащие каждой из генеральныхсовокупностей, практически невозможно. Если «свои» и «чужие» отсчеты различаются по значениям, то ихисключают из выборки. Особую неприятность доставляют отсчеты,которые хотя и не входят в компактную группу основной массы отсчетоввыборки, но и не удалены от нее на значительное расстояние, – такназываемые предполагаемые промахи. Отбрасывание «слишком» уда-ленных от центра выборки отсчетов называется цензурированием выборки.Это осуществляется с помощью специальных критериев. При однократных измерениях обнаружить промах не представляетсявозможным. Для уменьшения вероятности появления промахов измеренияпроводят два-три раза и за результат принимают среднее арифметическоеполученных отсчетов. При многократных измерениях для обнаруженияпромахов используют статистические критерии, предварительноопределив, какому виду распределения соответствует результатизмерений. Вопрос о том, содержит ли результат наблюдений грубую погрешность,решается общими методами проверки статистических гипотезПроверяемая гипотеза состоит в утверждении, что результат наблюдения х,не содержит грубой погрешности, т.е. является одним из значенийизмеряемой величины. Пользуясь определенными статистическимикритериями, пытаются опровергнуть выдвинутую гипотезу. Если этоудается, то результат наблюдений рассматривают как содержащий грубуюпогрешность и его исключают. Для выявления грубых погрешностей задаются вероятностью q —уровнем значимости того, что сомнительный результат действительно могиметь место в данной совокупности результатов измерений. Критерий «трех сигм» применяется для результатов измерений,распределенных по нормальному закону. По этому критерию считается,что результат, возникающий с вероятностью q < 0,003, мало вероятен и егоможно считать промахом, если X − xi > 3 S x , где S x – оценка СКОизмерений. Величины X и S x вычисляют без учета экстремальныхзначений xi . Данный критерий надежен при числе измерений n ≥ 20...50. Это правило обычно считается слишком жестким, поэтомурекомендуется назначать границу цензурирования в зависимости отобъема выборки: при 6 < n ≤ 1000 она равна 4 Sx ; при100 < n ≤ 1000 − 4,5 S x ; при 1000 < n ≤ 10000 − 5 S x . Данное правило такжеиспользуется только при нормальном распределении.Критерий Романовского применяется в случае, если число измерений xi − Xn<20. При этом вычисляется отношение = υ и сравнивается с Sxкритерием υ P , выбранным по таблице при заданном уровне значимости(см. Приложение 3). Если υ ≥ υ P , то результат xi считается промахом иотбрасывается. Вариационный критерий Диксона – удобный и достаточно мощный (смалыми вероятностями ошибок). При его применении полученныерезультаты наблюдений записывают в вариационный возрастающий рядx1 , x2 , K, xn ( x1 < x2 < K < xn ) . Критерий Диксона определяется как K Д = ( xn − xn −1 ) ( xn − x1 ) . Критическая область для этого критерия P (K Д > Z q ) = q . Значения Z qприведены в таблице 4.3 [27]. Таблица 4.3 Значения критерия Диксона Z q при q n 0,10 0,05 0,02 0,01 4 0,68 0,76 0,85 0,89 6 0,48 0,56 0,64 0,70 8 0,40 0,47 0,54 0,59 10 0,35 0,41 0,48 0,53 14 0,29 0,35 0,41 0,45 16 0,28 0,33 0,39 0,43 18 0,26 0,31 0,37 0,41 20 0,26 0,30 0,36 0,39 30 0,22 0,26 0,31 0,34 Применение рассмотренных критериев требует осмотрительности иучета объективных условий измерений. Конечно, оператор долженисключить результат наблюдения с явной грубой погрешностью ивыполнить новое измерение. Но он не имеет права отбрасывать более илименее резко отличающиеся от других результаты наблюдений. Всомнительных случаях лучше сделать дополнительные измерения (невзамен сомнительных, а кроме них) и затем привлекать на помощьрассмотренные выше статистические критерии. Кроме рассмотренныхкритериев существуют и другие, например критерии Граббса и Шовенэ [6,18, 27, 29]. 4.7. Обработка результатов прямых многократных измерений Прямые многократные измерения делятся на равноточные инеравноточные. Теоретические основы и методика объединениярезультатов неравноточных измерений подробно рассмотрены в [1, 10, 14,15]. Равноточными называются измерения, которые проводятсясредствами измерений одинаковой точности по одной и той же методикепри неизменных внешних условиях. При равноточных измерениях СКОрезультатов всех рядов измерений равны между собой. Задача обработки результатов многократных измерений заключается внахождении оценки измеряемой величины и доверительного интервала, вкотором находится ее истинное значение. Обработка должна проводитьсяв соответствии с ГОСТ 8.207–76 «ГСИ. Прямые измерения смногократными наблюдениями. Методы обработки результатовнаблюдений. Общие положения». Исходной информацией для обработки является ряд из n (n > 4 )результатов измерений x1 , x2 , K , xn , из которых исключены известныесистематические погрешности, – выборка. Число n зависит как от требо-ваний к точности получаемого результата, так и от реальной возможностивыполнять повторные измерения. Последовательность обработки результатов прямых многократныхизмерений состоит из ряда этапов. 1. Определение точечных оценок закона распределения результатовизмерений. На этом этапе определяются: − среднее арифметическое значение X измеряемой величины по формуле (4.3); − оценка СКО результата измерения Sx по формуле (4.5);
Дата добавления: 2021-01-26; просмотров: 336;