ОБРАБОТКА РЕЗУЛЬТАТОВ ПРЯМЫХ МНОГОКРАТНЫХ ИЗМЕРЕНИЙ
Смысл задачи обработки многократных (статистических) измерений состоит в том, чтобы получить оценку действительного значения измеряемой величины и определить погрешность этой оценки [1].
Способ обработки результатов статистических измерений зависит от вида распределения. Наиболее хорошо отработаны методы обработки экспериментальных данных, если их распределение не противоречит нормальному закону. Однако для того, чтобы этими методами можно было воспользоваться, необходимо прежде доказать, что распределение опытных данных не противоречит нормальному закону. Главным фактором, затрудняющим идентификацию закона распределения, является всегда относительно малое количество экспериментальных данных. В этом случае следует максимально использовать априорную информацию о виде распределения погрешностей. Эта информация заключается в том, что кривая плотности распределения предполагается плавной и симметричной. Плавной кривая должна быть потому, что (в подавляющем большинстве случаев) сама измеряемая величина является непрерывной. Предположение о симметрии базируется на относительной малости размера погрешности. Его также можно считать справедливым, так как в большинстве случаев, представляющих практический интерес, величина относительной погрешности измерений находится в интервале значений от долей, до нескольких единиц процента. Для того чтобы использовать вероятностно-статистические методы при обработке результатов многократных измерений, систематические погрешности должны быть исключены (т. е. все результаты исправлены), либо должно быть заранее известно, что случайные погрешности много больше систематических. Промахи из совокупности опытных данных должны быть исключены экспериментатором.
Задача обработки прямых многократных измерений может формулироваться в двух вариантах:
1. Обработка результатов многократных измерений, когда заранее известно, что закон распределения опытных данных нормальный. Количество опытных данных в этом случае должно быть n ≥ 4. Обработка результатов в этом случае ведется по формулам ГОСТ 8.207-76 Переиздание. Апрель 2006 г. «Прямые измерения с многократными наблюдениями. Методы обработки результатов наблюдений. Основные положения» и результат представляется в виде формул по ПМГ 96-2009. «Государственная система обеспечения единства измерений. Результаты и характеристики качества измерений. Формы представления».
2. Обработка результатов многократных измерений, когда закон распределения заранее неизвестен. В этом случае вначале необходимо идентифицировать закон распределения опытных данных, чтобы затем применить соответствующие вероятностно-статистические методы обработки данных. Для уверенной идентификации закона распределения количество опытных данных n должно удовлетворять условию 50 (хотя эта граница достаточно условна).
Для того чтобы достаточно обоснованно выдвинуть гипотезу о виде закона распределения, экспериментальные данные группируют и выборку представляют в виде гистограммы, состоящей из r столбцов с определенной протяженностью (h) соответствующих им интервалов. По виду полученной гистограммы и формулируется гипотеза о законе распределения опытных данных, которую затем подтверждают с использованием соответствующего критерия согласия (либо отвергают и выдвигают новую, которую также необходимио затем подтвердить). При построении гистограммы следует соблюдать некоторые общие правила [2]. Опытные данные упорядочивают (представляют в виде вариационного ряда от Xmin до Хmax в порядке возрастания) и группируют по интервалам. Ширину интервалов обычно выбирают равной h:
h = (Xmax - Xmin)/r , (2.1)
где r - число интервалов разбиения.
Число интервалов разбиения нельзя выбирать очень большим или очень малым. При группировании данных в большое число мелких интервалов некоторые из них окажутся пустыми. Гистограмма будет иметь гребенчатый вид, т. е. резко отличаться от плавной кривой. Следовательно, если внутри гистограммы получаются пустые интервалы, это чаще всего говорит о том, что число интервалов разбиения выбрано слишком большим.
При очень малом числе интервалов будут потеряны характерные особенности опытного распределения. Так, например, при трех интервалах любое колоколообразное распределение сведется к треугольному. Задача оптимального выбора количества интервалов не имеет в общем виде строгого решения. Для практических целей можно выбирать число интервалов r, руководствуясь данными, приведенными ниже [3].
Количество наблюдений n в выборке 40 -100 100 -500 500 -1000
Число интервалов разбиения r 7-9 8 -12 10 -16
Предпочтительно выбирать число интервалов r нечетным, чтобы принудительно не уплощать островершинные распределения.
Значение ширины интервала h, определенное по формуле (2.1), нужно всегда округлять в большую сторону (например, h = 0,187 округляют до значения h = 0,2), причем желательно, чтобы h легко делилось на 2 (для определения координат центров столбцов).
Нижняя граница первого интервала не обязательно должна быть равной Xmin. Эта граница может быть выбрана несколько меньше значения Xmin, но так, чтобы границы всех интервалов получались удобными для построения гистограммы (например, при Xmin = 15,014 и h = 0,02 целесообразно выбрать Х1н = 15,01, тогда Х1в = 15,01+h = 15,03 и т. д.)
Масштаб по осям при построении гистограммы рекомендуется выбирать таким, чтобы высота графика относилась к его основанию как 3 к 5. При этом общая площадь между осью абсцисс и ступенчатой кривой должна быть равной единице (условие нормировки).
Следует заметить, что большинство перечисленных рекомендаций соответствуют условиям, когда обработка результатов статистических измерений проводится без применения компьютерных технологий. При использовании персональных компьютеров и соответствующих программных продуктов задача обработки результатов существенно упрощается.
Если из построенной гистограммы следует, что кривая опытного распределения имеет форму, близкую к колоколообразной, целесообразно первой проверить гипотезу о нормальности распределения опытных данных.
Алгоритм обработки результатов прямых многократных измерений при неизвестном законе распределения:
1. Упорядочиваем ряд наблюдений.
2. Находим оценку действительного значения измеряемой величины .
3. Находим оценку среднеквадратического отклонения для ряда наблюдений Sx.
4.Строим гистограмму опытного распределения и по виду гистограммы формулируем гипотезу о виде закона опытного распределения. Как уже говорилось, при колоколообразной форме кривой опытного распределения первой проверяется гипотеза нормального распределения.
5. Используя критерий χ2, проверяем состоятельность выдвинутой гипотезы (задача 2.1 – пример применения критерия χ2 [1]).
Если гипотеза о нормальности распределения подтверждается, то дальнейшая обработка ведется по правилам, разработанным для нормально распределенных данных. Следующим шагом обработки является проверка выборки на наличие результатов, содержащих грубые погрешности, и исключение их.
Окончательный результат представляется в форме по МИ 1317-2004 «Государственная система обеспечения единства измерений. Результаты и характеристики погрешности измерений. Формы представления. Способы использования при испытаниях образцов продукции и контроле их параметров».
6. Если по виду гистограммы выдвигалась гипотезао другом типе закона распределения (например, экспоненциальном, равномерном и др.) и она оказалась состоятельной, то оценки числовых характеристик опытного распределения и границы доверительного интервала случайной погрешности можно определить по формулам, приведенным в [3].
7. Если гипотеза о нормальности распределения опытных данных оказалась несостоятельной, а другие гипотезы не выдвигались и не проверялись, то можно определить доверительный интервал случайной погрешности только при доверительной вероятности Рдов = 0,9, пользуясь рекомендациями ГОСТ 11.001-73 и свойствами доверительного интервала при Рдов = 0,9 (см. подразд. 1.2.2[1] и [2]) , при которой для большой группы различных распределений границы симметричного доверительного интервала определяются из соотношения .
При этом следует иметь в виду, что по ограниченным экспериментальным данным мы получаем не точные доверительные значения, а лишь их приближенные значения - оценки. Достоверность оценок резко повышается с понижением значений Рдов, а при постоянном Рдов - с ростом числа отсчетов n. Поэтому оценки с большими доверительными вероятностями могут быть найдены только при большом числе отсчетов.
Располагая рядом из n отсчетов и отбрасывая с каждого из концов ряда по nотб отсчетов, можно определить доверительный интервал D Рдов с доверительной вероятностью, не большей чем .
Отсюда, число отсчетов n, необходимое для определения по экспериментальным данным D Рдов с заданной вероятностью Рдов, будет не меньшим, чем и для различных значений Рдов и nотб=1 приведено ниже:
Рдов 0,8 0,9 0,95 0,98 0,99 0,995 0,997
n 20 40 80 200 400 800 1333
По экспериментальным данным легко определить значение D лишь с доверительной вероятностью Рдов ≤ 0,95 (n≈80), а определение D Рдов=0,99 или D Рдов=0,997 практически трудноосуществимо (нужно 400 ≤ n ≤ 1333). При этом необходимо обратить внимание на то, что, взяв, например, выборку объемом n = 80 и, отбросив с каждой стороны по одному отсчету, получим, что доверительная вероятность не может быть больше, чем 0,95. При этом нет никаких оснований утверждать, что она равна 0,95 (так же как утверждать, что она равна 0,8 или 0,3). Тем не менее, очень часто доверительные погрешности рассчитывают, вводя ничем не обоснованное предположение о том, что вид закона распределения погрешностей будто бы точно известен. В частности, используют прием, заключающийся в вычислении по небольшой выборке в 20-30 отсчетов оценки среднего квадратического отклонения S , а затем указывают погрешность с доверительной вероятностью Рдов = 0,997, равную D Рдов=0,997 = 3σ на основании предположения о нормальности закона распределения [2].
Например, согласно стандарту «ГОСТ 8.207-76. Переиздание. Апрель 2006 г.», если результаты наблюдений принадлежат нормальному распределению, а число результатов наблюдений n≤15, принадлежность их к нормальному распределению не проверяют, а доверительные границы результата измерения находят по формуле:
,
где t – коэффициент Стьюдента.
Причем, коэффициент t находят по таблицам для доверительной вероятности Рдов = 0,95. Как было показано выше, число наблюдений для доверительной вероятности 0,95 не должно быть меньше 80.
Из приведенного выше анализа ясно, что такой прием является некорректным вне зависимости от того, допускается ли он сознательно или неосознанно. Дело заключается в том, что реальные законы распределения погрешностей приборов весьма разнообразны и часто очень далеки от нормального. Для установления действительного хода кривой распределения на ее краях необходимо проведение испытаний, число которых должно быть тем больше, чем большим выбирается значение доверительной вероятности.
Все сказанное справедливо и при обработке результатов прямых многократных измерений при неизвестном законе распределения.
Если число измерений недостаточно велико, а доверительные границы результата измерения должны отвечать большой доверительной вероятности, за результат измерения лучше принять среднее арифметическое, а погрешность измерения рассчитывать по паспортным данным используемого средства измерения.
Задача № 2.1 [1]
Условие задачи.Для выяснения закона распределения случайных отклонений изготовленных резисторов от номинала было проведено измерение точного значения 200 резисторов из одной партии. Номинальное значение резисторов 300 Ом. В результате предварительной обработки результатов измерений получены следующие данные:
- максимальное значение резистора в выборке Rmax = 308,97 Ом;
- минимальное значение резистора в выборке Rmin = 287,05 Ом;
- среднее квадратическое значение отклонений резисторов от номинального значения SDR = 5,146 Ом.
Примечание. Для экономии места вся совокупность полученных результатов измерений резисторов здесь не приводится. В табл. 2 приведены сгруппированные по интервалам данные предварительной обработки отклонений резисторов от номинала (столбцы 2—5 таблицы).
Решение.Для обоснованной формулировки гипотезы о виде закона распределения отклонений резисторов от номинала построим гистограмму опытного распределения, соблюдая все рекомендации, приведенные в работах [2, 3, 4]. Для этого выполним следующие действия.
1. Группируем полученные отклонения по интервалам, число которых выбираем r = 11.
2. Определяем ширину интервала, используя формулу (2.1):
Ом
или используя максимальные отклонения резисторов от номинала:
Ом.
Дата добавления: 2020-10-14; просмотров: 643;