Определение процентилей
P-й процентиль представляет собой точку, ниже которой лежит P процентов оценок.
Перед началом вычисления любого процентиля в группе оценок надо упорядочить эти оценки по возрастанию либо сгруппировать данные. Вычисление любого процентиля упростится, если построить распределение накопленных частот. Накопленные частоты к любой заданной оценке представляют собой суммарное количество частот на этой оценке или ниже ее. Они приведены в последнем столбце таблицы 3.1.
Найдем, например, Р40, т.е. точку, ниже которой лежат 40 % из 38 оценок, полученных учащимися. Вычисление Р40 можно выполнить за 6 шагов.
Шаг 1. Найти 40 % от n = 38 (0,4*38 = 15,2).
Шаг 2. Определить фактическую нижнюю границу L разряда оценок, содержащего 15,2-ю оценку снизу. Так как 14 человек имеют оценки 74 или меньше, а 18 – оценки 79 или меньше, то частота 15,2 лежит в интервале разрядов оценок 75–79, который имеет фактическую нижнюю границу 74,5.
Допустим, что четыре частоты в интервале разрядов оценок распределены равномерно. Тогда каждая частота займет 1/4 часть. Определить, на какие части рассекает интервал 15,2 оценка, – значит решить задачу интерполяции внутри интервала. Это реализуют шаги 3, 4 и 5.
Шаг 3. Вычесть накопленную к L частоту (cum. f) из 0,4n (L = 74,5, cum. f = 14), следовательно, 0,4n – cum. f = 15,2 – 14 = 1,2. На 3 шаге определяется, сколько частот (1,2) в интервале 75–79 лежит ниже 0,4n.
Шаг 4. Разделить результат 3-го шага на частоту (f = 4) в интервале, содержащем накопленную частоту 0,4n.
.
4-й шаг – это определение той доли интервала разрядов оценок, которая лежит под накопленной частотой 0,4n. В интервале 75–79 находится 4 частоты, а 1,2/4 = 0,3-ю часть интервала занимают первые 1,2 частоты.
Шаг 5. Умножить результат 4-го шага на ширину (W = 5) разряда оценок:
0,3*5 = 1,5.
Шаг 6. Прибавить результат 5-го шага к L:
Р40 = 74,5 + 1,5 = 76.
Шаги с 1-го по 6-й можно выразить одной формулой
Рx = , (3.1)
где L – фактическая нижняя граница интервала оценок, содержащего x*n-ю частоту снизу, cum. f – накопленная к L частота; f – частота интервала, содержащего частоту x*n; W – ширина любого интервала оценок.
Покажем теперь применение формулы (3.1) на примере определения Р70 по данным таблицы 3.1. Оценка x*n = 0,70*38 = 26,6-я оценка – лежит в интервале 90-94, который имеет фактическую нижнюю границу 89,5. Разность между x*n и накопленной к 89,5 частотой составляет 26,6 – 25. Учитывая, что частота в интервале, включающем 26,6-ю оценку, равна 3, а ширина интервала равна 5, получаем
Таким образом, 70 % учащихся получили оценку ниже 92,2. Это утверждение нельзя считать абсолютно точным. В процедуру определения процентилей ошибки вошли по двум причинам.
Во-первых, оценка выставляется с точностью до одного балла (а не 0,5 или 0,1). Во-вторых, предполагалось, что частоты внутри каждого интервала оценок были равномерно распределены по всему интервалу. Но эти ошибки несущественны.
Хотя дробные процентили для дискретных переменных (например, количество детей в классе) и не вяжутся с общепринятым смыслом, они все же полезны и находят широкое применение, несмотря на то, что невозможно найти класс с 27,31 ученика.
Дата добавления: 2020-10-01; просмотров: 210;