Понятия сводки и группировки статистических данных
Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведение разрозненных данных воедино. Это происходит в процессе выполнения второго этапа статистического исследования, который носит название «статистическая сводка». Она состоит из подсчёта первичного статистического материала (сводка в узком смысле слова), его группировки, а также представления результатов сводки в виде статистических рядов, таблиц и графиков.
Статистическая сводка ведётся по программе, которая составляется заранее. Программа определяет подлежащее и сказуемое сводки. Подлежащее сводки составляют группы, на которые разбивается совокупность явлений. Сказуемое сводки составляют показатели, характеризующие каждую группу и совокупность в целом. Успех сводки во многом зависит от плана её проведения, который содержит указания о последовательности и сроках выполнения отдельных частей сводки и изложения её результатов.
Группировкой называется объединение единиц объекта наблюдения в однородные по существенным для них признакам группы.
В зависимости от числа признаков в основании группировки выделяют группировки по одному признаку – простые – и группировки по нескольким признакам – сложные.
Алгоритм простой группировки.
1. Совокупность упорядочивается по значению группировочного признака.
2. Определяется число групп (m).
3. Единицы с одинаковыми или близкими значениями признака объединяются в группы.
4. Подсчитываются итоги по группам (число единиц совокупности и значения обобщающих показателей).
5. Результаты группировки представляются в виде группировочной таблицы (табл.3)
Таблица 3
Группировочная таблица
№ группы | Значение группировочного признака | Число единиц совокупности в группе | Обобщающий показатель 1 | Обобщающий показатель 2 | |
… m Итого |
Под группировочным признаком понимают признак, по которому происходит объединение отдельных единиц совокупности в однородные группы (признаки могут быть атрибутивными, т.е. смысловыми, качественными, не имеющими количественного выражения – пол, профессия, специализация; и количественными – размер территории, объем продаж и т.п.).
Если группировка выполняется по атрибутному признаку, то число групп, в которые объединяются единицы объекта наблюдения, определяется числом разновидностей атрибутивного признака. Так, группировка населения по полу даёт две группы, а группировка его по национальности образует столько групп, сколько различных национальностей имеется среди изучаемого населения.
При группировке по количественным признакам возникает вопрос о выборе размера интервала, т.е. разности между наибольшим и наименьшим значениями признака в данной группе. Размер интервала должен быть таким, чтобы полученные группы чётко отличались друг от друга. Интервалы групп могут быть равные и неравные. Разные интервалы целесообразно применять в тех случаях, когда признак изменяется равномерно.
При исследовании экономических явлений чаще применяются неравные, прогрессивно увеличивающиеся интервалы. Это объясняется тем, что здесь количественные изменения размера признака имеют неодинаковое значение в низших и высших группах. Например, если разница в числе работников в 50 человек имеет существенное значение для мелкого предприятия, то для крупного такая разница существенного значения не имеет.
Интервалы могут быть закрытые (с указанием нижней, так и верхней границ) или открытые (с указанием только одной границы).
Для придания группировке строгой определённости верхняя граница предыдущей и нижняя граница последующей группы должны обозначаться различно.
Алгоритм построения группировки с равными интервалами включает следующие шаги.
1. Определяется оптимальное количество групп – m. Для больших совокупностей можно воспользоваться формулой американского учёного Стерджесса:
m=1+3,322*lgN,
где N – число единиц совокупности.
2. Определяется величина интервала:
,
где числитель – размах вариации;
максимальное значение признака в исследуемой совокупности;
минимальное значение признака в исследуемой совокупности;
m – число групп.
Если в результате деления получится нецелое число, то округлять нужно в большую сторону, а не в меньшую.
3. Определяются границы каждого интервала:
Для первого интервала: от до .
Для второго интервала: от до .
Для m-го интервала: от до .
4. Подсчитывают число единиц, попавших в интервал. Причём единицы, имеющие значение признака, равное граничному, относят только к одному из интервалов.
5. Результаты заносят в таблицу.
Рассмотрим пример построения равноинтервального ряда. Пусть по совокупности из 20 студентов изучается посещаемость ими практических занятий по статистике за семестр.
(Х – число практических занятий по статистике, на которых студент присутствовал в семестре):
16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.
Число групп для удобства возьмем равным 3, тогда величина интервала будет равна:
.
Границы групп будут следующими:
[0;5,4) [5,4;10,8) [10,8;16,2).
Численность групп будет:
4 7 11
Результаты группировки оформим в виде таблицы (табл.4).
Таблица 4
Дата добавления: 2020-10-25; просмотров: 187;