Основы группировки данных
Программа разработки предусматривает реализуемые на втором этапе статистического исследования сводку и группировку статистических данных. Эти операции, осуществляемые на основе статистических таблиц, позволяют систематизировать полученные в ходе наблюдения данные, провести обработку и подсчет групповых итогов, расчеты простейших производных величин (статистических коэффициентов, средних величин). На этом же этапе, для повышения наглядности данных, предусматривается использование графических изображений. Иногда (в официальной статистике — почти всегда) на этом заканчивается весь процесс обработки собранных данных.
Группировка — основа статистической разработки (систематизации) первичного материала. Группировка, правильно спланированная на этапе подготовки исследования, позволяет облегчить регистрацию или повысить точность измерений на этапе сбора исходных данных без снижения результативности исследования в целом. Группировка собранной исходной информации определяет весь ход статистического анализа.
В ходе статистической разработки исследователю приходится сталкиваться со следующими вариантами группировок, каждый из которых имеет свои методические особенности:
• разделение анализируемой статистической совокупности на группы по тем или иным признакам. С такого рода группировкой приходится сталкиваться уже при подготовке программы сбора и в ходе реализации программы разработки любого исследования;
• объединение мелких однородных групп в более крупные. Этот вариант группировки применяется, как правило, уже в процессе статистической обработки данных, если выясняется несостоятельность мелких групп (малое число наблюдений, нечетко выраженный характер распределений и т.п.). Возможность такой группировки целесообразно предусмотреть уже на этапе подготовки программы сбора данных, т.е. обеспечить возможность укрупнения групп в соответствии с общепринятыми границами групп;
• комплексная группировка обеспечивает формирование комплексных оценок на основе многих учетных признаков, даже если они разнородны. Такая группировка часто делается на основе специально разрабатываемых алгоритмов или экспертных оценок (по аналогии — постановка диагноза на основе многих симптомов и результатов лабораторных обследований). Такая группировка представляет весьма сложную задачу и нередко сама по себе является самостоятельной целью исследования.
Выделяют следующие основные виды группировки в зависимости от конкретной цели статистического исследования (табл. 1).
Таблица 1
Классификация статистических группировок
Аналитические | Структурные | Типологические | Специальные (балансовые, матричные и т.д.) |
Характеризуют взаимосвязи между признаками, проявляют основные тенденции | Выявляют состав, структуру обследованных групп | Характеризуют основные группы (типы групп признаков) | Используются при составлении балансов предприятий и учреждений, отраслей промышленности и т.п. |
Аналитическая группировка выявляет взаимосвязи между явлениями (признаками их характеризующими). При этом они подразделяются на факторные и результативные. Взаимосвязь проявляется в систематическом изменении результативного признака в связи с изменением факторного. Например: температура тела влияет на частоту пульса, в зависимости от величины роста изменяется вес и т.п.
Структурная группировка выявляет состав, строение однородной в качественном отношении статистической совокупности. Например: состав больных по полу, возрасту, диагнозу и т.п. Сопоставление данных структурной группировки во времени дает представление о структурных сдвигах.
Группировка типологическая — с ее помощью в статистической совокупности выделяются качественно однородные в существенном отношении группы. Например: группы больных с одинаковым диагнозом, с одинаковым исходом заболеваний и т.п.
При статистической разработке материала любого исследования необходимо учитывать существующие правила и стандарты определения группировочных признаков и границ групп (возрастно-половые группировки, группировки по категориям тяжести труда и т.п.). Несоблюдение правил формирования этих группировок ведет к потере ценности данных.
В национальной статистике выделяют следующие возрастно-половые группы (в границах точного возраста):
1) Дети до 3 лет. Эта группа находится под наблюдением детских консультаций и обслуживается детскими яслями. Из них часто выделяются дети в возрасте 1 и 2 года жизни;
2) Дошкольники — дети от 3 до 7 лет. Обслуживаются детскими садами;
3) Дети и подростки школьного возраста от 7 до 13 лет и 13—16 лет;
4) Подростки от 16 до 18 лет;
5) Трудоспособный контингент — мужчины 16—60 лет, женщины 16—55 лет;
6) Лица пенсионного возраста — мужчины 60 лет и старше, женщины 55 лет и старше;
7) Женщины репродуктивного возраста — обычно от 15 до 45 лет.
Иногда для группировки по возрасту используют одногодичные или (для взрослых) пятилетние, реже десятилетние интервалы. Группировка с пятилетним интервалом выглядит следующим образом: до 20 лет, 20—24, 25—29, 30—35 и т.д. С десятилетним интервалом: до 20 лет, 20—29, 30—39 и т.д. При изучении заболеваемости в связи с производственными факторами обычно используются аналогичные 5- и 10-летние интервалы группировок по стажу работы: 1—4 года, 5—9 лет, 10—14 лет и т.д. При этом, к группе 1—4 года относятся лица со стажем от 1 года до 4 лет 11 мес. 29 дней. Аналогично, к группе со стажем от 5 до 10 лет относятся лица, отработавшие от 5 лет до 9 лет 11 мес. и 29 дней.
В ряде случаев целесообразно расчленять отдельные крупные группы на более мелкие. Например: до 20 лет, 20—29, 30—39, 40—44, 45—49, 50—59, 60 и старше.
Группировка данных по своей сути представляет собой принцип классификации, т.е. установление принадлежности явлений и объектов к определенным классам. В государственной статистике для этого используются классификаторы — специальные справочники, инструкции и указатели в виде алфавитных и систематических словарей, дополняемых стандартным перечнем объектов и их групп. Использование классификаторов в официальной статистике является обязательным и имеет силу государственного стандарта. Основные классификаторы рассчитаны на длительное использование. Однако, с течением времени они пересматриваются, дополняются, в них вносятся необходимые коррективы. Так, с 1983 до 1999 года в СССР, а затем в России общепринятой считалась Международная статистическая классификация болезней, травм и причин смерти 9-го пересмотра. С 1999 года была введена классификация 10-го пересмотра (с 01.01.99 г. по Приказу Минздрава России № 3 от 12.01.98 г.).
В медико-биологических научных исследованиях использование государственных и международных классификаторов болезней и причин смерти не является строго обязательным. Однако, только их прямое применение или возможность путем вторичной группировки привести данные исследований в рамки, определяемые общепринятыми классификаторами, гарантирует сопоставимость статистических материалов о заболеваемости, причинах смерти разных категорий населения на различных территориях страны и за рубежом.
1. Вопросы по теме занятия:
1. Основные этапы научного исследования.
2. Цели, задачи и план исследования.
3. Способы получения исходных данных для исследования.
4. Понятия текущего и единовременного наблюдения.
5. Сплошное и не сплошное исследование. Методы.
6. Виды выборок.
7. Понятия повторной и бесповторной выборки.
8. Оценка численности выборки для доли в случае повторного отбора.
9. Оценка численности выборки для доли в случае бесповторного отбора.
10. Оценка численности выборки для среднего в случае повторного отбора.
11. Оценка численности выборки для среднего в случае бесповторного отбора.
12. Группировка собранной исходной информации.
2. Тестовые задания по теме с эталонами ответов:
1. ПЕРВЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ВКЛЮЧАЕТ В СЕБЯ
1) анализ результатов
2) вычисление первичных итогов
3) определение целей и задач, составление плана исследования
4) углубленную математико-статистическую обработку данных
2. ПО ОХВАТУ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ ИССЛЕДОВАНИЕ МОЖЕТ БЫТЬ
1) сплошное или единичное
2) сплошное или не сплошное
3) не сплошное или выборочное
4) первичное или вторичное
3. КО ВТОРОМУ ЭТАПУ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ОТНОСИТСЯ
1) анализ полученных результатов, выводы
2) наблюдение, сводка и группировка полученных статистических материалов
3) определение целей и задач
4) углубленная математико-статистическая обработка данных
4. ПРИЗНАКИ, ПОДЛЕЖАЩИЕ РЕГИСТРАЦИИ В ХОДЕ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ, НАЗЫВАЮТСЯ
1) количественные
2) учетные
3) качественные
4) случайные
5. УЧЕТНЫЕ ПРИЗНАКИ ПО ВИДУ МОГУТ БЫТЬ
1) качественные или количественные
2) первичные или факторные
3) результативные или вторичные
4) вероятные или достоверные
6. ПО РОЛИ В СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ УЧЕТНЫЕ ПРИЗНАКИ МОЖНО ПОДРАЗДЕЛИТЬ НА
1) достоверные и невозможные
2) первичные и вторичные
3) качественные и вероятные
4) факторные и результативные
7. СБОР ДАННЫХ ПРИ ПЕРЕПИСЯХ НАСЕЛЕНИЯ ОТНОСИТСЯ К НАБЛЮДЕНИЮ
1) текущему
2) единовременному
3) случайному
4) математическому
8. ИССЛЕДОВАНИЕ, ПРЕДПОЛАГАЮЩЕЕ РЕГИСТРАЦИЮ ВСЕХ СЛУЧАЕВ, СОСТАВЛЯЮЩИХ ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ, НАЗЫВАЕТСЯ
1) первичным
2) случайным
3) выборочным
4) сплошным
9. СОВОКУПНОСТЬ, СОСТОЯЩАЯ ИЗ ОТНОСИТЕЛЬНО ОДНОРОДНЫХ ЭЛЕМЕНТОВ, ОБЪЕДИНЕННЫХ НАСТУПЛЕНИЕМ ОПРЕДЕЛЕННОГО ПРИЗНАКА, НАЗЫВАЕТСЯ
1) группой
2) когортой
3) классом
4) выборкой
10. ОШИБКИ, СВЯЗАННЫЕ С НЕПРАВИЛЬНЫМ ВЫБОРОМ ОБЪЕКТА ИССЛЕДОВАНИЯ, ИСПОЛЬЗОВАНИЕМ НЕПРАВИЛЬНЫХ ГРУППИРОВОК, НАЗЫВАЮТСЯ
1) методические
2) логические
3) математические
4) статистические
11. ОШИБКИ, ЗАКЛЮЧАЮЩИЕСЯ В НЕОБОСНОВАННОМ ИСПОЛЬЗОВАНИИ РАЗЛИЧНЫХ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ И ПРИВОДЯЩИЕ К ИСКАЖЕНИЮ СУЩНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ, НАЗЫВАЮТСЯ
1) логические
2) статистические
3) математические
4) методические
12. ЧЕТВЕРТЫЙ ЭТАП СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ВКЛЮЧАЕТ В СЕБЯ
1) анализ полученных результатов, выводы
2) определение целей и задач
3) вычисление первичных итогов
4) углубленная математико-статистическая обработка данных
13. ВЫБОР ОБЪЕКТА И ЕДИНИЦЫ НАБЛЮДЕНИЯ, А ТАКЖЕ УЧЕТНЫХ ПРИЗНАКОВ, ПОДЛЕЖАЩИХ РЕГИСТРАЦИИ В ХОДЕ ИССЛЕДОВАНИЯ, ВКЛЮЧАЕТ В СЕБЯ
1) план исследования
2) схему исследования
3) шаблон исследования
4) программу исследования
14. ДИАГНОЗ ЗАБОЛЕВАНИЯ – ЭТО ПРИЗНАК
1) статистический
2) случайный
3) количественный
4) качественный
15. ПРИЗНАК, ИЗМЕНЯЮЩИЙ СВОЕ ЗНАЧЕНИЕ ПОД ВЛИЯНИЕМ ДРУГОГО, СВЯЗАННОГО С НИМ, НАЗЫВАЕТСЯ
1) первичный
2) факторный
3) результативный
4) вторичный
16. РЕПРЕЗЕНТАТИВНОСТЬ, ОПРЕДЕЛЯЕМАЯ ЧИСЛОМ НАБЛЮДЕНИЙ, ГАРАНТИРУЮЩИМ ПОЛУЧЕНИЕ СТАТИСТИЧЕСКИ ДОСТОВЕРНЫХ ДАННЫХ, НАЗЫВАЕТСЯ
1) количественная
2) качественная
3) математическая
4) статистическая
17. СТРУКТУРНОЕ СООТВЕТСТВИЕ ВЫБОРОЧНОЙ И ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЕЙ – ЭТО РЕПРЕЗЕНТАТИВНОСТЬ
1) статистическая
2) количественная
3) качественная
4) математическая
18. ВЫБОРКА, В КОТОРУЮ КАЖДЫЙ ЭЛЕМЕНТ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ИМЕЕТ ИЗВЕСТНУЮ И РАВНУЮ ВЕРОЯТНОСТЬ ОТБОРА, НАЗЫВАЕТСЯ
1) стратифицированной
2) простой случайной
3) систематической
4) кластерная
19. В СЛУЧАЕ, КОГДА СОВОКУПНОСТЬ ДЕЛИТСЯ НА ПОДГРУППЫ, А ЗАТЕМ ИЗ КАЖДОЙ ПОДГРУППЫ СЛУЧАЙНЫМ ОБРАЗОМ ВЫБИРАЮТСЯ ЭЛЕМЕНТЫ, ТО ТАКАЯ ВЫБОРКА НАЗЫВАЕТСЯ
1) систематическая
2) простая случайная
3) стратифицированная
4) кластерная
Эталоны ответов к тестовым заданиям:
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ |
Занятие №9
Дата добавления: 2016-06-05; просмотров: 1826;