Как провести группировку данных
Основные способы статистической обработки анкет, которые используются практически всегда, - это составление РЯДОВ РАСПРЕДЕЛЕНИЯ для каждого вопроса и ГРУППИРОВОЧНЫХ ТАБЛИЦ ключевых вопросов с некоторыми вопросами паспортички.
РЯД РАСПРЕДЕЛЕНИЯ ДЛЯ ВОПРОСА – ЭТО РЯД ЧИСЕЛ, КАЖДОЕ ИЗ КОТОРЫХ ОЗНАЧАЕТ ЧАСТОТУ (КОЛИЧЕСТВО) ВЫБОРА СООТВЕТСТВУЮЩЕГО ВАРИАНТА ОТВЕТА НА ДАННЫЙ ВОПРОС В РАССМАТРИВАЕМОЙ СОВОКУПНОСТИ АНКЕТ. РЯД ЧИСЕЛ-ЧАСТОТ ДОПОЛНЯЕТСЯ РЯДОМ ПРОЦЕНТОВ, В КОТОРОМ В КАЖДОЙ ЧАСТОТЕ СООТВЕТСТВУЕТ ЕЕ ДОЛЯ, ВЫРАЖЕННАЯ В ПРОЦЕНТАХ, В РАССМАТРИВАЕМОЙ СОВОКУПНОСТИ АНКЕТ.
Проценты рассчитываются по формуле
Pi = ni / N * 100,
где
i – номер варианта ответа;
ni – частота выбора i-го варианта ответа на данный вопрос в рассматриваемой совокупности анкет;
N – общее количество анкет.
Например, если на вопрос «Приходилось ли Вам менять профессию?» с вариантами ответов «да», «нет» в совокупности из 400 анкет вариант «да» выбрали 250 человек, вариант «нет» – 140 человек и 10 человек не дали ответа, то ряд распределения для этого вопроса для этого вопроса выглядит так:
Варианты ответов | Да | Нет | Нет ответа | Сумма |
Количество | ||||
% | 62,5 | 2,5 |
Заметьте, что, если мы будем составлять ряд распределения неальтернативного признака, где респондент может выбрать больше одного варианта ответа, сумма в строке «Количество» получится больше общего числа анкет, а сумма в строке процентов получится больше 100.
ЗАДАНИЕ:Составьте ряд распределения ответов на вопрос «Какие фильмы Вы любите?», если в массиве из 200 анкет вариант «комедии» выбрали 150 человек, «приключения» – 80, «мелодрамы» – 40, «ужасы» – 60 и 5 человек не дали ответа.
Варианты ответов | Комедии | Приключения | Мелодрамы | Ужасы | Нет ответа | Сумма |
Количество | ||||||
% |
Составляйте ряды распределения ответов на вопросы анкеты при ручной обработке, подсчет ведут на полях какого-либо бланка анкеты, отмечая точками количество выборов каждого варианта вопроса против записи этого варианта в анкете. Для записи варианта «нет ответа» в каждом вопросе отводят небольшое дополнительное место.
ЗАДАНИЕ:Составьте ряды распределения на каждый вопрос (включая паспортичку) Вашей анкеты по профессиональной мобильности и запишите их в подготовленные таблицы, включив в каждую ВАШИ варианты ответов. Для расчета процентов в тетради отведен специальный лист. В заголовок каждой таблицы впишите соответствующий вопрос.
Лист для расчета процентов в рядах распределения
Ряд распределения ответов на вопрос № _____
________________________________________________________________________
Варианты ответов | Нет ответа | Сумма | |
Количество | |||
% |
ГРУППИРОВОЧНАЯ ТАБЛИЦА – ЭТО ТАБЛИЦА, СОДЕРЖАЩАЯ ЧИСЛА-ЧАСТОТЫ ВЫБОРА ВАРИАНТОВ ОТВЕТА НА ВОПРОС В ЗАВИСИМОСТИ ОТ ОТВЕТОВ НА ДРУГОЙ ВОПРОС.
Группировочные таблицы чаще всего составляют для основных содержательных вопросов анкеты в пересечении с вопросами паспортички.
Например, группировочная таблица вопросов «Приходилось ли Вам менять профессию?» и «Пол» в массиве из 400 анкет может выглядеть так:
Пол | Да | Нет | Нет ответа | Сумма |
Мужской | ||||
Женский | ||||
Всего |
Из этой таблицы следует, например, что из 174 опрошенных мужчин большинству (130 человек) приходилось менять профессию или что среди тех, кто не менял профессию, большинство женщин (из 140 не менявших профессию – 40 мужчин и 100 женщин), и т.д. Вообще при умелом использовании группировочные таблицы дают богатый материал для анализа результатов анкетирования. Для удобства анализа часто рассчитывают проценты по строкам и столбцам.
ВОПРОСЫ:
1. Сравните данную группировочную таблицу с таблицей-примером ряда распределения на вопрос «Приходилось ли Вам менять профессию?». Что общего в этих таблицах?
2. Могли бы Вы, используя данную группировочную таблицу, составить ряд распределения ответов на вопрос «Пол» в этом же массиве анкет? Попробуйте сделать это.
Варианты ответов | Мужской | Женский | Сумма |
Количество | |||
% |
3. Почему здесь не предусматривается варианта «нет ответа»?
Часто, анализируя результаты обработки, используют средние характеристики, например, среднюю арифметическую для количественных признаков, которая определяется как сумма всех вариантов ответа, деленная на количество вариантов.
ЗАДАНИЕ: Подсчитайте среднее время, затраченное на просмотр телепередач каждым членом Вашей семьи, используя данные проведенной Вами практической работы, по формуле
Тср = (Тбудн + Твых)/ 2,
Где
Тср – среднее время просмотра телепередач;
Тбудн – время просмотра телепередач в будний день;
Твых – время просмотра телепередач в выходной день.
Дата добавления: 2020-12-11; просмотров: 378;