Статистическое изучение вариации
Основные вопросы: 1. Понятие вариации.
2. Показатели вариации.
3. Относительные показатели вариации.
4. Виды дисперсии.
1. Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.
Определение: Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Вариация в переводе с латинского означает «колеблемость», «изменчивость», «непостоянство». Предполагая, что большинство социально-экономических явлений и процессов варьируют в некотором масштабе, статистика разработала методологию расчета показателей вариации, которые, в свою очередь, могут быть абсолютными, относительными и средними.
Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.
Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.
Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.
Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.
Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.
Пример 1. Возьмем два варьирующих признака: возраст матерей и долю мальчиков среди детей, родившихся у матерей до 45-летнего возраста, полученные в результате социально-демографического обследования в 2002 г. в одном из регионов.
Таблица 15
Возраст матери, лет | Моложе 20 | 20–24 | 25–29 | 30–34 | 35–39 | 40–44 |
На 1000 девочек приходится мальчиков |
Из данных таблицы видно, что от возраста матери зависит доля мальчиков среди новорожденных. Здесь наблюдается систематическая вариация зависимого признака. Оба признака варьируют, но вариация зависимого признака идет в противоположном направлении по сравнению с вариацией факторного признака. Чем выше возраст матери, тем ниже доля мальчиков. Иначе говоря, по мере увеличения возраста матери вероятность рождения мальчика несколько уменьшается и в такой же мере возрастает вероятность рождения девочки.
Пример 2. Одинаковую работу выполняют две бригады, каждая из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими, составляло:
В первой бригаде – 95, 100, 105 ( )
Во второй бригаде – 75, 100, 125 ( ).
Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет 100 шт., но колеблемость выработки отдельных рабочих в первой бригаде значительно меньше, чем во второй. Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей.
2. Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.
1) Размах вариации – разность между максимальным и минимальным значением признака:
.
Он характеризует пределы изменения признака. В нашем примере размах вариации сменной выработки деталей для первой и второй бригад соответственно: =10 шт., =50 шт., что в 5 раз больше.
Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более устойчива. Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт. ( ), а в первой – только 315 шт.
Средний размах: – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.
Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.
Простейший показатель такого типа СЛО.
2). Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).
– СЛО для несгруппированных данных: ,
где – число членов ряда.
Т.е. – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.
– СЛО для сгруппированных данных: ,
где – сумма частот вариационного ряда.
В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.
Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.
3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).
В общем виде взвешенная дисперсия исчисляется по формуле:
или простая дисперсия:
.
Дисперсия альтернативного признака:
Пример 3. Определить дисперсию, если из обследованных 200 деталей 10 – бракованные.
– доля бракованных деталей, – доля годных деталей.
.
4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:
– для несгруппированных данных;
– для сгруппированных данных (для вариационного ряда).
3. Относительные показатели вариации (коэффициент вариации). В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.
Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).
КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.
,
это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.
Рассмотрим расчет показателей вариации.
Пример 4. По исходным данным определить: размах вариации, дисперсию, СКО, КВ.
Таблица 16
Группы работников по стажу, лет | Число работников в группе ( ), чел. |
1 – 4 4 – 7 7 – 10 | |
ИТОГО: |
Решение:
1) лет.
Остальные показатели требуют более трудоемких расчетов.
Таблица 17
Стаж, лет | Число работников ( ), чел. | Середина интервала ( ) | ||||
1 – 4 4 – 7 7 – 10 | 2,5 5,5 8,5 | 10,0 27,5 17,0 | –2,5 0,5 3,5 | 6,25 0,25 12,25 | 25,00 1,25 24,2 | |
ИТОГО | – | 54,5 | – | – | 50,75 |
– среднее значение находили ранее, оно равно 5 лет.
2) дисперсия: .
3) СКО: года.
4) КВ: .
Анализ полученных данных говорит о том, что стаж работников предприятия отличается от среднего стажа ( =5) в среднем на 2,1 года, или на 42 %. Значение коэффициента вариации превышает 33 %, следовательно, вариация производственного стажа велика, найденный средний производственный стаж плохо представляет всю совокупность работников, не является ее типичной, надежной характеристикой, а саму совокупность нет оснований считать однородной по производственному стажу.
4. Виды дисперсии.
Определение: Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.
Свойства дисперсии:
1) Дисперсия постоянной величины равна нулю ( );
2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ( );
3) Если все варианты умножить на число , дисперсия увеличится в раз ;
4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа на – свойство минимальности дисперсии от средней ( ).
Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.
Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.
Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:
- Общая дисперсия
– Средняя из внутригрупповых дисперсий
- Межгрупповая дисперсия
Общая - измеряет вариацию во всей совокупности
Средняя из внутригрупповых дисперсий исчисляется ,
где – частота появления внутригрупповой дисперсии одной величины (одного размера).
– внутригрупповая - измеряет вариацию признака внутри группы, - групповая средняя.
Межгрупповая дисперсия – измеряет колеблемость групповых средних вокруг общей средней :
Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.
Правило сложения дисперсий.
Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.
Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).
Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.
Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:
– характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).
; – влияние других факторов равно 0.
– влияние признака равно 0.
Пример 5. Имеются следующие данные о зависимости выработки изделий работников от производственного стажа:
Таблица 18
Зависимость выработки работников от производственного стажа
Стаж, лет | Число работников, чел. | Выработка изделий в среднем на одного работника, шт. |
1 – 4 4 – 7 7 – 10 | 6,8 8,6 11,0 | |
ИТОГО: | 8,4 |
Определить: эмпирическое корреляционное отношение.
Решение: вычислим межгрупповую дисперсию по формуле:
.
Таблица 19
Стаж, лет | Число работников ( ) | Средняя выработка | |||
1 – 4 4 – 7 7 – 10 | 6,8 8,6 11,0 | -1,6 0,2 2,6 | 2,56 0,04 6,76 | 10,24 0,2 13,52 | |
ИТОГО: | 8,4 | - | – | 23,96 |
Теперь вычислим общую дисперсию выработки изделий на основе индивидуальных (несгруппированных) данных способом моментов: .
Таблица 20
Выработка изделий ( ), шт. | |
Итого: |
, тогда или 86,2%, .
Коэффициент детерминации говорит о том, что вариация выработки изделий на 86,2% зависит от вариации производственного стажа работников и на 13,8% от прочих факторов.
Эмпирическое корреляционное отношение по своей величине близко к единице, что свидетельствует о весьма тесной связи между стажем работников и их выработкой.
Лекция 7
Дата добавления: 2016-06-22; просмотров: 2778;