Статистичне групування
Одним із найважливіших методів статистики є групування.
§ Під групуванням в статистиці розуміють розподіл одиниць статистичної сукупності на групи, однорідні в якому-небудь суттєвому відношенні.
Воно є якраз той метод і та стадія, пропустивши яку ми не можемо застосовувати інші методи. Тому в статистиці групування використовується для вирішення різних завдань, таких як, наприклад:
- визначення і вивчення структури і структурних зрушень сукупності;
- виявлення соціально-економічних типів явищ і процесів;
- виявлення і характеризування зв'язків і залежностей між явищами та їх ознаками (таке дослідження має назву аналітичної функції групування).
Відповідно до цих трьох функцій розрізняють різні види групування: структурні, типологічні і аналітичні.
Групування, в результаті якого виділяють однорідні групи або типи явищ, як вираз конкретного суспільного процесу називаються типологічними. Прикладом типологічних групувань може бути поділ підприємств за характеристикою видів власності, групування країн за економічним розвитком.
Структурними групуваннями називаються групування, які характеризують розподіл одиниць однотипної сукупності за будь-якою ознакою. Типологічні і структурні групування дуже близькі один до одного: типологічні групування виділяють самі типи, а структурні – вказують питому вагу окремих типів у загальній масі.
Аналітичні групування – це групування, які визначають взаємозв'язок між різними ознаками одиниць статистичної сукупності. За допомогою такого групування можна виявити певні взаємозв'язки між факторними і результативними ознаками. Наприклад, залежність між рівнем кваліфікації працівника та його заробітною працею. Аналітичні групування є дуже складними і для того, щоб зрозуміти, як вони будуються, необхідно чітко виділити факторні і результативні ознаки в досліджуваному явищі.
Можливі змішання цих типів групування.
Групування можуть бути прості і комбіновані.
Прості групування – це такі групування, які здійснені на підставі однієї ознаки.
Комбіновані групування – це групування, які здійснені за двома і більше ознаками.
Комбінаційні групування дають можливість комплексного характеризування досліджуваного явища чи процесу.
Для того, щоб зробити групування за кількісною ознакою, необхідно визначитися з кількістю груп та з інтервалом групування.
Кількість груп визначається математичними методами. Вона має біти ні занадто малою, ні занадто великою, вони мають не заважати проаналізувати кінцевий результат.
Величина інтервалу , де xmax – максимальне значення, xmin – мінімальне значення, n – кількість груп сукупності.
Інтервали можуть бути відкриті і закриті, рівні і нерівні.
Рівні інтервали – інтервали з однаковою різницею між верхньою і нижньою границями кожного проміжку.
Нерівні інтервали – інтервали з різними різницями між верхньою і нижньою границями в різних проміжках.
Відкритий інтервал– інтервал з відсутньою однією із границь (наприклад, більше 100, менше 1).
Закриті інтервали – інтервали, в яких присутні всі границі.
Особливим видом групування є класифікація.
§ Класифікацією називається систематизований розподіл явищ і процесів (об'єктів) на визначені групи, класи, розряди на підставі їх подібності і розбіжності.
Класифікації відрізняються від групувань тим, що групувальною основою класифікації є якісна ознака, вони більш стійкі, сталі і стандартні.
Поділ сукупностей на групи, однорідні в тому чи іншому розумінні, пов’язаний з такими діями, як систематизація, типологія, класифікація, групування. Традиційно зазначений поділ виконують за такою схемою: із множини ознак, які описують явище, добирають розмежувальні, а потім сукупність поділяють на групи та підгрупи відповідно до значень цих ознак.
Головний принцип будь-якого поділу ґрунтується на двох положеннях:
1) в один клас, групу об’єднуються елементи певною мірою подібні між собою;
2) ступінь подібності між елементами, які належать до одного класу, значно вищий, ніж між елементами, що належать до різних класів.
У кожному конкретному дослідженні вирішуються три питання:
1) що взяти за основу групування;
2) скільки груп, позицій необхідно виокремити;
3) як розмежувати групи.
Основою групування може бути будь-яка атрибутивна чи кількіcна ознака, що має градації. Таку ознаку називають групувальною. Залежно від складності масового явища (процесу) та мети дослідження групувальних ознак може бути одна, дві й більше.
У статистичній практиці часто вдаються до розбиття сукупностей за атрибутивними ознаками — класифікації та номенклатури. Їх розробляють міжнародні й національні статистичні органи та рекомендують як статистичний стандарт. Здебільшого йдеться про багатоступеневу класифікацію з докладною номенклатурою груп і підгруп, із чітко визначеними вимогами та умовами віднесення елементів сукупності до тієї чи іншої групи.
У міжнародній статистиці відома галузева класифікація видів економічної діяльності, стандартна класифікація занять, стандартна торговельна класифікація. Різновидом класифікації є товарні номенклатури, наприклад Брюссельська митна номенклатура.
Кожній класифікаційній позиції надається код (шифр), який замінює її назву і є постійним засобом ідентифікації під час передавання інформації по каналах зв’язку, комп’ютерної обробки тощо. Так, згідно з міжнародним стандартом галузевої класифікації, розробленої статистичною комісією ООН, код виду економічної діяльності складається з чотирьох цифр. Наприклад, 15 5 2 означає:
15 — код галузі обробної промисловості «Виробництво продуктів харчування та напоїв»;
5 — виробництво напоїв;
2 — виробництво вин.
Кожна класифікація є сталою, забезпечуючи порівнянність даних у просторі та часі.
Поряд з класифікацією для висвітлення певних аспектів конкретного дослідження використовують групування, на яке покладаються такі аналітичні функції:
1) вивчення структури та структурних зрушень;
2) визначення типів соціально-економічних явищ, виокремлення однорідних груп і підгруп;
3) виявлення взаємозв’язків між ознаками.
Згідно з цими функціями розрізняють три види групувань: структурне, типологічне, аналітичне.
Структурне групування характеризує склад однорідної сукупності за певними ознаками. Наприклад, склад населення регіону за місцем проживання (табл. 3.1). За даними таблиці з 5,3 млн населення регіону в містах проживає 3,5 або 2/3 загальної кількості. На одного сільського жителя припадають двоє міських. Кожна група характеризується також кількістю та часткою населення працездатного віку, і це поглиблює аналіз структури.
Таблиця 3.1
ПОДІЛ НАСЕЛЕННЯ РЕГІОНУ, млн осіб,
ЗА МІСЦЕМ ПРОЖИВАННЯ
Місце проживання | Усе населення | У тому числі у працездатному віці |
Міста | 3,5 | 2,1 |
Сільська місцевість | 1,8 | 0,9 |
Разом | 5,3 | 3,0 |
Різновидом структурних групувань є ряди розподілу (див. розд. 5).
Типологічне групування — це поділ якісно неоднорідної сукупності на класи, соціально-економічні типи, однорідні групи. Основне завдання такого групування — ідентифікація типів. Вибір групувальної ознаки та кількісних міжгрупових меж ґрунтується на всебічному теоретичному аналізі суті явища, його характерних рис та особливостей формування в конкретних умовах часу та простору.
Так, в умовах перехідної економіки в країнах Східної Європи зубожіння населення перетворилося на ключову проблему соціальної політики. Вивчаючи цю проблему, UNICEF (Дитячий Фонд ООН) оцінював бідність і злиденність населення відношенням середньодушового доходу окремих домашніх господарств до такого рівня доходу, який би забезпечив задоволення основних потреб. Межа бідності визначалася на рівні 35% середньої заробітної плати 1989 року, а межа злиденності — на рівні 60% межі бідності.
Дані табл. 3.2 характеризують процес зубожіння населення Болгарії на початку 90-х років.
Таблиця 3.2
ДИНАМІКА ЗУБОЖІННЯ НАСЕЛЕННЯ БОЛГАРІЇ, %, по роках
Ступінь зубожіння | ||
Бідність | 13,8 | 62,3 |
Злиденність | 2,0 | 32,7 |
Якщо 1990 року за межею бідності перебувало 13,8%, то 1994 року — 62,3%, а у злиденних умовах — 32,7%.
Як бачимо, структурні й типологічні групування описові; вони характеризують структуру сукупності, виокремлюють характерні риси та особливості, але різняться за рівнем якісних відмінностей між групами.
Скориставшись групуванням, можна також виявити наявність та напрям зв’язку між ознаками, з яких одна розглядається як результат, інша — як фактор, що впливає на результат. Висновок про наявність зв’язку можна зробити на підставі комбінаційного поділу за цими ознаками згідно з характером розміщення частот. Так, за даними табл. 3.3 намір змінити професію найближчим часом мають переважно незадоволені умовами праці (15 із 22), і, навпаки, серед задоволених більшість (26 із 35) зовсім не планує змінювати свій професійний статус.
Таблиця 3.3
КОМБІНАЦІЙНИЙ ПОДІЛ РОБІТНИКІВ
Ступінь задоволеності умовами праці | Чи маєте намір змінити професію? | |||
Так, найближчим часом | Так, у перспективі | Ні | Разом | |
Задоволений | — | |||
Не визначився | ||||
Незадоволений | — | |||
Разом |
Якщо результативна ознака кількісна, для кожної групи за факторною ознакою можна визначити середнє значення результативної ознаки. За наявності зв’язку між ознаками групові середні результативної ознаки систематично змінюються від групи до групи (збільшуються чи зменшуються). Таке групування нази-
вається аналітичним. Очевидно, аналітичне групування докладніше й виразніше, ніж комбінаційний поділ, описує зв’язок між ознаками. Приклад аналітичного групування наведено в табл. 3.4. Основа групування — термін збирання врожаю озимої пшениці після настання повної стиглості зерна (факторна ознака). Кожна група характеризується розміром посівної площі, з якої зібрано врожай, та середньою врожайністю (результативна ознака). Таблиця показує: чим більший термін збирання врожаю, тим менша врожайність і більші втрати зерна. Різниця врожайності між першою і третьою групами становить 20 ц/га.
Таблиця 3.4
ЗАЛЕЖНІСТЬ УРОЖАЙНОСТІ ОЗИМОЇ ПШЕНИЦІ
ВІД ТЕРМІНУ ЗБИРАННЯ
Термін збирання | Збиральна посівна площа, га | Урожайність, ц/га |
Своєчасно | ||
З незначним запізненням | ||
Зі значним запізненням | ||
У цілому по сукупності |
Зауважимо, що поділ групувань на три види певною мірою відносний. Адже часто групування універсальні: одночасно виділяються типи, визначається склад сукупності й виявляється взаємозв’язок між ознаками.
Якщо групувальна ознака неперервна, постає питання про кількість груп та межі кожної з них. Кількість груп залежить від ступеня варіації групувальної ознаки та обсягу сукупності. Так, для дискретної ознаки, діапазон варіації якої обмежений (кількість дітей у сім’ї, тарифний розряд тощо), груп, як правило, стільки, скільки варіант ознаки. У разі значної варіації дискретної ознаки (кількість працюючих на підприємстві, кількість укладених на біржі угод), як і неперервної (стаж роботи працівника, собівартість продукції), діапазон варіації розбивається на m інтервалів.
Орієнтовно оптимальна кількість груп визначається за стандартними процедурами, зокрема за формулою Стерджеса:
m = 1 + 2,30259 lg n,
де n — обсяг сукупності; m — число інтервалів.
Інтервали являють собою каркас групувань. На практиці їх утворюють за трьома формальними принципами: рівності інтервалів; кратності інтервалів; рівності частот.
У структурних і аналітичних групуваннях найчастіше застосовують принцип рівності інтервалів. Ширина кожного інтервалу залежить від діапазону варіації ознаки х та обґрунтованого числа груп (інтервалів) m:
.
Визначаючи межі інтервалів, ширину h доцільно округлювати, самі межі слід позначати з такою точністю, щоб поділ елементів сукупності на групи був однозначним.
Якщо діапазон варіації ознаки надто широкий і поділ значень нерівномірний, беруть нерівні інтервали, зокрема сформовані за принципом кратності, коли ширина кожного наступного інтервалу в k раз більша (менша), ніж попереднього.
Припустимо, що прибутковість активів комерційних банків коливається від 1 до 42%, а прибутковість капіталу — від 11 до 165%. За кожною ознакою утворимо чотири групи (m = 4), скориставшись за прибутковістю активів принципом рівних інтервалів, тобто h = (42 – 1) : 4 » 10, а за прибутковістю капіталу — принципом кратності інтервалів (k = 2). Варіанти розбиття на групи ілюструє табл. 3.5.
Таблиця 3.5
ВАРІАНТИ ФОРМУВАННЯ ІНТЕРВАЛІВ ГРУПУВАНЬ ЗА РІВНЕМ ПРИБУТКОВОСТІ, %
|
Перший та останній інтервали (або один із них) відкриті, тобто мають лише одну межу (верхню чи нижню). За допомогою відкритих інтервалів усі крайні значення ознаки, що варіює, зводяться в одну групу, завдяки чому групування стає компактним. Межі інтервалів визначаються по-різному. У першому варіанті групування верхня межа j-го інтервалу збігається з нижньою межею (j + 1)-го інтервалу. Правило віднесення межових значень ознаки до відповідного інтервалу задають слова, що стосуються відкритих інтервалів. Зокрема, слово «до» в першому інтервалі означає, що нижню межу слід уважати належною, а верхню — не належною інтервалу.
У другому варіанті групування верхня межа j-го інтервалу і нижня межа (j + 1)-го інтервалу різняться між собою. У цьому разі обидві межі вважаються такими, що належать інтервалу.
Інтервали типологічного групування формуються не за математичними принципами, а за соціально-економічним змістом. Межа інтервалу розглядається як умовна межа переходу кількості в нову якість. Число груп залежить від кількості існуючих типів. Наприклад, групуючи чоловіків за ознакою працездатності, застосовують вікові групи, років:
0—15 — особи допрацездатного віку;
16—59 — працездатного;
60 і більше — старші за працездатний вік.
Принцип рівних частот використовують нечасто і переважно в аналітичних групуваннях, щоб уникнути зважування групових середніх (дисперсійний аналіз результатів експерименту).
Групування за однією ознакою називається простим, за двома і більше ознаками — комбінаційним. У комбінаційних групуваннях ознаки ієрархічно впорядковуються за змістом чи за вагомістю.
Групи, утворені за першою ознакою, поділяються на підгрупи за другою, а ті, у свою чергу, можуть поділятися на підгрупи за третьою ознакою і т. д. На кожному етапі поділу використовується лише одна ознака, тобто відбувається послідовне описування груп. Кількість підгруп дорівнює добутку числа групувальних ознак на число градацій за кожною з них. У разі трьох і більше групувальних ознак сукупність стрімко подрібнюється, групи виявляються нечисленними, а характеристики груп — ненадійними.
Альтернативою комбінаційному групуванню є багатовимірне, коли групи утворюються за певною множиною ознак одночасно. Мірою подібності елементів є різні критерії і, як наслідок, — різні методи багатовимірного групування. Найпростішим серед них є групування за інтегральним показником, наприклад за рейтинговою оцінкою. У такому разі багатовимірне групування зводиться до простого.
Іноді доводиться перегруповувати дані, передусім щоб забезпечити порівнянність структур двох сукупностей за однією і тією самою ознакою. Результат перегрупування називають вторинним групуванням. Перегрупування виконують або об’єднанням, або розбиттям інтервалів первинного групування.
Якщо межі інтервалів первинного і вторинного групувань збігаються, частоти (частки) об’єднувальних інтервалів просто підсумовуються. Коли виконується розбиття інтервалу первинного групування, частоти поділяються між новоутвореними групами пропорційно до співвідношення частин довжини початкового інтервалу. Припускається, що всередині інтервалу поділ рівномірний.
Техніку перегрупування даних розглянемо на прикладі поділу працюючих за розміром середньомісячної заробітної плати у двох галузях промисловості (табл. 3.6).
Таблиця 3.6
ПОДІЛ ПРАЦЮЮЧИХ ЗА РІВНЕМ
СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ
Галузь А | Галузь В | ||
Заробітна плата, грн. | Частка працюючих, % | Заробітна плата, грн. | Частка працюючих, % |
До 160 | До 160 | ||
160 — 180 | 160 — 190 | ||
180 — 200 | 190 — 220 | ||
200 — 220 | 220 — 250 | ||
220 — 240 | 250 — 280 | ||
240 і більше | 280 і більше | ||
Разом | Разом |
Результати первинного групування безпосередньо порівняти не можна, оскільки інтервали групування різні: у галузі А ширина інтервалу 20, у галузі В — 30 грн. Перегрупуємо дані, утворивши п’ять груп з інтервалом h = 40 грн. Очевидно, інтервали поділу в галузі А потрібно об’єднати, а в галузі В — розбити. Результати вторинного групування ілюструє табл. 3.7.
Таблиця 3.7
ВТОРИННЕ ГРУПУВАННЯ ПРАЦЮЮЧИХ
ЗА РІВНЕМ СЕРЕДНЬОМІСЯЧНОЇ ЗАРОБІТНОЇ ПЛАТИ
Заробітна плата, грн. | Частка працюючих, % | |
Галузь А | Галузь В | |
До 160 | ||
160 — 200 | 20 + 26 = 46 | |
200 — 240 | 23 + 9 = 32 | |
240 — 280 | ||
280 і більше | — | |
Разом |
Порівнявши частки вторинного групування, побачимо, що в галузі В сукупність працюючих за рівнем заробітної плати більш диференційована. Перегрупуванням даних можна перейти від структурного групування до типологічного.
Ряди розподілу
Після обробки кількісних значень, їх систематизації, ми дістаємо певний цифровий ряд, який називається статистичний ряд. Він має дві форми: ряд розподілу і динамічний ряд.
§ Ряд розподілу – це впорядкований розподіл сукупності на групи за певною варіюючою ознакою, розташованою в певному порядку (зростання, спадання тощо).
Виділяють атрибутивні і варіаційні ряди розподілу.
Ряд розподілу одиниць сукупності, в основу якого покладено якісні ознаки називається атрибутивним. Прикладом атрибутивного ряду розподілу може бути розподіл населення на міське і сільське.
Ряд розподілу одиниць сукупності за ознакою, що має кількісне вираження, називається варіаційним.
Варіаційний ряд розподілу має свої особливості. Він складається з двох елементів: варіантів і частот.
§ Варіантами називають числові значення розмірів кількісної ознаки. Числа, які відповідають цим варіантам, називаються частотами. Частоти можуть виражатися як в абсолютних, так і у відносних одиницях (напр. відсотках).
Відповідно до варіації ознаки, варіаційні ряди розподілу можуть бути дискретними і інтервальними. В дискретному ряді розподілу кількісна ознака приймає тільки цілі значення. Коли значення варіантів ряду виражено у вигляді інтервалу, такий ряд розподілу називається інтервальним.
Групи сімей - варіант | Кількість сімей - частота | Акумулятивна частка |
§ Накопичення часток по мірі зростання (спадання) ознаки називається акумулятивна частка.
За характером розподілу варіаційні ряди можуть бути симетричні і асиметричні.
Ряд розподілу, де частоти спочатку наростають, а потім спадають, називається симетричним. Ряд розподілу, в якому частоти розташовані несиметрично від середини, називається асиметричним або скошеним.
Графічно ряди розподілу зображаються у вигляді гістограми або полігону (де ось OY – результативна ознака, ось OX – факторна ознака):
До характеристик варіації відносяться наступні показники: розмах варіації, середнє лінійне відхилення, середній квадрат відхилення, середнє квадратичне відхилення, коефіцієнти варіації.
Задача №1. Нехай маємо дві бригади із такою продуктивністю праці працівників:
1) 29, 31, 33, 30, 34;
2) 31, 32, 37, 27, 30.
Необхідно порівняти ці дві бригади.
Спочатку знайдемо середню продуктивну працю по кожній бригаді:
Розмах варіації становить різницю між мінімальним і максимальним значенням ознаки: R = xmax – xmin.
В нашому випадку:
R1 = 34 – 29 = 5
R2 = 37 – 27 = 10
Закономірність розподілу
Статистична сукупність формується під впливом причин та умов, з одного боку — типових, спільних для всіх елементів сукупності, а з іншого — випадкових, індивідуальних. Ці чинники взаємозв’язані, а їх спільна взаємодія визначає як індивідуальні значення ознак, так і розподіл останніх у межах сукупності. Характерні властивості структури статистичної сукупності відбиваються в рядах розподілу.
Ряд розподілу складається з двох елементів: варіант —
значень групувальної ознаки xj та частот (часток) fj. Саме у співвідношенні варіант і частот виявляється закономірність розподілу.
Залежно від статистичної природи варіант ряди розподілу поділяються на атрибутивні та варіаційні. Частотними характеристиками будь-якого ряду є абсолютна чисельність j-ї групи — частота fj та відносна частота j-ї групи — частка dj. Очевидно, що , а , або 100%. Додатковою характеристикою варіаційних рядів є кумулятивна частота (частка), що являє собою результат послідовного об’єднання груп і підсумовування відповідних їм частот (часток). Кумулятивна частота (частка ) характеризує обсяг сукупності зі значеннями варіант, які не перевищують xj (табл. 5.1).
Варіаційний ряд може бути дискретним або інтервальним. Якщо варіаційний ряд інтервальний з нерівними інтервалами, то його частотні характеристики непорівнянні. Тоді, аналізуючи розподіл, використовують щільність частоти (частки) на одиницю інтервалу, тобто або .
Таблиця 5.1
ЧАСТОТНІ ХАРАКТЕРИСТИКИ РЯДІВ РОЗПОДІЛУ
Значення варіант хj | Частоти fj | Частки dj | Кумулятивні | |
частоти | частки | |||
х1 | f1 | d1 | f1 | d1 |
х2 | f2 | d2 | f1 + f2 | d1 + d2 |
х3 | f3 | d3 | f1 + f2 + f3 | d1 + d2 + d3 |
... | ... | ... | ... | ... |
хm | fm | dm | ||
Разом | ´ | ´ |
Як приклад розглянемо розподіл фірм регіону за рівнем фондоозброєності праці в розрахунку на одного працюючого (табл. 5.2). Згідно зі значеннями кумулятивних часток на більшості фірм (50,6%) фондоозброєність праці не перевищує 5 млн грн. Щільність розподілу зі зростанням ширини інтервалу зменшується.
Таблиця 5.2
РОЗПОДІЛ ФІРМ РЕГІОНУ ЗА РІВНЕМ ФОНДООЗБРОЄНОСТІ ПРАЦІ
Фондоозброєність праці, млн грн. | Частка dj, % | Кумулятивна частка | Щільність частки gj, % |
1 — 2 | 13,4 | 13,4 | 13,4 |
2 — 5 | 37,2 | 50,6 | 12,4 |
5 — 10 | 23,5 | 74,1 | 4,7 |
10 — 20 | 16,8 | 90,9 | 4,7 |
20 — 50 | 9,1 | 100,0 | 0,3 |
Разом | ´ | ´ |
Кожний розподіл має характерні особливості. Найтиповіші з них подано в рядах розподілу (табл. 5.3). Групувальною ознакою є тарифний розряд, значення якого варіюють у межах від 2 до 6. Припустимо, що розподіли робітників умовних професій за рівнем кваліфікації різні. Так, у рядах А і В розподіл частот однаковий, але центри розподілу, навколо яких групуються індивідуальні значення, різні: в ряду А — 5-й розряд, в ряду В — 4-й. У рядах С, D, К центр розподілу такий самий, як і в ряду В, — 4-й, проте форма розподілу різна. Ряди В і С різняться межами варіації; у рядах С і D при однакових межах варіації і симетричному розподілі частот різний ступінь витягнутості вздовж осі ординат, різна крутизна розподілу: у розподілі С лише 36% обсягу сукупності групується навколо центра, у розподілі D — 76% обсягу. Розподіл К відрізняється від інших асиметричністю відносно центра.
Таблиця 5.3
РОЗПОДІЛ РОБІТНИКІВ ЗА РІВНЕМ КВАЛІФІКАЦІЇ
Тарифний розряд | Професії | ||||
А | В | С | D | К | |
— | — | ||||
— | |||||
— | |||||
Разом |
Отже, поглиблений аналіз закономірностей розподілу передбачає характеристику зазначених особливостей сукупності, зокрема:
а) визначення типового рівня ознаки, який є центром тяжіння;
б) вимірювання варіації ознаки, ступеня згрупованості індивідуальних значень ознаки навколо центра розподілу;
в) оцінювання особливостей варіації, ступеня її відхилення від симетрії;
г) оцінювання нерівномірності розподілу значень ознаки між окремими елементами сукупності, тобто ступінь їх концентрації.
Базою аналізу закономірностей розподілу є варіаційний ряд — дискретний або інтервальний — з рівними інтервалами.
Характеристики центру розподілу
Центром тяжіння будь-якої статистичної сукупності є типовий рівень ознаки, узагальнююча характеристика всього розмаїття її індивідуальних значень. Такою характеристикою є середня величина . За даними ряду розподілу середня обчислюється як арифметична зважена; вагами є частоти fj або частки dj:
, ,
де j — номер групи; m — число груп.
В інтервальних рядах, припускаючи рівномірний розподіл елементів сукупності в межах j-го інтервалу, як варіанту використовують середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою самою, як сусіднього закритого інтервалу.
Дані для розрахунку середнього рівня в інтервальному ряду розподілу наведено в табл. 5.4. Згідно з розрахунками, у середньо-
му на одного члена домогосподарства припадає = 1800 : 200 =
= 9 м2 житлової площі. Це типовий рівень забезпеченості населення житлом.
Таблиця 5.4
РОЗПОДІЛ ДОМОГОСПОДАРСТВ МІСТА ЗА РІВНЕМ
ЗАБЕЗПЕЧЕНОСТІ ЖИТЛОМ
Житлова площа на одного члена домогосподарства, м2 | Кількість домо- господарств fj | xj | xj fj | Кумулятивна частка |
До 5 | ||||
5 — 7 | ||||
7 — 9 | ||||
9 — 11 | ||||
11 — 13 | ||||
13 — 15 | ||||
15 і більше | ||||
Разом | ´ | ´ |
Окрім типового рівня важливе значення має домінанта, тобто найбільш поширене значення ознаки. Таке значення називають модою (Мо). У дискретному ряду моду визначають безпосередньо за найбільшою частотою (часткою). Наприклад, якщо депозитна ставка у восьми комерційних банків — 12% річних, а в двох — 10%, то модальною є ставка 12%.
В інтервальному ряду за тим самим принципом визначається модальний інтервал, а в разі потреби конкретне модальне значення в середині інтервалу обчислюється за інтерполяційною формулою
,
де та h — відповідно нижня межа та ширина модального інтервалу, , , — частоти (частки) відповідно модального, передмодального та післямодального інтервалів.
За даними табл. 5.4 модальним є інтервал 7 — 9, що має найбільшу частоту ; ширина модального інтервалу h = 2; нижня межа х0 = 7; передмодальна частота = 39, післямодальна — = 42. За такого співвідношення частот модальне значення забезпеченості населення житлом:
= 8,1 м2.
Для моди як домінанти число відхилень (х – Мо) мінімальне. Оскільки мода не залежить від крайніх значень ознаки, то її до-
цільно використовувати тоді, коли ряд розподілу має невизначені межі.
Характеристикою центра розподілу вважається також медіана (Ме) — значення ознаки, яке припадає на середину впорядкованого ряду, поділяє його навпіл — на дві рівні за обсягом частини. Визначаючи медіану, використовують кумулятивні частоти або частки . У дискретному ряду медіаною буде значення ознаки, кумулятивна частота якого перевищує половину обсягу сукупності, тобто (для кумулятивної частки ).
В інтервальному ряду за цим принципом визначають медіанний інтервал, а значення медіани в середині інтервалу, як і значення моди, обчислюють за інтерполяційною формулою:
,
де x0 та h — відповідно нижня межа та ширина медіанного інтервалу; fme — частота медіанного інтервалу; — кумулятивна частота передмедіанного інтервалу.
За даними табл. 5.4 половина обсягу сукупності припадає на інтервал 7 — 9 з частотою = 51; передмедіанна кумулятивна частота = 56. Отже, медіана забезпеченості населення житлом:
м2.
У симетричному розподілі всі три зазначені характеристики центра розподілу однакові: , у помірно асиметричному відстань медіани до середньої втричі менша за відстань середньої до моди, тобто . Саме таке співвідношення характеристик центра розподілу в розглянутому прикладі:
3 (9 – 8,7) = 9 – 8,1.
Медіана, як і мода, не залежить від крайніх значень ознаки; сума модулів відхилень варіант від медіани мінімальна, тобто вона має властивість лінійного мінімуму:
.
Цю властивість медіани можна використати при проектуванні розміщення зупинок міського транспорту, заготівельних пунктів тощо.
Окрім моди і медіани, в аналізі закономірностей розподілу використовуються також квартилі та децилі. Квартилі — це варіанти, які поділяють обсяги сукупності на чотири рівні частини, децилі — на десять рівних частин. Ці характеристики визначаються на основі кумулятивних частот (часток) за аналогією з медіаною, яка є другим квартилем або п’ятим децилем.
У ряду розподілу (див. табл. 5.4) перший квартиль становить 6,7 м2, перший дециль — 5,2 м2, дев’ятий — 13,3 м2 :
;
;
.
Отже, у 25% сімей забезпеченість житлом не перевищує 6,7 м2, серед 10% малозабезпечених найвищий рівень становить 5,2 м2, а серед 10% найбільш забезпечених нижня межа — 13,3 м2.
Характеристики варіації
В одних сукупностях індивідуальні значення ознаки щільно групуються навколо центра розподілу, в інших — значно відхиляються. Чим менші відхилення, тим однорідніша сукупність, а отже, тим більш надійні й типові характеристики центра розподілу, передусім середня величина. Вимірювання ступеня коливання ознаки, її варіації — невід’ємна складова аналізу закономірностей розподілу. Міри варіації широко використовуються у практичній діяльності: для оцінювання диференціації домашніх господарств за рівнем доходу, фінансового ризику інвестування, ритмічності роботи підприємств, сталості врожайності сільськогосподарських культур тощо.
На основі характеристик варіації оцінюється інтенсивність структурних зрушень, щільність взаємозв’язків соціально-економічних явищ, точність результатів вибіркового обстеження.
Для вимірювання та оцінювання варіації використовуються абсолютні та відносні характеристики. До абсолютних належать: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики подаються низкою коефіцієнтів варіації, локалізації, концентрації.
Варіаційний розмах R — це різниця між максимальним і мінімальним значеннями ознаки: R = xmax – xmin. Він характеризує діапазон варіації, наприклад родючості ґрунтів у регіоні, продуктивності праці в галузях промисловості тощо. Безперечною перевагою варіаційного розмаху як міри варіації є простота його обчислення й тлумачення.
Проте, коли частоти кр
Дата добавления: 2016-07-27; просмотров: 7033;