Группировка статистических данных


Изучаемые статистикой массовые явления и процессы протекают в качественно однородных совокупностях. Группировка – это разбиение совокупности на группы по какому-либо признаку. С точки зрения отдельных единиц совокупности, группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Интервалы бывают:

- равные, когда разность между максимальным и минимальным значениями в каждом интервале одинакова;

- неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

- открытые, когда имеются только либо верхняя, либо нижняя границы;

- закрытые, когда имеются и нижняя и верхняя границы.

Среди простых группировок особо выделяют ряды распределения. Ряд распределения – это группировка, в которой для характеристики групп применяется один показатель – численность группы.

Ряды, построенные по атрибутивному признаку, называют атрибутивными. Ряды распределения, построенные по количественному признаку, называют вариационными. Числовые значения признака, встречающиеся в данной совокупности, называют вариантами значений (x). Число повторений отдельных вариант называют частотой повторений (f). В тех случаях, когда число вариантов дискретного (прерывного) признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения признака у отдельных единиц могут вообще не повторяться, строятся интервальные ряды распределения.

При построении интервальных рядов распределения необходимо, прежде всего, установить число групп (интервалов), на которое следует разбить все единицы изучаемой совокупности.

Определение величины интервала h для построения вариационного ряда с равными интервалами производится следующим образом:

1) вычисляется разность между максимальным и минимальным значениями признака первичного ряда (так называемый размах вариации, R):

R = Xmax – Xmin; (2.1)

2) размах вариации делится на число групп k, т. е. h = R / k.

Число групп можно приближенно определить по формуле Стэрджесса:

k = 1+3,322 lg n, (2.2)

где n – число изучаемых единиц совокупности.

Указанное выражение часто оказывается дробной величиной, которую округляют до целого числа.

Величина интервала должна определяться в соответствии с точностью данных наблюдения: если исходные данные представлены целыми числами, то рассчитанная величина округляется до ближайшего целого числа; если данные представлены с точностью до 0,1, то величина интервала округляется до целых с десятыми и т. д. (здесь округление производится в большую сторону).

Знание величины интервала позволяет определить границы всех интервалов ряда распределения. Нижнюю границу первого интервала целесообразно принимать равной минимальному значению признака. Рассмотрим построение ряда распределения по данным о среднегодовой стоимости основных промышленно-производственных фондов 20 фирм нефтяной отрасли (млн. долл.): 3,7; 4,3; 6,7; 5,6; 5,1; 8,2; 4,6; 5,7; 6,4; 5,9; 5,2; 6,2; 6,3; 7,2; 7,9; 5,8; 4,9; 7,6; 7,0;6,9.

Определяем количество групп интервального вариационного ряда: k ≈ 1 + 3,322 lg 20 = 1 + 3,322 · 1,301 = 5,32.

Округляя, получим число групп, равное 5.

Определим величину интервала:

h = R / k = (X max – X min) / k = (8,2 – 3,7) / 5 = 0,9.

Величина интервала составляет 0,9 млн. долларов.

В результате группировки получим ряд распределения предприятий по среднегодовой стоимости основных промышленно-производственных фондов, представленный в виде интервалов с соответствующей численностью. Полученные данные представлены в табл. 2.1.

Таблица 2.1

Среднегодовая стоимость основных промышленно- производственных фондов (млн. долларов) Число предприятий  
3,7 – 4,6 4,6 –5,5 5,5 – 6,4 6,4 – 7,3 7,3 – 8,2
Итого

 

Задача 2.1

Имеются следующие технологические показатели СНДГУ – 2 по скважинам Самотлорского месторождения.

Таблица 2.2

Номер скважины Обводненность, % Номер скважины Обводненность,%
33,4 53,4 62,5 80,7 87,2 64,3 93,0 70,6 32,9 78,3 10,9 38,7 45,1 3308б 4111б 7256б 80926г 8188б 49,5 13,2 56,1 54,4 31,1 64,1 44,5 36,1 33,7 8,0 40,6 32,9 44,5 9,6

 

Требуется произвести группировку скважин по проценту обводненности, образуя пять групп с равными интервалами. По каждой группе подсчитайте число скважин, входящих в данный интервал. Результаты оформить в виде таблицы.

Задача 2.2

Имеются следующие данные по 25 предприятиям нефтяной отрасли промышленности по добыче нефти и газа за первое полугодие 2003 года:

Таблица 2.3

Интегрированные и многопрофильные нефтегазовые компании Добыча, тыс.т
Тэбукнефть Байтэк – Силур Битран Турсунт Волглдеминойл Варандейнефтегаз Бовэл Полярное Сияние Компания Нефтегаз Геойлбент Лимитед Белые Ночи Несугнефть Башсибнефть Обьнефтегеология Славнефть – Нижневартовск Ульяновскнефть Соболь Нафта – Ульяновск Югнефтегаз Роснефть – Ставропольнефть Роснефть – Краснодарнефтегаз Роснефть – Сахалинморнефтегаз НК ЮКОС Сибнефтьполен Сибнефть – Югра 658,0 338,2 280,1 153,2 245,9 171,2 192,7 681,0 458,7 452,0 443,4 461,2 426,7 242,5 255,3 169,2 247,9 147,4 152,2 580,9 769,0 940,8 987,4 758,2 299,3

 

Необходимо произвести группировку предприятий по добыче нефти, образовав шесть групп с равными интервалами и численностью предприятий, соответствующей каждому интервалу. Результаты оформить в виде таблицы.

Задача 2.3

Имеются следующие данные по бурению скважин в странах Ближнего Востока и в странах Африки за 2002 год:

Таблица 2.4

Страна Число скважин
Катар Сирия Турция Кувейт Алжир Йемен Конго Экваториальная Гвинея Ливия Габон Нигерия Судан Тунис Иран ОАЭ – Абу-Даби Нейтральная Зона Египет ОАЭ – Дубай

 

Необходимо произвести группировку стран по количеству пробуренных скважин, определив число групп по формуле Стэрджэсса. Подсчитайте число стран, соответствующее каждому интервалу. Результаты оформить в виде таблицы.

Задача 2.4

Имеются данные по странам, экспортирующим нефть в США.

Необходимо произвести группировку стран по объему экспорта нефти в США, образовав четыре группы с равными интервалами, и подсчитать число стран, входящих в каждый интервал. Результаты оформить в виде таблицы.

Таблица 2.5

Страна – экспортер Объем поставок (млн. баррелей)
Австралия Алжир Аргентина Бразилия Вьетнам Габон Гватемала Индонезия Йемен Камерун Китай Конго Россия Тринидад и Тобаго Эквадор Экваториальная Гвинея

Задача 2.5

Имеются следующие показатели эксплуатации добывающих скважин:

Таблица 2.6

Номер скважины Дебит нефти, т / сут. Номер скважины Дебит нефти, т / сут.
12,6 13,7 44,2 31,3 25,7 17,0 15,6 31,4 10,6 9,8 65,2 18,3 36,7 7,6 26,3 9,6 19,2 18,1 5,2 26,2 22,5 47,1

Требуется произвести группировку скважин по дебиту нефти, образуя пять групп с равными интервалами. По каждой группе подсчитать число скважин. Результаты оформить в виде таблицы.

Задача 2.6

Имеются данные по объему инвестиций, вкладываемых в месторождения Коми, Урало-Поволжья, Западной Сибири.

Таблица 2.7

Месторождение Капитальные вложения в обустройство, млн. долл.
Приобское Восточно-Прибрежное Ен-Яховское Соленинское Белокаменное Красноленинское Талинское Ем-Еговское Каменное Мамонтовское Северо-Кальчинское Кальчинское Сомотлорское Верх-Тарское Самбурское Восточно-Харьягинское Лебяжье Черногорское Юрупченское Перевальное Южно-Комсомольское Троянинское 940,0 540,8 100,0 296,0 123,6 759,4 123,6 173,6 462,2 356,9 122,2 432,6 461,9 834,2 115,6 185,6 926,5 412,3 298,7 568,2 402,8 296,3

 

Требуется произвести группировку месторождений с равными интервалами по объему инвестиций, вкладываемых в их обустройство. Подсчитайте число месторождений, входящих в интервалы. Результаты оформите в виде таблицы.

 



Дата добавления: 2016-10-18; просмотров: 2330;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.011 сек.