Типы и виды данных. Шкалы измерения


При статистическом исследованиисоциально-экономических процессов мы встречаемся с двумя типами данных: пространственные данные (cross-sectional data) и временные ряды (time-series data).

Примером пространственных данных является, например, набор сведений (объем производства, количество работников, доход и др.) по разным фирмам в один и тот же момент времени (пространственный срез). Пространственные данные часто используются для построения моделей классификации, регрессионных моделей.

Примерами временных данных могут служить ежеквартальные данные по инфляции, средней заработной плате, национальному доходу за последние годы, ежедневный курс доллара США на ММВБ и т.п. Отличительной чертой временных данных является то, что они естественным образом упорядочены во времени. Часто наблюдения в близкие моменты времени бывают зависимыми.

Наиболее информативными видами представления данных являются временные ряды, многоугольники и гистограммы распределения (частотные и кумулятивные), диаграммы (подробный анализ видов представления данных будет представлен в выпуске 2 данного тома).

Вид представления данных определяется типом шкалы измерения. Различают четыре основные вида данных, отличающихся по тому, как наблюдаемый объект измеряется или описывается (табл. 2.1).

Таблица 2.1

Основные виды данных

 

Вид данных Примеры
1. Данные классификации (номинальные) Лица, классифицированные по полу, национальности. Регионы РФ, классифицированные по принадлежности к центральным федеральным округам.
2. Ранжированные (ординарные, порядковые) Ранжирование регионов по инвестиционной привлекательности и т.д.
3. Данные измерения на интервальной шкале Температура объекта (шкала с произвольной нулевой точкой и масштабом)
4. Данные измерений на относительной шкале Измерения веса, высоты, объема и т.п. (шкалы с произвольным масштабом, но фиксированной нулевой точкой)

Номинальная шкала (шкала наименований, классификационная шкала) является наиболее «слабой» качественной шкалой, по которой объектам дается некоторый признак. Этот тип шкал соответствует простейшему виду измерения, при котором шкальные значения используются лишь как имена объектов. Единственная цель таких измерений — выявление различий между объектами разных классов. Однако не следует пренебрегать значением этих имен; так, одной из задач кластерного анализа является назначение удачных названий выявленных групп близких по совокупности свойств объектов.

Шкала называется ранговой (шкала порядка), если множеству измеряемых объектов можно присвоить монотонно возрастающие шкальные значения. Тем самым допускается не только номинальное различение объектов, но и их упорядочение по измеряемым свойствам. Таковы балльные, рейтинговые оценки.

Измерение в шкале порядка может применяться в различных ситуациях:

— необходимо упорядочить объекты во времени или пространстве, когда интересуются не сравнением степени выраженности какого-либо свойства объектов, а лишь их взаимным пространственным или временным расположением;

— необходимо упорядочить объекты по степени выраженности какого-либо их свойства, при этом не требуется производить его точное измерение;

— какое-либо свойство в принципе измеримо, но измерение невозможно по причинам практического или теоретического характера.

Шкалы интервалов являются одним из наиболее важных типов шкал. Их отличительная особенность — возможность положительного линейного преобразования, когда меняется масштаб и начало отсчета, но сохраняется направленность измеряемого свойства. Классическим примером служат температурные шкалы Цельсия t°C и Фаренгейта t°F, связанные линейным преобразованием шкальных значений

t °F = 1,8 t °C + 32. (2.1)

Шкалы интервалов сохраняют не только различие и упорядочение объектов, но и отношение «расстояний» между парами. Однако отношение самих шкальных значений при этом не сохраняется. Например, в случае температурных шкал Цельсия и Фаренгейта нельзя сказать, что вода, нагретая до 80 °C вдвое горячее, чем вода при 40 °C, поскольку в шкале Фаренгейта соотношение температур воды будет уже другим: 176 °F и 104°F соответственно. В то же время отношение разностей этих температур в обеих шкалах сохраняется. Так, если отсчитывать разность температур двух упомянутых объектов в обеих шкалах относительно третьего объекта, охлажденного до 0 °C (32 °F), то отношение разностей в обеих температурных шкалах составляет одну и ту же величину 2:

(80 °C - 0 °C)/(40 °C - 0 °C) = (176 °F - 32 °F)/( 104 °F - 32 °F) = 2.

Частным случаем шкал интервалов являются шкалы отношений, когда нулевая точка означает отсутствие измеряемого свойства. Шкалы отношений сохраняют не только отношения свойств объектов, но и отношения «расстояний» между парами объектов. Примерами измерений в шкалах отношений являются стоимостные измерения.

Иногда рассматривают также шкалы разностей и абсолютные шкалы. Первые являются частным случаем шкал интервалов; примерами служат измерения прироста продукции в абсолютных единицах, увеличение численности учреждений и т.п. Абсолютные шкалы характеризуются единственностью измерения и применяются, например, для измерения количества объектов.

Шкалы измерения следует учитывать при вычислении средних величин. В общей теории статистики различают структурные и степенные средние. К первым относятся мода и медиана, ко вторым — арифметическая, геометрическая, квадратическая и гармоническая средние.

Наименее информативная номинальная шкала допускает лишь один вид средних — моду. При переходе к более информативной порядковой шкале в моде добавляется медиана как мера центральной тенденции. Эти средние являются частными случаями средних по Коши — функции, ставящей в соответствие совокупности измерений (х1, х2, …, хn) любое число, заключенное между наибольшим и наименьшим членом вариационного ряда.

Обобщением понятия степенных средних является средние по Колмогорову Fyn, задаваемые строго монотонными функциями y:

Fyn (х1, х2, …, хn) = y -1(1/n)S y ( хi), (2.2)

где y -1 — функция, обратная y; хi — значение i-го измерения показателя Х; n — объем выборки. При y(х) = х; ln х; х–1; х2 формула (2.2) определяет соответственно среднее арифметическое, среднее геометрическое, среднее гармоническое и среднее квадратическое.

В шкале интервалов и разностей центральную тенденцию адекватно отражает среднее арифметическое, в шкале отношений — среднее геометрическое, однако среднее геометрическое не рекомендуется применять при обработке данных, измеренных в шкале интервалов и разностей. В абсолютной шкале можно пользоваться любым средним, т.е. с усложнением типа шкалы измерения число средних, адекватных в этой шкале, увеличивается.

 



Дата добавления: 2018-05-10; просмотров: 3068;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.008 сек.