Системы классификации информации.


Для кодирования объектов необходимо их упорядочить по некоторым признакам. Результат упорядоченного распределения объектов заданного множества носит название классификации, а совокупность правил распределения объектов множества на под­множества называется системой классификации. Процесс распре­деления объектов классификации в соответствии с принятой сис­темой классификации носит название процесса классифицирова­ния. То свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с дру­гими объектами классификации, называется признаком классифи­кации. Множество или подмножество, объединяющее часть объек­тов классификации по одному или нескольким признакам, носит название классификационной группировки.

Основанием классификации называется признак, по которому ведется разбиение множества на подмножества на определенной ступени классификации. Ступень классификации - это результат очередного распределения объектов одной классификационной группировки. Уровень классификации - это совокупность класси­фикационных группировок, расположенных на одних и тех же сту­пенях классификации. Глубина системы классификации - это коли­чество уровней классификации, допустимое в данной системе.

Каждая система классификации характеризуется следующи­ми свойствами:

ü гибкостью системы;

ü емкостью системы;

ü степенью заполненности системы (коэффициент заполнен­ности).

Гибкость системы - это способность допускать включение новых признаков, объектов без разрушения структуры клас­сификатора. Гибкость определяется временем жизни (Т) сис­темы.

Емкость системы - это наибольшее количество классифика­ционных группировок, допускаемое в данной системе классифи­кации (Р).

Степень заполненности системы (К) определяется как част­ное от деления фактического количества группировок (Q) на величину емкости системы (Р):

К = Q/P (3.1)

В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная.

Характерными особенностями иерархической системы явля­ются:

ü наличие в системе неограниченного количества признаков классификации;

ü соподчиненность признаков классификации, что выражается разбиением каждой классификационной группировки, обра­зованной по одному признаку, на множество классификаци­онных группировок по нижестоящему (подчиненному) при­знаку.

При построении иерархической системы классификации сна­чала выделяется некоторое множество объектов, подлежащее классифицированию М, для которого определяются полное мно­жество признаков классификации G и их соподчиненность друг другу, затем производится разбиение исходного множества объек­тов на классификационные группировки на каждой ступени клас­сификации (рис. 3.3).

При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:

ü получающиеся на каждом уровне классификационные группировки должны составлять исходное множество объектов М;

ü классификационные группировки Х на каждой ступени не должны пересекаться;

ü классификация на каждой ступени должна проводиться толь­ко по одному признаку (G).

К положительным сторонам данной системы следует отнести логичность, простоту ее построения и удобство логической и арифметической обработки.

Однако эта система характеризуется жесткой структурой классификации, не позволяющей вносить новые признаки или изменятьих последовательность. Гибкость этой системы обес­печивается только за счет ввода большой избыточности в вет­вях, что приводит к слабой заполненности структуры класси­фикатора.

Рис.3.3.Схема построения иерархической системы классификации.

Недостатки, отмеченные в иерархической системе, отсутству­ют в других системах, которые относятся к классу многоаспект­ных систем классификации. Многоаспектная система - это система класси­фикации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная. Фасет - это аспект классификации, который исполь­зуется для образования независимых классификационных груп­пировок.

Фасетная система характеризуется следующими особеннос­тями построения:

ü имеется некоторое множество классифицируемых объектов (М);

ü это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или не­сколькими признаками, образующими фасет Ф;

ü устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач): F=(Ф12,…ФR)

ü определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам (рис. 3.4).

Рис.3.4.Схема построения фасетной системы классификации.

Внутри фасета значения признаков могут просто перечислять­ся по некоторому порядку или образовывать сложную иерархи­ческую структуру, если существует соподчиненность выделенных признаков.

К преимуществам данной системы следует отнести большую емкость системы и высокую степень гибкости, поскольку при не­обходимости можно вводить дополнительные фасеты и изменять их место в формуле. К недостаткам, характерным для данной си­стемы, можно отнести сложность структуры и большую длину кода при использовании соответствующей системы классификации.

Рассмотренные выше системы классификации хорошо приспо­соблены для организации поиска с целью последующей логичес­кой и арифметической обработки информации на ЭВМ.



Дата добавления: 2022-04-12; просмотров: 130;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.007 сек.