Методы классификации информации


 

Классификация–это система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Применительно к информации существуют информационные объекты.

Пример. В университете, например, существуют объекты: информация о студентах – объект «студент»; информация о преподавателях – объект «преподаватель»; информация о факультетах – объект «факультет» и т.д.

Свойства информационного объекта определяются реквизитами. Реквизиты представляются либо числовыми данными, например, все, стоимость, год, либо признаками, например, цвет, марка машины, фамилия.

Реквизит – логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

Пример. Информация в студенте представлена следующими реквизитами: фамилия, имя, отчество, пол, год рождения, место рождения, адрес домашний, факультет и т.д.

Классификация нужна для выявления общих свойств информационного объекта, а также для разработки правил (алгоритмов) и процедур обработки информации. При классификации необходимо соблюдать следующие требования:

-полнота охвата объектов рассматриваемой области;

-однозначность реквизитов;

-возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональе классификаторы. Например, классифицированы отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.

Классификатор – систематизированный свод наименований и кодов классификационных группировок.

Код – это условное обозначение объекта или явления в виде знака или системы знаков, построенное по определенным правилам.

При классификации пользуются понятием классификационного признака, который позволяет установить сходство или различие объектов.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный.

Иерархический метод классификации устанавливает между классификационными группировками иерархические отношения подчинения, с последовательной детализацией их свойств: класс, подкласс, группа, подгруппа, вид и т.д.

 

0 уровень

 

1уровень

 

2 уровень

 

3 уровень

 

Достоинства:

-простота построения;

-использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки:

-жесткая структура, которая приводит к сложности внесения изменений, т.к. приходится перераспределять все классификационные группировки;

-невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Пример иерархической системы классификации для информационного объекта «факультет»:

 

0 уровень

       
   


1-название ф-та Коммерческий Информационные

(классификационный системы

признак)

2-возраст до 20 лет 20-30 лет свыше 30 лет до 20 лет 20-30 лет свыше 30 лет

                                               
     
                 
     
   
 
 
 


3-пол м ж м ж м ж м ж м ж м ж

                                               
             
           
 


4-наличие детей есть нет есть нет есть нет есть нет есть нет есть нет

у женщин

Метод фасетной классификации основан на множестве независимых признаков. Набор таких признаков может быть произвольным, что позволяет группировать объекты по любому сочетанию признаков. Является одноуровневым, исходное множество объектов разбивается на подмножества классификационных группировок в соответствии со значениями признаков отдельных фасетов. Фасеты независимы между собой.

Схема построения фасетной системы классификации в виде таблицы:

    фасеты
   
значения фасетов   Ф1 Ф2 Ф3 Фi Фn
             
             
             
k              

Достоинства:

-возможность создания большой емкости классификации, т.е. использование большого числа признаков классификации и их значений для создания группировок;

-возможность простой модификации всей структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, т.к. необходимо учитывать все многообразие классификационных признаков.

Пример.

Наименование факультета Возраст Пол Дети
Радиотехнический до 20 лет м есть
Машиностроительный 20-30 лет ж нет
Коммерческий свыше 30 лет    
Информационные системы      
Математический      

Суть дескрипторного метода классификации:

-отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов, среди которых могут находиться синонимы;

-выбранные ключевые слова нормализуются, т.е. из совокупности синонимов выбираются наиболее употребимые;

-создается словарь дескрипторов, т.е. словарь отобранных слов и словосочетаний.

Пример. Объект классификации – успеваемость студентов. Ключевые слова: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Синонимов нет, эти ключевые слова можно использовать как словарь дескрипторов.

Предметная область: учебная деятельность в вузе. Ключевые слова: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, аудитория, лекция, практическое занятие и т.д. Встречаются синонимы. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

 



Дата добавления: 2016-07-22; просмотров: 2161;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.013 сек.