Извлечение информации
Структура информационного процесса
Информация - сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты. Являясь объектом преобразования в ИТ, информация имеет следующие виды:
1) факты – результат наблюдения за источником информации[1] (ИИ), представленный произвольным образом (например, в виде текстовой, речевой, визуальной форме),
2) данные – это факты, дискретно описывающие ИИ, т.е. характеризующие отдельные его свойства. Они отличаются высокой степенью структурированности в отличие от более свободных форм, характерных для фактов,
3) знания – это закономерности ИИ (принципы, связи, законы). Они позволяют специалистам ставить и решать определенные задачи. Это итог теоретической и практической деятельности человека, отражающий накопление предыдущего опыта и отличающийся высокой степенью структурированности.
При переносе информации от источника к потребителю (ПИ) она проходит последовательно следующие фазы (говорят – фазы обращения), составляющие информационный процесс (рис. 1.1):
1) извлечение - это переход от реальной предметной области к ее описанию в некотором виде,
2) обмен - это передача информации на расстояние для организации быстрого доступа к ней,
3) обработка – это любое преобразование значений или структур информации,
4) накопление – это скапливание и долговременное сохранение информации,
5) представление - это отображение информации потребителю в удобной для него форме.
Рис. 1.1. Структура информационного процесса
Извлечение информации
Извлечение информации – это процесс ее прохождения от ИИ к сигналу, целью которого является получение и фиксация сведений о некоторых объектах, их свойствах, структурных связях между ними, функциях, выполняемых этими объектами, над ними или для них.
Извлечение информации может производиться или человеком (наблюдателем, аналитиком, ИТ-специалистом), или с помощью технических средств и систем, т.е. аппаратно. Тогда в первом случае этот процесс называется сбором информации, во втором – восприятием информации.
Сбор информации
В силу того, что информационные ресурсы включают факты, данные и знания, схема сбора информации может иметь вид рис. 1.2:
Рис. 1.2. Схема сбора информации
По связи 1 наблюдаются и неформально описываются факты, имеющие место в предметной области. Поскольку ИИ безграничен, факты должны выявляться в соответствии с важностью отдельных параметров для решения требуемой задачи. Для корректной реализации этой фазы наблюдатель должен обучаться, профориентироваться и специализироваться. По связи 6 эти факты могут фиксироваться на некотором носителе для накопления, обработки или обмена (это регистрация данных – см. п. 1.1.1.2).
Пусть, например, разрабатывается ИТ для задачи регулирования деканатом контингента студентов после сессии, т.е. для составления списков студентов на отчисление и на перевод в следующий семестр на основании результатов сдачи сессии. Для автоматизации этой задачи ИТ-специалист выявляет в предметной области (т.е. в деканате) следующие факты:
· студент Х имеет оценку 2 по информатике – он отчисляется,
· студент Y имеет оценку 2 по физике – он отчисляется,
· студент Z не имеет оценки 2 ни по одной дисциплине – он переводится в следующий семестр.
По связи 2 факты обобщаются, структурируются и превращаются в данные (это формирование данных – см. п. 1.1.1.1). При этом в предметной области выделяются понятия и их свойства, устанавливаются связи между отдельными понятиями, определяются последовательности событий во времени.
Для нашего примера на основании обобщения фактов выделяются понятия со свойствами (т.е. происходит структурирование фактов):
Понятие свойства
студент фамилия студента
дисциплина название дисциплины
Устанавливается связь между понятиями «дисциплина» и «студент»: она формирует понятие «экзамен» со свойством «оценка»:
Дата добавления: 2017-05-02; просмотров: 2141;