Общая постановка проблемы обработки информации


В общем, философском понимании информация представляет собой отображение (представление) свойств окружающего нас мира субъектом познания этого мира (человеком, роботом, другими разумными существами). Поскольку субъекты ограничены во времени и пространстве, а окружающий мир, напротив, бесконечен, отображение мира субъектом не может иметь значение «один к одному». (т.е., в процессе познания невозможно умножение миров), а по необходимости является сильно сокращенным по сравнению с реальным миром.

Основные принципы такого сокращения следующие:

1) Отображаются только наиболее устойчивые, постоянные и общие аспекты окружающего нас мира.

2) Отображаются только те свойства мира, которые представляют практический интерес для субъекта отображения.

3) Используются специальные языки (естественного, специальных, включая языки физики и математики) для краткого представления сложных явлений.

Таким образом, информация представляет собой находящееся в голове у субъекта отображение наиболее устойчивых и важных для субъекта свойств окружающего мира, выраженное с помощью какого-либо языка или совокупности языков.

Форма представления информации обусловлена следующими требованиями.

Во-первых, необходимо отобразить взятые в отдельности наиболее важные элементы окружающего мира. При этом учитываются как постоянные составляющие окружающего нас мира, так и происходящие в нем изменения. У человека это деление выражено уже на уровне основных, базовых частей речи: для выражения постоянных аспектов мира используются существительные, изменений – глаголы. Постоянные составляющие мира в общем случае называются объектами, компонентами, элементами, инвариантами и т.п. Изменения в мире представляются с помощью связей, функций, параметров и т.п. понятий.

Во-вторых, необходимо учесть, что элементы окружающего нас мира не существуют изолированно, а взаимодействуют друг с другом, образуя некоторые целостные системы. Для отображения взаимосвязанности элементов в окружающем мире используются схемы, гештальты, образы, фреймы, модели и т.п. понятия.

Целостное представление мира или какой-либо предметной области (части мира, выделенной в определенных познавательных целях) в виде схемы или модели состоит из двух основных типов элементов: объектов и связей между ними.

1.2. Основные типы задач по обработке информации

В общем случае схемное или модельное представление какой-либо предметной области выглядит следующим образом:

 
 

 


Примечания: прямоугольниками представлены выделенные в выбранной предметной области объекты;

- сплошные стрелки представляют связи между объектами в рамках данной предметной области;

- пунктирные стрелки представляют связи с объектами вне данной предметной области.

Рис.1.1. Общее представление выбранной предметной области (системы)

 

В зависимости от специфики предметной области и места на схеме (в модели) можно выделить следующие основные классы задач по обработке информации:

1) С одним объектом однотипными связями связано большое количество других объектов:

 
 

 

 


. . ……….

 

Рис.1.2. Схема с множеством однотипных связей

 

Например, такой схемой можно представить отношения между предприятием и его клиентами, предприятием и его сотрудниками с точки зрения оплаты труда или получения социальных льгот и т.д. Эти схемы на практике принято представлять в виде таблиц. Набор таблиц, описывающих работу предприятия в целом, составляет базу данных предприятия. Такого рода информацию, описывающую связи между базовым объектом и множеством однотипных объектов, принято называть данными.

Однако во многих случаях работа с информацией не может быть описана такой простой схемой.

2) Требуется установить или уточнить качественные или численные значения отдельно взятой связи или связей между объектами предметной области (см. рис.1.1.). Такая работа может быть достаточно сложной и включать в себя привлечение дополнительной информации, сложные математические расчеты, статистические оценки, прогнозирование и т.д. В случае, когда для установления значения связей, требуется сложная обработка информации, речь идет уже скорее о знаниях, чем о данных.

3) Оптимизация качественных и численных показателей, характеризующих объекты и связи предметной области в целом (рис.1.1.). Это классическая задача моделирования, она может быть решена с помощью различных методов оптимизации, методов имитационного моделирования и др. Информацию о способах и вариантах оптимизации или наиболее экономного представления предметной области мы называем знаниями. Задачи этого класса могут быть достаточно сложными и требовать высокой квалификации исполнителя. В частности, такого рода задачи зачастую решаются при написании дипломной работы или инженерных расчетах.

4) Объекты окружающего нас мира связаны между собой самыми разнообразными связями. Поскольку объектов очень много и они связаны каждый с каждым, то теоретически пространство объектов является бесконечным, а пространство связей между ними - бесконечномерным. Поэтому на практике мы должны выбрать ограниченное число объектов и связей между ними. Проблема состоит в том, что не существует некоей однозначно определенной иерархии важности объектов и связей между ними – подобного рода иерархия может быть установлена только с точки зрения той или иной задачи или проблемы. Задачи такого рода плохо формализуемы и в настоящее время могут быть решены (более или менее удачно) только человеком. Фактически в процессе решения этого класса задач мы приводим нашу проблему к задаче предыдущего (третьего) типа.

Задачи последненго класса решаются специалистами высокого уровня, новаторами, а также при работе над кандидатскими и докторскими диссертациями.

 

1.3. Классификация инструментальных средств обработки информации

В настоящее время существует целый арсенал средств и методов для обработки данных и знаний. Как правило, обработка информации не сводится к использованию того или иного отдельно взятого метода, а представляет собой многоуровневую и многоэтапную систему различных взаимосвязанных и взаимообусловливающих методов. В зависимости от уровня сложности все методы обработки информации, используемые на уровне экономической или социально-экономической системы, можно представить следующей приблизительной последовательностью:

1) Базы данных, точнее, записи базы данных – максимально простое и однородное представление информации в виде набора классов объектов и стандартизованных связей между однотипными объектами. Используется преимущественно для представления первичной информации о хозяйственной деятельности фирм.

2) OLTP (On-Line Transaction Processing) – оперативная обработка транзакций (близко к нашему понятию хозяйственных операций) или выполнение транзакций в режиме реального времени. С точки зрения обработки информации суть транзакции сводится к изменению записей (значений параметров объектов) базы данных.

3) Data Warehousing (хранилище данных) – упорядоченные и систематизированные данные, организованные в виде, удобном для последующего анализа, определения связей между различными классами данных, обнаружения закономерностей, прогнозирования и т.п. Идеологию хранилищ данных можно рассматривать как развитие классических баз данных с целью более быстрого и полного извлечения аналитической информации (знаний) из имеющихся данных.

4) OLAP (On-Line Analysis Processing) – системы оперативной аналитической обработки данных, представленных в хранилищах данных. Такой анализ проводится на основе использования многомерной модели базы данных (многомерных кубов). Преимущества – гибкость и возможность оперативного анализа взаимосвязей между любым набором параметров, содержащихся в базе данных.

5) Data Mining (наиболее близкий смысловой эквивалент – извлечение знаний) - представляет собой набор самых различных методов, предназначенных для извлечения новых знаний из баз и хранилищ данных, а в развитых вариантах и из других типов и источников представления информации (см. тему 2 данного курса лекций).

6) Интеллектуальные методы обработки информации: нейросетевые технологии, генетические алгоритмы, методы группового учета аргументов, называемые также методами искусственного интеллекта – позволяют решение ряда важных классов задач, удовлетворительное решение которых с помощью средств классической математики невозможно (см. детальнее темы 10-12).

7) Обработка текстов – включает в себя представление текстовой информации в «концентрированном» виде, более удобном для выполнения определенного круга задач, в частности, схематизации знаний, последующего компьютерного поиска нужной информации и др. (см. детальнее в теме 3).

8) Инженерия знаний – суть метода заключается в использовании баз знаний, в которых, с одной стороны, информация представлена в гораздо более удобном для последующего анализа виде, чем в базах данных, а, с другой, допускает использование однотипных преобразований с помощью компьютера. Базы знаний широко используются в экспертных системах (составляя, по сути, их ядро), системах поддержки принятия решений, а в последние годы – и в системах обработки экономической информации.

9) Моделирование объектов, событий, ситуаций и т.п. человеком с использованием различных техник и типов моделей – подробнее см. темы 8-9 и 13-14.

10) Экспертные системы – представляют собой программные комплексы, предназначенные для решения не полностью алгоритмизированных задач; могут также использоваться в режиме диалога в качестве советующих, справочных и т.п. информационных систем, позволяющих человеку принимать более качественные решения (см. детальнее тему 17).

11) Системы поддержки принятия решений (СППР) – это системы, включающие в себя всевозможные программные методы анализа и обобщения информации, средства наиболее удобного и концентрированного представления информации, специалистов-аналитиков и предназначенные для помощи в принятии квалифицированных решений руководителям (см. детальнее тему 18). С темой СППР тесно связаны концепции ситуационных комнат и ситуационных центров, представляющих собой дальнейшее развитие концепции СППР, реализованное с использованием всех возможных методических, технических, программных и иных средств и обеспечивающих максимально возможную помощь руководителям в принятии решений в сложных ситуациях, либо ситуациях, где цена ошибки очень велика (см. детальнее тему 20).

12) Различные методы коллективного обсуждения и решения проблем, в частности, работа коллектива экспертов, различные варианты мозгового штурма, организационно-деятельностные игры (или как вариант деловые, имитационные и т.д. игры) – но рассмотрение этих вопросов выходит за рамки данного курса лекций.

 



Дата добавления: 2017-03-12; просмотров: 1956;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.013 сек.