Стратегии получения знаний


При формировании поля знаний ключевым вопросом является сам процесс получения знаний, когда происходит перенос компетентности экспертов на инженеров по знаниям. Для названия этого процесса в литературе по ЭС получили распространение несколько терминов: приобретение, добыча, из­влечение, получение, выявление, формирование знаний. В англоязычной специальной литературе в основном используются два термина: acquisition (приобретение) и elicitation (выявление, извлечение, установление).

Термин "приобретение" трактуется либо очень широко — тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС, либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура поля знаний зара­нее закладывается в программу). В обоих случаях термин "приобретение" не касается самого таинства экстрагирования структуры знаний из потока ин­формации о предметной области. Этот процесс описывается понятием "из­влечение ".

Авторы склонны использовать этот термин как более емкий и более точно выражающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний ЭС.

Определение 2.3

Извлечение знаний (knowledge elicitation) — это процесс взаимодействия ана­литика с источником знаний, в результате которого становится явным процесс рассуждений специалиста при принятии решения и структура его представле­ний о предметной области.

Во все времена большинство разработчиков ЭС отмечало, что процесс извлечения знаний остается самым "узким" местом при построении промыш­ленных ЭС. При этом им приходится практически самостоятельно разраба­тывать методы извлечения, сталкиваясь со следующими трудностями [Gaines, 1989]:

Ø организационные неувязки;

Ø неудачный метод извлечения, не совпадающий со структурой знаний в данной области;

Ø неадекватная модель (язык) для представления знаний.

Можно добавить к этому [Гаврилова, Червинская, 1992]:

Ø неумение наладить контакт с экспертом;

Ø терминологический разнобой;

Ø отсутствие целостной системы знаний в результате извлечения только "фрагментов";

Ø упрощение "картины мира" эксперта и др.

Процесс извлечения знаний — это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии, системному анализу, математической логике и пр., необходимо воссоздать модель предметной области, которой пользуют­ся эксперты для принятия решения. Часто начинающие разработчики ЭС, желая упростить эту процедуру, пытаются подменить инженера по знаниям самим экспертом. По многим причинам это нежелательно.

Во-первых, большая часть знаний эксперта — это результат многочислен­ных наслоений, ступеней опыта. И часто зная, что из А следует В, эксперт не отдает себе отчета, что цепочка его рассуждений была гораздо длиннее, например А -> D -> С -> В, или А -> Q -> R -> В.

Во-вторых, как было известно еще Платону, мышление диалогично. И по­этому диалог инженера по знаниям и эксперта — наиболее естественная форма изучения лабиринтов памяти эксперта, в которых хранятся знания, частью носящие невербальный характер, т. е. выраженные не в форме слов, а в форме наглядных образов, например. И именно в процессе объяснения инженеру по знаниям эксперт на эти размытые ассоциативные образы на­девает четкие словесные ярлыки, т. е. вербализует знания.

В-третьих, эксперту труднее создать модель предметной области вследствие глубины и объема информации, которой он владеет. Еще в ситуационном управлении [Поспелов, 1986] было выявлено, что объекты реального мира связаны более чем 200 типами отношений (временные, пространственные, причинно-следственные, типа "часть-целое" и др.). Эти отношения и связи предметной области образуют сложную систему, из которой выделить "скелет" или главную структуру иногда доступнее аналитику, владеющему к то­му же системной методологией.

Термин "приобретение" в рамках данной книги оставлен за автоматизиро­ванными системами прямого общения с экспертом. Они действительно не­посредственно приобретают уже готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления зна­ний, т. е. не являются универсальными.

Определение 2.4

Приобретение знаний (knowledge acquisition) — процесс заполнения базы зна­ний экспертом с использованием специализированных программных средств.

Например, система TEIRESIAS [Davis, 1982], ставшая прародительницей всех инструментариев для приобретения знаний, предназначена для попол­нения базы знаний системы MYCINили ее дочерних ветвей, построенных на "оболочке" EMYCIN [Shortliffe et al, 1979] в области медицинской диаг­ностики с использованием продукционной модели представления знаний.

Термин формирование знаний (machine learning) традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инжене­рии знаний, которая занимается разработкой моделей, методов и алгорит­мов обучения. Она включает индуктивные модели формирования знаний и автоматического порождения гипотез, например ДСМ-метод [Финн, 2000], на основе обучающих выборок, обучение по аналогии и другие методы. Эти модели позволяют выявить причинно-следственные эмпирические зависи­мости в базах данных с неполной информацией, содержащих структуриро­ванные числовые и символьные объекты (часто в условиях неполноты ин­формации).

Определение 2.5

Формирование знаний (machine learning) — процесс анализа данных и выявле­ния скрытых закономерностей с использованием специального математическо­го аппарата и программных средств.

Традиционно к задачам формирования знаний или машинного обучения относятся задачи прогнозирования, идентификации (синтеза) функций, расшифровки языков, индуктивного вывода и синтеза с дополнительной информацией [Епифанов, 1984]. В широком смысле к обучению по приме­рам можно отнести и методы обучения распознаванию образов [Аткинсон, 1989; Schwartz, 1988].

Для того чтобы эти методы стали элементами технологии интеллектуальных систем, необходимо решить ряд задач [Осипов, 1997]:

Ø обеспечить механизм сопряжения независимо созданных баз данных, имеющих различные схемы, с базами знаний интеллектуальных систем;

Ø установить соответствие между набором полей базы данных и множест­вом элементов декларативного компонента базы знаний;

Ø выполнить преобразование результата работы алгоритма обучения в спо­соб представления, поддерживаемый программными средствами интел­лектуальной системы.

Помимо перечисленных существуют также и другие стратегии получения знаний, например, в случае обучения на примерах (case-based reasoning), когда источник знаний — это множество примеров предметной области [Осипов, 1997; Попов, Фоминых, Кисель, 1996]. Обучение на основе при­меров (прецедентов) включает настройку алгоритма распознавания на зада­чу посредством предъявления примеров, классификация которых известна.

Обучение на примерах тесно связано с машинным обучением. Различие за­ключается в том, что результат обучения в рассматриваемом здесь случае должен быть интерпретирован в некоторой модели, в которой, возможно, уже содержатся факты и закономерности предметной области, и преобразо­ван в способ представления, который допускает использование результата обучения в базе знаний, для моделирования рассуждений, для работы меха­низма объяснения и т. д., т. е. делает результат обучения элементом соот­ветствующей технологии.

Например, в системе INDUCE [Коов и др., 1988] порождается непротиворечивое описание некоторого класса объектов по множествам примеров и контрпримеров данного класса. В качестве языка представления использу­ется язык переменно-значной логики первого порядка (вариант языка многозначной логики первого порядка).

В последнее время широкое распространение получили термины data mining и knowledge discovery, означающие, по сути, тот же процесс формирования знаний и поиск закономерностей, осуществляемый на больших выборках данных, обычно находящихся в хранилищах данных (data warehouse).

Таким образом, можно выделить три основных стратегии проведения ста­дии получения знаний при разработке ЭС (рис. 2.6):

Ø с использованием ЭВМ при наличии подходящего программного инст­рументария — приобретение знаний',

Ø с использованием программ обучения при наличии репрезентативной (т. е. достаточно представительной) выборки примеров принятия реше­ний в предметной области и соответствующих пакетов прикладных программ —- формирование знаний;

Ø без использования вычислительной техники путем непосредственного контакта инженера по знаниям и источника знаний (будь то эксперт, специальная литература или другие источники) — извлечение знаний.

 

Рис. 2.6.Стратегии получения знаний

Далее в этой главе подробно будут рассматриваться процессы извлечения знаний, т. к. на современном этапе разработки ЭС эти стратегии являются наиболее эффективными и перспективными. Формирование знаний, тяго­теющее в большей степени к области machine learning, т. е. индуктивному обучению, основываясь на хорошо исследованном аппарате распознавания образов [Гаек, Гавранек, 1983] и обнаружения сходства объектов [Гусакова, Финн, 1987], выходит за рамки данной книги. Также за рамками книги ос­тались вопросы приобретения знаний [Осипов, 1997] и формирования зна­ний из данных (data mining, knowledge discovery) и др.



Дата добавления: 2021-12-14; просмотров: 443;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.015 сек.