ГЛАВА 2 Введение в инженерию знаний
Определение и структура инженерии знаний
Основные трудности в разработке экспертных систем связаны с проблемой извлечения и структурирования знаний. Именно эти вопросы исследует наука под названием — инженерия знаний (knowledge engineering). Это достаточно молодое направление искусственного интеллекта, появившееся тогда, когда практические разработчики столкнулись с весьма нетривиальными проблемами трудности "добычи" и формализации знаний. В первых книгах по искусственному интеллекту (ИИ) эти факты обычно только постулировались, в дальнейшем начались серьезные исследования по выявлению оптимальных стратегий выявления знаний [Boose, 1990; Wielinga, Schreiber, Breuker, 1992; Tuthill, 1994; Adeli, 1994; Leondes, 2000].
Определение 2.1
Инженерия знаний — направление исследований и разработок в области интеллектуальных систем, ставящее целью разработку моделей, методов и систем для получения, структурирования и формализации знаний специалистов с целью проектирования баз знаний.
Основные направления исследований инженерии знаний представлены на рис. 2.1.
Поле знаний
Данная глава целиком посвящена теоретическим проблемам инженерии знаний, другими словами — проектированию баз знаний. Центральным понятием на стадиях получения и структурирования является так называемое поле знаний, уже упоминавшееся в разд. 1.1
Рис. 2.1.Структура инженерии знаний
Определение 2.2
Поле знаний— это условное неформальное описание основных понятий и взаимосвязей между понятиями предметной области, выявленных из системы знаний эксперта, в виде графа, диаграммы, таблицы или текста.
Поле знаний pz формируется на третьей стадии разработки ЭС (см. разд. 1.7.2) — стадии структурирования.
Поле знаний, как первый шаг от структурирования к формализации, представляет модель знаний о предметной области в том виде, в каком ее сумел выразить аналитик на некотором "своем" языке.
Обобщенно синтаксическую структуру поля знаний можно представить как
Pz = (I, О, М),
где I — структура исходных данных, подлежащих обработке и интерпретации в экспертной системе; О — структура выходных данных, т. е. результата работы системы; М— операциональная модель предметной области, на основании которой происходит модификация I в О.
Включение компонентов I и О в Pz обусловлено тем, что составляющие и структура этих интерфейсных компонентов неявно присутствуют в модели репрезентации в памяти эксперта. Операциональная модель М может быть представлена как совокупность концептуальной структуры Sk, отражающей понятийную структуру предметной области, и функциональной структуры Sf, моделирующей схему рассуждений эксперта.
M=(Sk,Sf).
sk выступает как статическая, неизменная составляющая pz, в то время как Sf представляет динамическую, изменяемую составляющую.
Формирование Sk основано на выявлении понятийной структуры предметной области. Далее описан достаточно универсальный алгоритм проведения концептуального анализа на основе модификации парадигмы структурного анализа [Yourdon, 1989] и построения иерархии понятий (так называемая "пирамида знаний"). Пример Sk и Sf представлен на рис. 2.2 и 2.3.
В последние годы концептуальную структуру называют онтологией предметной области [Gruber, 1993], она включает упорядоченные понятия предметной области (ПО) А и моделирует основные функциональные связи RA или отношения между понятиями, образующими Sk. Помимо онтологии понимание задачи отражает модель или стратегия принятия решения Sf в выбранной ПО. Таким образом, Sf образует стратегическую составляющую М, часто она имеет форму простой таблицы решений, как на рис. 2.4.
Схему, отображающую отношения между реальной действительностью и полем знаний, можно представить так, как показано на рис. 2.4.
Рис. 2.4."Испорченный телефон" при формировании поля знаний
Как следует из рисунка, поле Pzgij — это результат, полученный "после 4-й трансляции" (если говорить на языке информатики).
1-я трансляция (Ii) — это восприятие и интерпретация действительности О предметной области g i-м экспертом. В результате Ii в памяти эксперта образуется модель Mgi как семантическая репрезентация действительности и его личного опыта по работе с ней.
2-я трансляция (Vi,} — это вербализация опыта i-го эксперта, когда он пытается объяснить свои рассуждения Si и передать свои знания Zi, инженеру по знаниям. В результате Vi, образуется либо текст Ti, либо речевое сообщение Сi
3-я трансляция (Ij) — это восприятие и интерпретация сообщений Ti или Сi j-м инженером по знаниям. В результате в памяти инженера по знаниям образуется модель мира Mgj.
4-я трансляция (Kj) — это кодирование и вербализация модели Mgj в форме поля знаний Pzgij.
Более всего эта схема напоминает детскую игру в "испорченный телефон"; перед инженером по знаниям стоит труднейшая задача — добиться максимального соответствия Mgi и Pzgij К сожалению, Pzg не является отражением действительности Og, т. к. знания — вещь сугубо авторизованная, субъективная. Так следовало бы на каждой ЭС ставить четкий ярлык i — j, т. е. "база знаний эксперта i в понимании инженера по знаниям j". Стоит заменить, например, инженера по знаниям Петрова на Сидорова, и получится совсем другая картина.
Приведем пример влияния субъективных взглядов эксперта на Mgi и Vi. Реальность (Og):два человека прибегают на вокзал за 2 минуты до отхода поезда. В кассы — очередь. В автоматических кассах свободно, но ни у того, ни у другого нет мелочи. Следующий поезд через 40 минут. Оба опаздывают на важную встречу.
Ø Интерпретация 1-го эксперта (I1): нельзя приходить на вокзал менее чем за 10 минут.
Ø Интерпретация 2-го эксперта (I2):надо всегда иметь мелочь в кармане.
Ø Вербализация 1-го эксперта (V1): опоздал к нужному поезду, т. к. не рассчитал время.
Ø Вербализация 2-го эксперта (V2): опоздал, т. к. на вокзале неразбериха, в кассах толпа.
Последующие трансляции еще больше будут искажать и видоизменять модель, но теперь уже с учетом субъективного восприятия инженеров по знаниям.
Таким образом, если считать поле знаний смысловой (семантической) моделью предметной области, то эта модель дважды субъективна. И если модель Mgi (см. рис. 2.4) — это усеченное отображение Og, то само pz — лишь отблеск Mgi через призму Vi и Mgj.
2.1.2. "Пирамида" знаний
Иерархичность понятийной структуры сознания подчеркивается в работах многих психологов [Брунер, 1971; Веккер, 1976]. Поле знаний можно стратифицировать, т. е. рассматривать на различных уровнях абстракции понятий. В "пирамиде знаний" каждый следующий уровень служит для восхождения на новую ступень обобщения и углубления знаний в предметной области. Таким образом, возможно наличие нескольких уровней понятийной структуры Sk
Представляется целесообразным связать это с глубиной профессионального опыта (например, как в системе АВТАНТЕСТ [Гаврилова, Червинская,1992]) или с уровнем иерархии в структурной лестнице организации (рис. 2.5).
Рис. 2.5.Пирамиды знаний
Естественно, что и стратегии принятия решений, т. е. функциональные структуры Sf на различных уровнях, будут существенно отличаться.
Дата добавления: 2021-12-14; просмотров: 322;