Функциональные компоненты естественно-языковых систем
Традиционные средства общения не позволяют обеспечить взаимодействие конечных пользователей с компьютером. Чтобы быть полноправным участником общения, ЕЯ-система должна выполнять некоторые обязательные функции. К этим функциям относятся:- ведение диалога - определение его структуры и ранга роли, которую система и пользователь выполняют на текущем шаге диалога;- понимание - преобразование поступающих от пользователя высказываний на естественном языке в высказывания на языке внутреннего представления;- обработка высказываний - формирование или определение заданий на решение задач или подзадач на данном шаге диалога;- генерация - формирование выходных высказываний на ЕЯ.Приведенные функции имеют обобщенный характер. Поэтому необходимо подчеркнуть, что при реализации конкретных ЕЯ-систем суть этих функций может в значительной степени варьироваться. В соответствии с выделенными функциями обобщенная схема ЕЯ-системы (рис.2.2) может быть представлена в виде трех компонентов: диалоговый; компонент понимания высказываний; компонент генерации высказываний. Рис. 2.2. Обобщенная схема ЕЯ-системы Сравнительная характеристика основных классов ЕЯ-систем.Приведенная выше классификация ЕЯ-систем охватывает лишь функционально полные системы, т. е. такие, в которых представлены все основные функциональные компоненты. Однако помимо функционально полных систем ведется интенсивная разработка систем, которые можно назвать фрагментарными. Цель их создания - исследование или реализация новых методов решения достаточно узких задач (например таких, как анализ, интерпретация, определение целей пользователя и т. п.).Благодаря модульности структуры ЕЯ-систем и, как правило, универсальному (т. е. не зависящему от специфики прикладных областей) характеру языка внутреннего представления, фрагментарные системы могут успешно использоваться в качестве отдельных функциональных блоков, встраиваемых (хотя бы на логическом уровне) в различные функционально полные ЕЯ-системы. Рассмотрим основные отличительные характеристики каждого класса ЕЯ-систем на примере существующих систем.Интеллектуальные вопрос-ответные системыПри разработке интеллектуальных вопрос-ответных систем основное внимание уделяется языковому аспекту, т. е. максимальному приближению языка общения к литературному естественному языку. Наиболее значительной из отечественных систем данного класса является система ПОЭТ, созданная коллективом исследователей под руководством Э.В. Попова, во многом определившая применяемые в последующих системах методы анализа и генерации высказываний на русском языке.Система ПОЭТ воспринимает вопросительные предложения русского языка с практически несущественными ограничениями на допустимые синтаксические конструкции и пунктуацию. Типичными примерами запросов, допускаемых системой ПОЭТ, могут служить «Сколько каменного угля перевезено железнодорожным транспортом в 1978 году?» или «Каков удельный вес перевозок железнодорожным транспортом в общем объеме перевозок всеми видами транспорта в 1975 году?» Процесс понимания входных высказываний осуществляется в системе ПОЭТ по полной схеме: морфологический анализ, синтаксический анализ, семантический анализ и семантическая интерпретация (рис. 2). При этом последние три этапа выполняются в общем случае параллельно, за счет чего достигается коррекция неверных путей анализа, и в конечном счете сокращается время обработки запросов.Все знания о языке общения разделяются в системе ПОЭТ на лингвистические и проблемные. Первые хранятся в различных зонах словаря (морфологической и синтактико-семантической), а вторые - в семантической сети. При этом в системе различаются абстрактная (описывающая общие понятия и категории) и конкретная (описывающая конкретные сущности) семантические сети. Описания базовых событий представлены в словаре системы в виде моделей управления. Выделение участников событий и определение выполняемых ими ролей осуществляются на основе метода фильтров. При этом активно используется как грамматическая, так и синтактико-семантическая информация.На этапе семантического анализа синтаксическая структура входного высказывания, представленная в виде дерева зависимостей, преобразуется в семантический граф, состоящий из вершин-понятий, связанных друг с другом через вершины-события и характеристики. Каждая вершина семантического графа определяется каноническим представлением, а дуги имеют глубинный смысл. Вся числовая и параметрическая информация выносится из графа в дополнительные таблицы. Там же указываются и временные соотношения между событиями.На этапе интерпретации семантический граф запроса сопоставляется с семантической сетью. В результате происходит вычленение контекста, имеющего отношение к запросу, получение содержательной информации из конкретной сети, формирование обращений к базе данных за числовой информацией и получение способа обработки этой информации (суммирование, вычисление процента и т. п.). Семантический граф ответа вырабатывается на базе графа запроса путем внесения в него смысловой информации, полученной на этапе интерпретации.Система ПОЭТ является ЕЯ-системой с генерацией ответов на русском языке. Формирование ответов выполняется следующим образом. По семантическому графу ответа строится дерево зависимостей. Затем каждой вершине приписывается морфологическая информация и определяется порядок слов. На этом заканчивается синтаксический синтез. На этапе морфологического синтеза по таблицам окончаний и морфологической информации, приписанной вершинам дерева зависимостей, осуществляется окончательная генерация поверхностной структуры ответа. Генерация полного ответа, например, «В 1978 году железнодорожный транспорт перевез NNN млн. тонн каменного угля», позволяет пользователю убедиться в правильности понимания системой заданного вопроса.С помощью первых вопрос-ответных систем была показана принципиальная возможность получения ответов на ЕЯ-вопросы, относящиеся к ограниченным проблемным областям. Так, система ПОЭТ могла отвечать па вопросы о перевозках различных народнохозяйственных грузов. ДИСПУТ - об обслуживании контейнерных перевозок к морскому порту, LUNAR - о свойствах образцов лунных пород, LIFER - о дислокации и характеристиках судов военно-морских сил и т. п. Для большинства интеллектуальных вопрос-ответных систем была характерна жесткая структура диалога, при которой каждое высказывание пользователя воспринималось как очередной запрос (который, как правило, не мог быть связан с предыдущим). Система играла пассивную роль - она могла лишь отвечать на запросы и выдавать сообщения о неудачах, когда очередной запрос по каким-либо причинам не мог быть проанализирован или обработан. Обработка высказываний сводилась в большинстве случаев к вызову (в соответствии с типом запроса) одной из имеющихся в распоряжении системы специализированных программ и передаче ей в виде параметров условий поиска информации в БД имен сущностей, значения которых должны быть обработаны или выданы в качестве ответа, и т. п.Первые эксперименты с интеллектуальными вопрос-ответными системами показали, что, несмотря на возможность понимания запросов на ЕЯ, данные системы налагают достаточно жесткие (и в общем случае трудновыполнимые) ограничения на процесс общения. Эти ограничения стимулировали дальнейшие исследования, направленные, в первую очередь, на повышение гибкости процесса общения.
Рис. 2.3. Схема вопрос-ответной системы ПОЭТ
Дата добавления: 2019-09-30; просмотров: 617;