Организация систем понимания речи
Понимание речи обычно трактуют как преобразование акустического представления речи в смысловое. Понимание речи следует отличать от распознавания речи, где целью является сопоставить речевое высказывание с соответствующими словами в словаре. Речевой сигнал является недостаточным источником информации, для успешного распознавания и интерпретации важно и знание контекста речевого высказывания.
Системы по распознаванию речи основаны на поиске наиболее точного соответствия между определенными произнесенными словами и словарем акустических образцов слов. Однако такой подход, работающий для распознавания изолированных слов, неприемлем для непрерывной речи, так как входной акустической сигнал в этом случае не может быть эффективно смоделирован, как простое сочетание произнесенных частей лексических единиц. Тем не менее, необходимо начинать с основных лингвистических единиц, таких как фонемы, и сохранять информацию о ритме и длительности речевого высказывания.
Если следуют таким путем, то подход к обработке речи, основанный скорее на знании, чем на соответствиях с образцами, становится неизбежным, так как, чтобы извлекать преимущества из распознавания конкретных лингвистических единиц в сигнале, необходимо знать, как данная единица связана с остальной частью языка.
СПР имеют дело со связанными единицами речи, такими как, фразы, предложения и даже параграфы, так как «понимание» изолированных слов может означать только тривиальный процесс сопоставления некоторого значения к каждому слову словаря системы. Понимание связанной речи - очень сложная задача, и на проектирование СПР повлияли исследования в таких разных областях, как акустическая обработка сигнала, нейро-физиология, психолингвистика, психология.
Посредником при преобразовании речи в ее значение должны служить определенные компоненты, которые используют разнообразные источники знания (ИЗ), т.к. речевой сигнал кодирует много различной информации, необходимой для восстановления значения. Единственной возможной организацией СПР и основных ИЗ является следующая:
РЕЧЬ — ОБРАБОТКА АКУСТИЧЕСКОГО СИГНАЛА — ФОНЕТИЧЕСКИЙ АНАЛИЗ — ФОНОЛОГИЧЕСКИЙ АНАЛИЗ — МОРФОЛОГИЧЕСКИЙ АНАЛИЗ — ЛЕКСИЧЕСКИЙ ДОСТУП К СЛОВАРЮ — СИНТАКСИЧЕСКИЙ АНАЛИЗ — СЕМАНТИЧЕСКИЙ АНАЛИЗ — ЗНАЧЕНИЕ.
При такой организации СПР информация течет вверх по мере того, как каждый элемент создает промежуточные представления, кодируя (частичные) гипотезы относительно ввода на основе ему доступного знания.
Акустическая обработка оцифровывает сигнал, трансформирует его так, чтобы представить в той форме, которая поддается фонетическому декодированию. Параметрический сигнал может затем быть помечен как дискретная последовательность фонем.
Фонологический анализ выполняется на фонетическом представлении, которое определяет лингвистически важные различия, имеющиеся в фонетическом представлении произнесения, например, уровни и расположение ударения, интонационный контур, структуры слога, последовательности фонем, лежащих в основе произнесения. Фонологический анализ необходим для лексического доступа, т.е. процесса, который сопоставляет фонетическую форму произнесения с каноническими фонемными представлениями слов в словаре, чтобы восстановить информацию, хранящуюся там относительно их морфологических, синтаксических, и семантических свойств. Фонологическое знание относительно допустимых последовательностей фонем в слогах может использоваться, чтобы распознать слог, и следовательно, границы слова.
Как только фонологический анализ завершен, дальнейшая обработка ввода будет подобна пониманию текста. Дальнейшие морфологический, синтаксический, семантический анализы способствуют распознаванию, эксплуатируя избыточность речи, в информационно-теоретическом смысле.
Прежде, чем слова, выделенные в речевом сигнале будут сопоставлены с лексическими входам в словаре системы, необходимо провести морфологический анализ, который приведет слова к их основной форме.
После морфологического анализа возникшее морфофонологическое представление речевого ввода может быть найдено в словаре системы, чтобы получить синтаксическую и семантическую информацию относительно гипотезы последовательности слов. Задача синтаксического анализа - исключить гипотезы слова на основе синтаксически недопустимых последовательностей.
На этапе семантического анализа гипотезы подвергаются дальнейшей обработке, учитывая смысловой фактор с помощью семантических отношений.
При создании как систем, обрабатывающих текст, к числу которых относятся СМП, так систем, обрабатывающих и понимающих речь, активно используются знания об уровнях языка, тесно связанные с этапами анализа в этих системах.
Дата добавления: 2019-09-30; просмотров: 451;