Лекция № 6 ТЕМА: Основные положения систем речевого общения.
Основные положения
В системах искусственного интеллекта с элементами естественно-языкового (ЕЯ) общения обычно предполагается, что в качестве средства общения используется письменная речь. Это не всегда удобно, а во многих случаях и неэффективно. Использование устной речикак средства общения позволяет почти на порядок повысить скорость ввода информации, разгрузить зрение и освободить руки, осуществить речевое общение на значительном расстоянии и по телефону. Если не затрагивать общих проблем ЕЯ-общения, которые связаны с пониманием речи, с созданием преобразователей «смысл—текст» и «текст—смысл», то узко специальными проблемами, стоящими перед разработчиками систем речевого общения (СЮ), становятся проблемы создания преобразователей «текст — речевой сигнал» и «речевой сигнал — текст». Первая из них называется проблемой синтеза речи, вторая — анализа и распознавания речи.
В системах ЕЯ-общения под текстом обычно понимают орфографический, или буквенный (как пишется), текст, в СРО—фонемный (как слышится). В создании преобразователей орфографического текста в фонемный и наоборот не существует особых проблем, хотя сложность таких преобразователей для разных языков будет различной (ср. русский и английский). Поэтому применительно к СЮ можно ограничиться проблемами разработки преобразователей «цепочка фонем—речевой сигнал» и «речевой сигнал—цепочка фонем». В речи фонема выступает в двух аспектах. С одной стороны, это элементарная смыслоразличительная единица письменной речи, с другой — абстрактное обозначение конкретного звука устной речи. Отметим сразу, что не существует счетного множества, а тем более одного-единственного звука речи, соотносимого с фонемой. Если учесть, что на речевой звук налагается множество экстралингвистических факторов: индивидуальные особенности речи и голоса, эмоциональное и физиологическое состояния говорящего, электроакустические характеристики среды и тракта передачи, а также шумы, помехи и искажения, то сложность проблемы, стоящей перед создателями СРО, пожалуй, трудно переоценить.
Современные исследования в области СРО начаты в индустриально развитых странах в начале 60-х годов. Первые промышленные СРО появились в конце 70-х годов. К настоящему времени созданы разнообразные СРО для разных сфер применения. Это связано с осознанием потенциальными потребителями преимуществ СРО:
- удобство, простота и естественность процедуры общения, требующей минимума специальной подготовки;
- возможность использования для связи с ЭВМ обычных телефонных аппаратов и существующей телефонной сети;
- устранение ручных манипуляций с одновременным увеличением скорости вода информации (в 3—5 раз по сравнению с клавиатурным вводом) и разгрузка зрения при получении информации.
Первое и второе преимущества с наибольшим эффектом проявляется в автоматизированных системах управления (АСУ) предприятия, организации или отрасли. Однако пока АСУ выполняет в основном информационные функции. С внедрением в АСУ речевой технологии общения ЭВМ станет по-настоящему активным звеном управления. Круг пользователей системы в силу простоты и естественности общения с ЭВМ неизмеримо расширится. При этом человеко-машинное взаимодействие будет осуществляться с помощью местной или городской телефонной сети на значительном расстоянии. В любое время большая группа пользователей сможет одновременно обращаться к ЭВМ за получением разного рода нормативно-справочной информации. Имея необходимую базу знаний — модель каждого конкретного производства, система сможет п0 запросу пользователя выдать необходимую консультацию по телефону в случае возникновения трудностей в той или иной сфере производства. Кроме того, система сможет выполнять функции диспетчера, обращаясь по телефону в необходимое время к конкретным работникам за получением данных о ходе производства, предупреждая их о наступлении критических ситуаций, напоминая о сроках поставки изделий или выполнения разного рода обязательств, а также осуществлять учет и контроль. Несомненно, во всех этих случаях эффективная работа СРО возможна лишь при условии, что она является составной частью систем искусственного интеллекта.
Третье свойство — разгрузка зрения и рук — важно для создания нового поколения систем оперативного человеко-машинного управления сложными объектами. К ним относятся прежде всего системы управления движением, энергетическими установками и другие АСУ ТП, САПР и АРМ.
Основой для разработки современных СРО является лингвоакустическая и информационная теории речеобразования и восприятия речи. Лингвистическая теория рассматривает фонетические и просодические характеристики речи, акустическая — акустические характеристики (признаки) фонем и просодем, информационная—структуру речевого сигнала. Эффективность СРО тем выше, чем полнее реализованы в ней принципы функционирования естественной речевой системы человека. При этом не обязательно, чтобы искусственные СРО копировали структурные особенности работы естественной системы. Важно, чтобы СРО как можно ближе была в функциональном отношении к естественной.
Дата добавления: 2016-06-15; просмотров: 1462;