Фонетический и фонологический анализ
Уровни языка. Фонетический, морфологический, синтаксический, семантический анализ
Фонетический и фонологический анализ
К сожалению, до настоящего времени наибольший акцент в обработке речи сделан на акустико-фонетическом анализе. Его цель — найти фонемное представление слова. Если акустико-фонетический анализ слабый, то сформированные ошибочные гипотезы в итоге приведут к неправильному результату. Сегментация и идентификация акустического сигнала в последовательности лингвистических единиц сложна, поскольку акустические сигналы ассоциируются с сегментами, непосредственно с ними не связанными. Кроме того, на эти сигналы сильно влияют соседние сегменты.
(18) Акустико-фонетический компонент необходим в любой обрабатывающей речь системе, чтобы восстановить канонические произношение слов, которые могут быть сопоставлены с соответствующими эталонами словаря, и далее реализовать синтаксическую, семантическую и/прагматическую интерпретацию речевого высказывания.
(19) Не трудно учесть фонологические компоненты в рамках лексических (сегментных) процессов, которые обычно имеют дело с фонологически управляемыми изменениями, генерируя альтернативное произношение для индивидуальных лексических единиц и сохраняя их в дополнительном словаре. (20) Сложнее учесть фонологические процессы, которые соединяют границы слова. В этом случае полезна сегментация, которая, разлагая речь на слоги и слова, может обеспечить информацию для синтаксического анализа.
Поскольку отличие фонологии от фонетики состоит в том, что предмет фонетики не сводится к функциональному аспекту звуков речи, но охватывает наряду с этим также её субстанциальный аспект, а именно: физический и биологический (физиологический) аспекты: артикуляцию, акустические свойства звуков, их восприятие слушающим (перцептивная фонетика).
Постольку фонема и звук - разные понятия, так как фонема - психическое явление, а звук — акустико-физиологическое.
Фонема – полифункциональная единица языка, которая: различает звуковые оболочки слов и морфем; доводит звуки речи до восприятия; является смыслоразличительной единицей. При этом фонема - целиком психическое явление, равно как и аллофон, реализацией их в речи является звук. Одной фонеме могут соответствовать несколько различных ее реализаций или аллофонов. Аллофон - группа звуков, в которых реализуется данная фонема в зависимости от характера выполняемой ими функции, места в слове и соседства с другими звуками, а также ударности и безударности.
(21) Согласно артикуляционной теории звук образуется в 3 стадии:
1) экскурсия (приготовление);
2) произнесение;
3) рекурсия (расслабление).
(22) В русском языке, так же как и во многих других, имеется два типа звуков: гласные и согласные.
Гласные звуки характеризуются по ряду, длительности, лабиализации, напряженности; согласные характеризуются по месту образования, способу, твердости/мягкости, глухости/звонкости, придыхательности.
Так как звуки речи произносятся не изолированно, а в звуковой цепи связной речи, то они могут, во-первых, влиять друг на друга, когда рекурсия предыдущего звука взаимодействует с экскурсией последующего, и, во-вторых, испытывать влияние общих условий произношения. В результате появляются следующие фонетические процессы:
1) редукция (изменение длительности звуков в безударных словах: количественная/качественная). Она тесно связана с ударением: - силовое –количественное (ударный звук произносится более долго) – тоновое (изменение высоты тона).
2) аккомодация - взаимное приспособление гласных и согласных (малый-мяло), качество согласного влияет на качество гласного и наоборот.
3) ассимиляция - качественное уподобление смежных по произношению звуков. Бывает - прогрессивной (когда предыдущий звук влияет на последующий), - регрессивной (когда последующий звук влияет на предыдущий, например вокзал - [вогзал], лодка - [лотка]).
4) диссимиляция - расподобление, когда из двух одинаковых или подобных звуков получается два различных звука. Процесс, противоположный ассимиляции (кто - [хто]).
Для нахождения канонического фонемного представления слова русского языка в словаре по его фонетической форме произнесения необходимо учитывать следующее.
В русском языке существуют определенные буквенно-звуковые соотношения. К наиболее частотным, и обычно вызывающим затруднение при написании транскрипции слова, или его звукового состава, относятся следующие:
- буква обозначает несколько звуков (е, ё, ю, я в начале слова, после гласного, после разделительных Ь и Ъ): юла - [йула]. В отдельных случаях после Ь два звука может обозначать и гласная и: ручьи - [ручйи];
- несколько букв обозначают один звук (сч, жч, зч = [щ]; дс, тьс, тс = [ц]): возчик - [вощик], детский - [д'эцк'ий].
В зависимости от характера слога, в котором гласные звуки находятся, а их шесть: [а, о, э, у, ы, и] - они делятся на ударные и безударные. Все гласные могут находиться в ударном и безударном положении, но безударный гласный о встречается лишь в отдельных заимствованных словах: радио - [рад'ио].
Согласные звуки (их 36) характеризуются по твердости/мягкости и звонкости/глухости.
30 согласных образуют пары по твердости/мягкости: [б - б', в - в', г - г', д - д', з - з', к - к', ,л - л', м - м', н - н', п - п', р - р', с - с', т - т', ф - ф', х - х'].
Всегда твердыми, или твердыми непарными, являются [ж, ш, ц], а всегда мягкими, или мягкими непарными, - [й, ч, щ].
Всегда звонкими, или звонкими непарными, являются [й, л, м, н, р], а всегда глухими, или глухими непарными, - [х, ц, ч, щ].
Следует учитывать и наличие фонетических процессов, т.е. влияния звуков друг на друга в потоке речи. Например, произношение предлога к в положении перед глухим и звонким (к тебе - [кт'эб'э], к дому - [гдому]), начальную и в изолированном употреблении и при наличии предлога (идеал - [ид'эал], в идеале - [выд'эал'э]).
В некоторых случаях допускается несколько вариантов произношения того или иного слова: мясной - [м'исной] и [м'эсной], (о) терпении - [т'эрп'эн'ии], [т'эрп'эн'ийэ], [т'ирп'эн'ии] и [т'ирп'энийэ], цепочка - [цэпочка] и [цыпочка].
Основные прикладные аспекты фонетических исследований в речевых технологиях - автоматическое распознавание речи, синтез речи, идентификация говорящего по характеристикам речевого сигнала.
4.4. Морфологический анализ
Стадия морфологического анализа (МА) является наиболее проработанным лингвистическим этапом процесса обработки естественного текста. За последние два десятилетия создано, по крайней мере, несколько десятков алгоритмов для разных языков, в том числе 10-12 для русского. Прежде, чем приступить к изложению основных методов и алгоритмов МА, необходимо ознакомится с терминологией, используемой в морфологии.
Дата добавления: 2016-07-18; просмотров: 4185;