Проблемы, возникающие при построении синтаксической структуры
Лингвистически мотивированные причины такого «провала» – явление омонимии, длина связи между словами, сложность сегментной структуры предложения, выраженная в сочинительных конструкциях.
Среди многочисленных систем составляющих, которые могут быть выделены в предложении естественного языка, лишь немногие «правильны», т. е, отражают принятые в лингвистике соглашения о синтаксической структуре предложения данного языка. Предложение может иметь несколько «правильных» систем составляющих, соответствующих различным толкованиям предложения. Это явление называют синтаксической омонимией.
Пример:
1. Для зависимого слова можно найти разных «хозяев»: Он умеет заставить себя слушать (заставить себя или себя слушать); Сергей вернулся из командировки в Москву (вернулся в Москву или командировки в Москву); Мы встретили сына художника, приехавшего из Парижа (сына приехавшего или художника приехавшего); Роняет лес багряный свой убор (багряный лес или багряный убор). Такую омонимию называют стрелочной, потому что разные смыслы конструкции можно отобразить с помощью разных стрелок.
2. Пара «хозяин — слуга» выделяется единственным способом, но проинтерпре- тировать связь между этими словами можно по-разному: Преследование тигра закончилось неудачей (тигр преследует кого-то или кто-то преследует тигра). Такой вид омонимии называется разметочной.
3. Рядом расположенные слова могут по-разному объединяться в группы. В концерте приняли участие известные ансамбли и самодеятельные коллективы (прилагательное известные относится только к существительному ансамбли или также к коллективы). Такая омонимия называется конституентной.
Рассмотренные типы омонимии могут комбинироваться между собой. Например, в словосочетании звонок любимой из Парижа есть разметочная омонимия в паре слов звонок любимой (кому? или чей?) и стрелочная омонимия: неоднозначно определяется «хозяин» для формы из Парижа (звонок из Парижа или любимой из Парижа). Комбинация этих возможностей даёт четыре способа понимания словосочетания.
С точки зрения цели СА можно выделить два основных подхода: одноцелевой и многоцелевой. При первом подходе для фразы требуется построить одно синтаксическое представление, этот подход характерен для первых алгоритмов СА, когда считалось, что синтаксических средств достаточно для того, чтобы обеспечить правильный анализ фразы, хотя бы для большинства фраз. При втором подходе для фразы требуется получить все те синтаксические представления, которые удовлетворяют определенным соглашениям (все «правильно построенные» представления). Вопрос о том, какое из этих представлений является не только правильно построенным, но и правильным, т.е. соответствующим смыслу анализируемой фразы, в рамках СА не решается.
Одним из основных компонентов лингвистической базы знаний, осуществляющей автоматический СА, является описательная модель синтаксической структуры предложения. Такая модель в значительной степени передает концепцию разработчиков относительно синтаксического уровня анализа: какая именно информация об элементах предложения и их взаимосвязях должна выявляться в процессе анализа, присутствовать в его результатах и какие формы представления ей адекватны. Наиболее общим для разработчиков синтаксических анализаторов является взгляд, что синтаксическое строение предложения можно представить некоторым частично упорядоченным множеством бинарных связей между элементами. Виды и свойства элементов, связей и отношения порядка варьируют в разных моделях.
Дата добавления: 2019-09-30; просмотров: 523;