Формат представления морфологической информации модулем морфологического анализа LINGUIST


МИ слова в модуле LINGUIST полностью описывается структурой TGramInfo. Эта структура содержит три поля, первое из которых (wInfo) относится к самому слову – описывает постоянную МИ, а два других (gInfo & Flags) описывают его форму – переменная МИ:

 

typedef struct _GramInfo

{

WORD16 wInfo;

WORD16 gInfo;

WORD16 Flags;

} TGramInfo;

 

Первое поле (wInfo), а точнее, младшие его 6 бит, содержат информацию о типе слова (части речи) по классификации LINGUIST, приведенной в таблице 6.1. Второе поле структуры TGramInfo - gInfo - содержит информацию о форме слова (такую, как падеж или род, то есть переменная МИ), приведенную в таблице 6.2.

 

Таблица 6.1 – Описание постоянной МИ в модуле LINGUIST

wInfo & 0x3F Часть речи
0x01 Глагол несовершенного вида
0x02 Непереходный глагол несовершенного вида
0x03 Глагол совершенного вида
0x04 Непереходный глагол совершенного вида
0x05 Двувидовой глагол
0x06 Непереходный двувидовой глагол
0x07 Неодушевленное существительное мужского рода
0x08 Одушевленное существительное мужского рода
0x09 Одушевленное - неодушевленное существительное мужского рода
0x0A Неодушевленное существительное мужского рода
0x0B..0x0C Одушевленное существительное мужского рода
0x0D Неодушевленное существительное женского рода
0x0E Одушевленное существительное женского рода
0x0F Одушевленное - неодушевленное существительное женского рода
0x10 Неодушевленное существительное среднего рода
0x11 Одушевленное существительное среднего рода
0x12 Одушевленное - неодушевленное существительное среднего рода
0x13 Неодушевленное существительное общего рода
0x14 Одушевленное существительное общего рода
0x15 Неодушевленное существительное мужского/среднего рода
0x16 Одушевленное существительное мужского/среднего рода
0x17 Неодушевленное существительное женского/среднего рода
0x18 Неодушевленное существительное множественного числа
0x19..0x1A Прилагательные
0x1B Притяжательные местоимения
0x1C Местоименные прилагательные
0x1D..0x20 Местоимения
0x21..0x22 Числительное
0x23 Собирательное числительное
0x24 Порядковое числительное
0x25..0x27 Имена собственные
0x28..0x29 Отчества
0x2A Фамилии
0x2B..0x2F Географические названия
0x30 Вводное слово
0x31 Междометие
0x32 Предикатив
0x33 Предлог
0x34 Союз
0x35 Частица
0x36 Наречие
0x37 Сокращенное существительное
0x38 Сокращенное прилагательное
0x39 Сокращенное вводное слово
0x3A Обособленная сравнительная степень
0x3B..0x3C Аббревиатура
     

 

 

Таблица 6.2 – Описание переменной МИ в модуле LINGUIST

Бит Значение Значение
0-2 0x0001 инфинитив
0x0002 Повелительное наклонение
0x0003 будущее время
0x0004 настоящее время
0x0005 прошедшее время.
3-4 0x0008 первое лицо
0x0010 второе лицо
0x0018 третье лицо.
5-6 0x0000 личная форма глагола
0x0020 действительное причастие
0x0040 страдательное причастие
0x0060 деепричастие.
0x0080 Сравнительная степень прилагательных.
0x0100 Краткая форма прилагательных и страдательных причастий.
9-10 0x0200 мужской род, единственное число
0x0400 женский род, единственное число
0x0600 средний род, единственное число
0x0800 Множественное число склоняющихся слов.
12-14 0x1000- 0x7000 Падеж. Может иметь значение от 0 до 7, что соответствует восьми падежам – именительному, родительному, датель­ному, винительному, творительному, предложному, второму родительному и второму предложному соответственно.
0x8000 Возвратная форма. Бит выставлен у возвратных форм глаголов и некоторых прилагательных и произошедших от них существительных.

 



Дата добавления: 2016-07-18; просмотров: 2086;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.008 сек.