Формат представления морфологической информации модулем морфологического анализа LINGUIST
МИ слова в модуле LINGUIST полностью описывается структурой TGramInfo. Эта структура содержит три поля, первое из которых (wInfo) относится к самому слову – описывает постоянную МИ, а два других (gInfo & Flags) описывают его форму – переменная МИ:
typedef struct _GramInfo
{
WORD16 wInfo;
WORD16 gInfo;
WORD16 Flags;
} TGramInfo;
Первое поле (wInfo), а точнее, младшие его 6 бит, содержат информацию о типе слова (части речи) по классификации LINGUIST, приведенной в таблице 6.1. Второе поле структуры TGramInfo - gInfo - содержит информацию о форме слова (такую, как падеж или род, то есть переменная МИ), приведенную в таблице 6.2.
Таблица 6.1 – Описание постоянной МИ в модуле LINGUIST
wInfo & 0x3F | Часть речи | |
0x01 | Глагол несовершенного вида | |
0x02 | Непереходный глагол несовершенного вида | |
0x03 | Глагол совершенного вида | |
0x04 | Непереходный глагол совершенного вида | |
0x05 | Двувидовой глагол | |
0x06 | Непереходный двувидовой глагол | |
0x07 | Неодушевленное существительное мужского рода | |
0x08 | Одушевленное существительное мужского рода | |
0x09 | Одушевленное - неодушевленное существительное мужского рода | |
0x0A | Неодушевленное существительное мужского рода | |
0x0B..0x0C | Одушевленное существительное мужского рода | |
0x0D | Неодушевленное существительное женского рода | |
0x0E | Одушевленное существительное женского рода | |
0x0F | Одушевленное - неодушевленное существительное женского рода | |
0x10 | Неодушевленное существительное среднего рода | |
0x11 | Одушевленное существительное среднего рода | |
0x12 | Одушевленное - неодушевленное существительное среднего рода | |
0x13 | Неодушевленное существительное общего рода | |
0x14 | Одушевленное существительное общего рода | |
0x15 | Неодушевленное существительное мужского/среднего рода | |
0x16 | Одушевленное существительное мужского/среднего рода | |
0x17 | Неодушевленное существительное женского/среднего рода | |
0x18 | Неодушевленное существительное множественного числа | |
0x19..0x1A | Прилагательные | |
0x1B | Притяжательные местоимения | |
0x1C | Местоименные прилагательные | |
0x1D..0x20 | Местоимения | |
0x21..0x22 | Числительное | |
0x23 | Собирательное числительное | |
0x24 | Порядковое числительное | |
0x25..0x27 | Имена собственные | |
0x28..0x29 | Отчества | |
0x2A | Фамилии | |
0x2B..0x2F | Географические названия | |
0x30 | Вводное слово | |
0x31 | Междометие | |
0x32 | Предикатив | |
0x33 | Предлог | |
0x34 | Союз | |
0x35 | Частица | |
0x36 | Наречие | |
0x37 | Сокращенное существительное | |
0x38 | Сокращенное прилагательное | |
0x39 | Сокращенное вводное слово | |
0x3A | Обособленная сравнительная степень | |
0x3B..0x3C | Аббревиатура | |
Таблица 6.2 – Описание переменной МИ в модуле LINGUIST
Бит | Значение | Значение |
0-2 | 0x0001 | инфинитив |
0x0002 | Повелительное наклонение | |
0x0003 | будущее время | |
0x0004 | настоящее время | |
0x0005 | прошедшее время. | |
3-4 | 0x0008 | первое лицо |
0x0010 | второе лицо | |
0x0018 | третье лицо. | |
5-6 | 0x0000 | личная форма глагола |
0x0020 | действительное причастие | |
0x0040 | страдательное причастие | |
0x0060 | деепричастие. | |
0x0080 | Сравнительная степень прилагательных. | |
0x0100 | Краткая форма прилагательных и страдательных причастий. | |
9-10 | 0x0200 | мужской род, единственное число |
0x0400 | женский род, единственное число | |
0x0600 | средний род, единственное число | |
0x0800 | Множественное число склоняющихся слов. | |
12-14 | 0x1000- 0x7000 | Падеж. Может иметь значение от 0 до 7, что соответствует восьми падежам – именительному, родительному, дательному, винительному, творительному, предложному, второму родительному и второму предложному соответственно. |
0x8000 | Возвратная форма. Бит выставлен у возвратных форм глаголов и некоторых прилагательных и произошедших от них существительных. |
Дата добавления: 2016-07-18; просмотров: 2086;