Содержания научных документов


 

 

Наименование аспекта Маркер аспекта
Семантический блок 1 - «Введение»
Актуальность проблемы Одной из актуальных проблем ... в настоящее время является ... Огромную важность приобретают вопросы ... Особое значение приобретает вопрос ... Социальная значимость темы определяется ... Среди проблем, связанных с ... , пристальное внимание исследователей в последние годы привлекает вопрос о ... В связи с ... большое значение приобрела проблема… Интерес к проблеме ... обусловлен ...
Известный вариант решения Известно, что ... Известны способы ... Широкое применение получили ...Проблеме ... посвящено значительное число публикаций (1-15)…Вопросу ... отводится большое место в работах (5-9)…В последние годы данной проблеме уделялось большое внимание в таких работах, как (14-18) Освещение проблемы ... нашло отражение в монографиях (9-11); в ряде статей (12-18); диссертаций (3-5)
Достоинства известного варианта решения Предложенный в (19) метод выгодно отличается от..., позволяя повысить ..., улучшить ..., устранить ... Предложенный в (19) метод выгодно отличается от..., позволяя повысить..., улучшить ... К числу достоинств описанного в монографии (7) подхода следует отнести ... Преимуществом предложенного В. П. Дубовиным (9) способа является ... Концепция ..., сформированная коллективом авторов монографии (3), позволяет ..., открывает возможности ...

Недостатки известного варианта решения Недостатком известных способов ... является ... Использование ... связано с серьёзными трудностями Высокая трудоёмкость ... не позволяет ... не даёт возможности…Однако несмотря на ... существуют препятствия ... Наряду с достоинствами, предложенный авторами работы (8) подход обладает следующими недостатками ... Тем не менее предлагаемое в (4) решение не позволяет ..., не даёт возможности ... Однако подход к решению вопроса о ..., описанный в (11), не даёт ответа на ..., неоправданно сужает возможности ... Предложенный в (17) способ... ограничивает ..., отрицательно сказывается на ...
Целевая установка Цель настоящей статьи ... Целью настоящей публикации является ... Цель данной работы состоите ... В задачу данной публикации входит ... Настоящая работа имеет целью ... К числу основных задач исследования относятся ... Основная задача монографии - ...
Семантический блок 2 - «Основная часть»
Описание предлагаемого варианта решения или предмета Предлагаемая... форма... базируется на ... Предлагается такой метод ... , при котором ... Ниже предлагается один из методов ... Предлагаемый подход ... основан на ...
Особенность (новизна) предлагаемого варианта решения Особенность предлагаемого способа ... состоит в ... Особенностью ... является ... Отличительная черта предлагаемого нами метода ... СОСТОИТЕ ... Характерным признаком, отличающим наш способ ..., является ... Новизна предлагаемого подхода состоит в ... Новизна ... проявляется в ... Принципиальное отличие и новизна предложенной нами модели заключается в ...
Назначение предмета рассмотрения ... используются для ... ... предназначен для ... ... служит для ... ... может быть использован в качестве ... ... возможно его использование как ...

99


Место исследования В МГУ разработан ... Сотрудниками ВИНИТИ предложен ... В Кем ГИИиК ведётся исследование ... На базе школы-гимназии №32 г. Новокузнецка проведён ...
Технические средства, оборудование Система реализована на ЭВМ ... В ходе исследования использовалась следующая аппаратура ... Технической базой системы послужила сеть ЭВМ Для ... применялось оборудование, включавшее ... С целью ... был использован аппарат ...
Метод исследования В данной работе используется метод ... Исследование предполагало комплексное использование таких методов, как ... Для ... использовалось интервью ... Сочетание наблюдения и тестирования позволило ...Применение таких методов, как ..., дало возможность ...В состав методов, обеспечивших проведение НИР, входили ... ... применялась методика ... ... метод основан на ...
Экспериментальная проверка Эксперимент показал, что ...Эксперимент проводился в ... Цель эксперимента - ...Наши эксперименты доказали, что ... Опытным путём показано ...Опыты подтвердили, что ... Испытания проводились ...Серия испытаний позволила установить ...
Примеры Например ...Рассмотрим на примере ...Приведём пример ... Обратимся к примеру ...Этот пример подтверждает, что ... Данный пример даёт основание говорить ...
Математический аппарат Воспользуемся формулой ... (наличие математических символов) Расчёты показывают, что ... Исходя из формулы ...
Наглядное направление информации См. рис См. табл., граф., схему ... На рис. 1 наглядно видно, что ...

  Данные, приведённые в табл. 6 позволяют утверждать, что ... График демонстрирует зависимость ... На схеме наглядно отражена ...
Семантический блок 3 - «Заключение»
Результаты Результаты показали следующее ...Результаты ... оказались следующими ...Из полученных результатов видно, что ...Основные результаты исследования заключаются в следующем: ...Главным результатом проведённого анализа следует считать ...Полученные результаты .. позволяют утверждать, что ...
Выводы Итак, можно сделать вывод, что ...Проведённые исследования позволяют сделать вывод о ...Итак, подводя итоги, можно констатировать следующее: ...В заключение отметим, что ... Резюмируя предшествующие рассуждения, можно сказать ... Подводя итоги нашего анализа, следует отметить ... Из всего сказанного следует вывод о ...Таким образом, можно сделать вывод ... Следовательно, мы приходим к выводу ... ... работа позволяет сделать вывод, что ...
Преимущества предложенного варианта решения Этот способ имеет то преимущество, что ... Следовательно, преимущества состоят в ... Анализ показал преимущества метода ... Предлагаемый способ позволяет повысить ..., ускорить ..., снизить ...
Рекомендации Система может быть рекомендована для ... Как ..., так и ... могло быть рекомендовано для ... Этот метод может быть рекомендован для ... ... может найти применение для ...

 

 

Анализ таблиц 7 и 8 показывает, что наиболее чёткие группы маркеров составляют выражения, в которых имеется характерное слово. Важную роль для выражения маркеров имеют устойчивые фразеологические обороты, которые составляют ядро маркеров.

С точки зрения синтаксиса предложений маркеры могут выражаться простыми предложениями или их фрагментами, главной частью


сложноподчинённого или сложного бессоюзного предложения, фрагментами текста us нескольких предложений (обычно двух).

Лексический признак (характерное слово) играет ведущую роль в таких аспектах как «Место исследования», «Назначение предмета рассмотрения», «Технические средства реализации», «Примеры», «Наглядное представление информации», «Экспериментальная проверка», «Математический аппарат» и частично «Целевая установка».

Для аспектов «Актуальность проблемы», «Известный вариант решения», «Недостатки известного варианта решения», «Результаты», «Выводы, «Преимущества предложенного варианта решений», «Рекомендации» лексический признак не является единственным. Здесь при выделении аспектов важную роль играет также порядок следования аспектов в тексте, ид: совместимость в блоках. Кроме того, в роли вспомогательного признака может выступать абзац. Маркер может также входить в заглавие документа или подзаголовки.

Следовательно, все перечисленные признаки при выявлении основных аспектов содержания надо рассматривать в комплексе.

Формальные текстовые признаки могут быть использованы как для совершенствования обычного (ручного) реферирования, так и для разработки алгоритмов автоматического реферирования.

7.4. Методика формализованного реферирования (ручной вариант)

Разнообразные формальные смысловые признаки, выявленные путём анализа текстов первоисточников и систематизированные в специальных указателях и словарях, могут оказаться полезными при выполнении процедур формализованного реферирования (на основе поаспектного метода) лицами, которые не являются специалистами (а также с использованием средств автоматизации).

7.4.1. Формализованное экстрагирование

Формализация может быть сведена, например, к выбору {экстрагировании}) из текста первичного документа предложений, слов и словосочетаний, наиболее точно характеризующих какой-либо аспект содержания, то есть наиболее ценных в смысловом отношении. В итоге получаются цепочки или набор слов и фраз, одни из которых могут непосредственно передавать содержание, другие - характеризовать смысловые аспекты описательно. Очевидно, что окончательная обработка


текстов рефератов должна производиться в данных случаях в процессе их редактирования.

Назначение формализованной методики составления рефератов заключается в снижении субъективности действий человека, извлекающего наиболее важные сведения из первичного документа и представляющего их в сжатом виде, в повышении качества подготавливаемых вторичных документов, а также в снижении временных и интеллектуальных затрат на их подготовку.

Методика формализованного реферирования кратко состоит из следующих действий:

I. Определяется набор сведений, то есть аспектов содержания, которые следует обязательно включить в состав реферата;

П. С использованием маркеров и индикаторов из текста первичного документа извлекаются фрагменты, наиболее ярко характеризующие основные аспекты содержания;

Ш. По заранее установленным правилам на основе выбранных из текста первоисточника аспектов содержания составляется, а затем редактируется реферат.

Рассмотрим эти этапы подробнее.

В предыдущей главе мы много говорили о маркерах, их связи со смысловыми аспектами содержания, кратко останавливались на методике, но почти не касались технической стороны дела. В исследовательских методиках предложения текста первоисточника обычно нумеруют. При формализованном реферировании, чтобы сделать более заметными фрагменты текста, относящиеся к определённым смысловым аспектам, применяют специальные графические знаки. Так поступает, например, редакция американского реферативного журнала «Current Abstracts of Chemistry and Index Chemicus». В этом журнале используются графические знаки для индексирования не только содержания первоисточника, но и структурных элементов рефератов: библиографического описания (заглавия, фамилий авторов, издательства) и справочного аппарата. Знаки имеют различные начертания (в форме круга, треугольника, квадрата и т. д.), внутри каждого знака ставится буква, которая является, как правило, начальной буквой названия смыслового аспекта или элемента структуры текста. Всё вышеперечисленное направлено на то, чтобы всесторонне оптимизировать процесс реферирования.

В современной практике реферирования в русских методиках основные смысловые аспекты часто обозначаются внутренними аббревиатурами. Например, в работе [175] список основных аспектов содержания имеет вид:

1. Постановка проблемы (ПП);

2. Целевая установка (ЦУ)\

3. Известный вариант решения (ИВР);

4. Оценка известного варианта решения (ОцИВР);

5. Предлагаемый вариант решения (ПВР);


6. Особенность предлагаемого варианта решения (ОсПВР);

7. Оценка предлагаемого варианта решения (ОцПВР);

8. Рекомендации (Рек);

9. Результаты (Р);

 

10. Выводы (В);

11. Область применения (OП).

В соответствии с аспектами содержания с помощью маркеров текст делят на блоки (фрагменты), которые для краткости также называют аспектами. Они характеризуются смысловой законченностью, связностью и в зависимости от места нахождения основной темы могут иметь дедуктивную или рамочную структуру.

В дедуктивном (синтетико-аналитическом) аспекте основная тема находится в верхней части аспекта, остальные фразы её раскрывают.

В рамочном аспекте темоназывная фраза располагается в верхней границе аспекта, затем следует её развитие, а затем концовка, содержащая дополнительное подчёркивание темы, основной мысли аспекта.

Смысловой аспект может характеризовать не одну тему, а несколько. Это обычно выражается в таких аспектах как ЦУ и В. Имеются и обратные ситуации, когда одна тема развивается в нескольких аспектах, например ОсПВР и ОцПВР. Это связано с тем, что каждый аспект в иерархической структуре первоисточника выполняет неодинаковую коммуникативную нагрузку.

Особую сложность представляют случаи «пересечения» аспектов и «вхождения» их друг в друга, что ведёт к субъективности при выделении аспектов в тексте и требует высокой квалификации референтов.

Поэтому в формализованных методиках рекомендуется использовать весь комплекс формальных текстовых признаков.

В текстах научных документов кроме маркеров имеются также устойчивые словесные обороты, характеризующие последовательность изложения содержания, акцентирующие внимание читателя на отдельных фрагментах текста. Их называют индикаторами. В отличие от маркеров, индикаторы не привязаны жёстко к конкретному аспекту содержания, и являются своего рода указателями развития авторской мысли в тексте. Можно выделить следующие наиболее часто применяемые

Виды индикаторов:

индикаторы, формулирующие тему документа,

характеризующие последовательность изложения того, о чём будет идти речь в документе: «Данная статья посвящена...», «Ниже описываются (приводится, характеризуется)...», «Далее будет рассмотрен вопрос о...», «Рассмотрим...», «Обратимся к...»;

индикаторы результирующего характера {индикаторы-резюме): «Итак...», «Таким образом,...», «Следовательно,...», «Подведём итоги», «В заключение», «Наконец», «Резюмируя», «Можно заключить»...


индикаторы, акцентирующие внимание читателя на наиболее важных утверждениях, положениях текста: «Существенным является...», «Валено заметить, что...», «Следует подчеркнуть...», «Важно подчеркнуть (учитывать, считать, сказать)», «Важным является», «Важное значение имеет», «Заметим», «Иначе говоря», «Легко видеть», «Можно отметить (сказать, подчеркнуть...)», «Необходимо иметь в виду (отметить, сказать...)», «Особое значение (внимание)», «Существенное значение» и т.д.

индикаторы, отсылающие к другому источнику: «Как сообщает...», «Как указывает...»;

индикаторы, выражающие отношение автора (уверенность, сомнение, допущения, возможность, желательность): «Бесспорно...», «Несомненно...», «Сомнительно...», «Возможно...», «вряд ли», «желательно...» и т.д.

Не обходится текст и без различного рода стандартных оценочных слов и фраз, слов-указателей, поясняющих, заменяющих или уточняющих отдельные предложения и смысловые фрагменты.

В отличие от маркеров и индикаторов, которые непосредственно выделяют предложение и входят в его состав, коннекторы служат для выделения предложений, так или иначе связанных с маркированным. При экстрагировании используются два типа коннекторов.

К первому (левые коннекторы) относятся:

1. Указательные и личные местоимения: он(а,и,о), это(а,т,и), такой,
их и т.п.

2. Слова-заместители: аналогичный, данный, указанный,
упомянутый, последний, предыдущий, предшествующий, приведённый,
сказанный, описанный, отмеченный, перечисленный и т.д.

Включение левых коннекторов в маркированное предложение, как правило, лишает его смысловой значимости и требует введения в реферат предложения, содержащего замещаемое слово или выражение (операция «шаг назад»).

К коннекторам второго типа (правые коннекторы) относятся слова и выражения, которые уточняют и конкретизируют содержание маркированного предложения (более того, вдобавок, вместе с тем, кроме того, при этом, также, точно так, иначе, затем, нижеследующий, дальнейший, причём, тогда, тоже самое, иными словами, другими словами; в частности, в том числе, например, так, отсюда, между тем, в результате и т.д.). Эти коннекторы используются для выделения предложений, непосредственно следующих за маркированными (операция «шаг вперёд»).

Помимо алфавитной части в словаре маркеров имеется аспектный перечень. Он позволяет относить маркеры к конкретным аспектам.

Методика формализованного экстрагирования включает в себя следующие процедуры:


1. После просмотра текста документа, референт, руководствуясь словарём маркеров, должен выписать на бланке предложения, содержащие клише. Предложения с индикаторами выписываются только в том случае, когда референт считает, что одних маркированных предложений недостаточно.

2. Если маркированное предложение включает в себя коннекторы-заместители (левые коннекторы) типа такие, эти, подобные, вышеприведённые, поставленные и т. п., то делается «шаг назад» и выписывается предыдущее предложение. В этом случае в реферат - экстракт включаются два предложения.

3. Если после маркированного предложения идёт уточняющая фраза, содержащая коннекторы-уточнители (правые коннекторы) так, например, при этом и др., и если референт считает маркированное предложение недостаточно информативным, то делается «шаг вперёд» и выписывается фраза с коннектором. В этом случае в реферат также включаются два предложения - с маркером и коннектором.

Таким образом, из описания методики следует, что строго формализованным является только употребление маркеров. Употребление индикаторов и коннекторов в значительной мере определяется соображениями референта. Полученный экстракт вторичного документа дополнительно «ужимается» по формальным правилам в соответствии с ГОСТом, а затем подвергается постредактированию.

Изложенный подход можно рассматривать как промежуточный этап в направлении дальнейшей формализации реферирования и получения автоматизированных экстрактов на ЭВМ. Однако, несомненно, ручной вариант методики имеет самостоятельное значение и целесообразным является использование этого процесса как полу алгоритмического (эту точку зрения подтверждает низкое качество полученных в настоящее время автоматизированных рефератов и аннотаций). В.П. Леонов [11] на основе оценки возможности эффективности формализованного экстрагирования (были проведены три серии ручных экспериментов: по оценке работоспособности методики, роли индикаторов и коннекторов, а также устойчивости методики формализованного экстрагирования) утверждает, что с её помощью можно облегчить и ускорить интеллектуальные процедуры реферирования (и аннотирования) в тех подразделениях, где не справляются с обработкой документов традиционными методами. Эксперименты В.П. Леонова показывают, что формализованное составление вторичных документов, выполненное библиографом (то есть не специалистом той или иной отрасли), сравнимо по качеству с традиционным и осуществляется значительно (в 3 раза) быстрее.


7.4.2. Алгоритмическое избирательное свёртывание текстов (АИСТ)

Дальнейшим развитием ручных методов формализованного экстрагирования может служить сочетание вышеизложенного метода с избирательным подходом к реферированию, в основу которого положена концепция А.В. Соколова об алгоритмическом избирательном свёртывании текстов - АИСТ [137].

Сущность концепции А.В. Соколова состоит в том, что в зависимости от типа и жанра первичного документа для процедуры ручного индексирования предлагаются общие установки, а также конкретные алгоритмы и анкеты. В этом проявляется избирательность индексирования.

При избирательном реферировании (и аннотировании) рекомендуется
помимо разработанных алгоритмов для ручного индексирования,
дополнительно использовать лексико-семантический аппарат

экстрагирования, и, в частности, аспектный перечень. Представляется, что его применение позволит повысить однозначность выбора необходимых для реферата (или аннотации) аспектов из текста.

Таблица 9 Избирательное свёртывание первичного документа

 

№ п/п Имя аспекта Жанр документов
        Постановочные Теоретические Методические Об опыте работы Документы
1. Известный вариант решения (ИВР)          
2. 3. Оценка ИВР Постановка проблемы (ЦП) + +      
        +   + + +
4. Целевая установка (ЦУ) + +   + +
5. Предложенный вариант решения (ИВР) + + +    
6. Оценка ПВР          
7. Особенности ПВР   + + +  
8. Результаты (Р)       + +
9. Рекомендации (Рек)          
10. Выводы (В) +       +

Общую схему избирательного реферирования можно представить следующим образом. Сначала по алгоритмам, разработанным для


избирательного свёртывания текстов, определяется тип и функциональное

назначение реферируемого документа. Затем для ответа на вопрос, какие аспекты содержания следует отразить в реферате, обращаются к специальной таблице. Пример такой таблицы, основанной на анализе рефератов, можно взять из работы А.В. Соколова [137]. Эта таблица приведена также в монографии В. П. Леонова [11].

Для реферата выбираются все аспекты, помеченные знаком плюс «+» (для справочной аннотации отбираются аспекты «Постановка проблемы» и «Целевая установка»).

Выбор аспектов из текста осуществляется с помощью лексико-семантического аппарата экстрагирования по методике, описанной выше. На основе экстрагирования из текста первичного документа наиболее ценных в смысловом отношении фрагментов (слов, словосочетаний, предложений) составляются цепочки фраз (или их набор). Полученный экстракт редактируется, затем текст сжимается по формальным правилам в соответствии с ГОСТами (реферата или аннотации) и снова редактируется.

Положительной стороной метода является то, что он ориентируется на тип и характер изложения информации в первоисточнике, а использование в нём лексико-семантического аппарата формализованного экстрагирования позволяет повысить однозначность определения и выбора аспектов в тексте.

7.4.3. Организация реферата в формат

По формализованной методике, основанной на по аспектом реферировании, осуществляется также организация реферата в формат. Этот подход обеспечивает единообразие в подготовке рефератов, что в свою очередь позволяет исключить их индексирование и использовать в качестве поискового образа его формат, представляющий собой нечто среднее между традиционным рефератом и схемой аспектов, то есть основных смысловых элементов реферата, приведённой в работе [168]. Такой формат имеет вид традиционного реферата, организация данных в котором однозначно определяет их содержание.

В работе [167] при организации реферата в формат текст реферата разбивается на информационные поля, представляющие собой описания определённых аспектов. Дня распознавания полей автором использовались формальные текстовые признаки, которые наиболее часто употребляются в рефератах для обозначения соответствующих смысловых аспектов.

Так в рефератах аспект «Предмет исследования» характеризуется словами-метками «изучается», «исследуется»; аспект «Область применения» - маркерами «используются», «применяются»; аспект «Цель исследования» - словосочетаниями «Целью является », «В задачу


входит », «Основная задача заключается ». Применение маркеров позволяет достаточно чётко разделить реферат на поля, которые можно рассматривать также как поисковые поля.

Работа А.А. Авдеевой [167] была посвящена анализу способов расположения информации в традиционных рефератах. Б процессе исследования были рассмотрены 466 рефератов статей н описаний изобретений к авторским свидетельствам н патентам (из раздела «Вычислительная техника» РЖ «Автоматика, телемеханика н вычислительная техника» №9 за 1971 год). В результате обработки различных полученных схем смысловых аспектов в рефератах было выделено несколько основных структурных типов рефератов, которые отличаются последовательностью вводимых в реферат аспектов, указанных в сокращённом перечне (предмет исследования, ранее известные устройства, функциональные и эксплуатационные преимущества предмета исследования, конструктивные или технологические отличия предмета исследования или реализация преимущества, примеры, выводы, результаты): I - Предмет исследования

(242 реферата) П - Предмет исследования

Преимущества предмета исследования

(61 реферат) Ш - Предмет исследования

Преимущества предмета исследования

Реализация преимущества

(105 рефератов) IV - Ранее известные устройства, способы, методы

Предмет исследования

Преимущества предмета исследования

Реализация преимущества

(58 рефератов).

Аспект «примеры, выводы, результаты» характерен для каждого из четырёх типов рефератов.

Было отмечено, что рефераты описаний изобретений отличаются значительной степенью стандартизованности, что обусловлено требованиями к структуре н форме первоисточника. Рефераты статей описывающих конкретные устройства или способы в совокупности со всеми их характеристиками, очень часто строятся так же, как н рефераты описаний изобретений. Этот тип рефератов занимает промежуточное положение между довольно формализованными рефератами описаний изобретений н аморфными по форме и структуре рефератами статей, описывающих предмет исследования с одной из его сторон.

Для массива всех рефератов выделен довольно большой набор слов-меток и словосочетаний, характеризующих определённые аспекты содержания.


Так как многие положения работы [167] остаются актуальными до сих пор, мы полностью приводим одну из её таблиц, в которой собраны данные, позволяющие судить о наиболее употребительных для каждого аспекта маркерах.

В таблицу 10 включены только те опознавательные слова и словосочетания, которые встречаются в рефератах не менее шести раз.

Таблица 10.



Дата добавления: 2022-02-05; просмотров: 300;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.044 сек.