Алгоритм извлечения знаний из текста


В заключение предложим одну из возможных практических методик анали­за текстов с целью извлечения и структурирования знаний.

1. Составление "базового" списка литературы для ознакомления с предметной областью и чтение по списку.

2. Первое знакомство с текстом (беглое прочтение) с выписыванием незна­комых слов.

3. Консультации со специалистами или привлечение справочной литерату­ры для их понимания.

4. Внимательное (второе) прочтение текста с выписыванием наборов клю­чевых слов (ИКС), т. е. выделение "смысловых вех" (компрессия текста).

5. Определение связей между НКС, разработка семантической структуры текста в форме графа или "сжатого" текста (реферата), фактически формирование поля знаний.

6. Третье прочтение текста и коррекция поля знаний при необходимости.

Коммуникативные методы

Пассивные методы

Термин "пассивные" не должен вызывать иллюзий, в реальности же пассив­ные методы требуют от инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог.

Определение 2.7

Пассивные методы извлечения знаний включают методы, где ведущая роль в процедуре извлечения фактически передается эксперту, а инженер по знаниям только фиксирует рассуждения эксперта во время работы по принятию реше­ний.

Согласно классификации (см. рис. 2.14) к этой группе относятся:

Ø наблюдения;

Ø анализ протоколов "мыслей вслух";

Ø лекции.

Наблюдения

В процессе наблюдений инженер по знаниям находится непосредственно ря­дом с экспертом во время его профессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия.

Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Полезной может оказаться и видеозапись в реальном масштабе времени, если эксперт согласится. Непременное условие этого метода — невмешательство аналитика в работу эксперта хотя бы на первых порах. Именно метод наблюдений является единственно "чистым" методом, исключающим вмешательство инженера по знаниям и навязывание им каких-то своих структур представлений.

Существуют две основные разновидности проведения наблюдений:

Ø наблюдение за реальным процессом;

Ø наблюдение за имитацией процесса.

Обычно используются обе разновидности. Сначала инженеру по знаниям полезно наблюдать за реальным процессом, чтобы глубже понять предмет­ную область и отметить все внешние особенности процесса принятия реше­ния. Это необходимо для проектирования эффективного интерфейса пользователя. Ведь будущая ЭС должна работать именно в контексте такого реального производственного процесса. Кроме того, только наблюдение позволит аналитику увидеть предметную область, а, как известно, "лучше один раз увидеть, чем сто раз услышать".

Наблюдение за имитацией процесса проводят обычно также за рабочим ме­стом эксперта, но сам процесс деятельности запускается специально для аналитика. Преимущество этой разновидности состоит в том, что эксперт менее напряжен, чем в первом варианте, когда он работает на "два фрон­та" — и ведет профессиональную деятельность, и демонстрирует ее. Недос­таток совпадает с преимуществом — именно меньшая напряженность экс­перта может повлиять на результат — раз работа ненастоящая, то и решение может отличаться от настоящего.

Наблюдения за имитацией проводят также и в тех случаях, когда наблюде­ния за реальным процессом по каким-либо причинам невозможны (напри­мер, профессиональная этика врача-психиатра может не допускать присут­ствия постороннего на приеме).

Сеансы наблюдений могут потребовать от инженера по знаниям:

Ø овладения техникой стенографии для фиксации действий эксперта в ре­альном масштабе времени;

Ø ознакомления с методиками хронометража для четкого структурирования производственного процесса по времени;

Ø развития навыков "чтения по глазам", т. е. наблюдательности к жестам, мимике и другим невербальным компонентам общения;

Ø серьезного предварительного знакомства с предметной областью, т. к. из-за отсутствия "обратной связи" иногда многое непонятно в действиях экспертов.

Протоколы наблюдений после сеансов в ходе домашней работы тщательно расшифровываются, а затем обсуждаются с экспертом.

Таким образом, наблюдения — один из наиболее распространенных мето­дов извлечения знаний на начальных этапах разработки. Обычно он приме­няется не самостоятельно, а в совокупности с другими методами.

Анализ протоколов "мыслей вслух"

Протоколирование "мыслей вслух", или "вербальные отчеты" [Моргоев, 1988], отличается от наблюдений тем, что эксперта просят не просто прокоммен­тировать свои действия и решения, но и объяснить, как это решение было найдено, т. е. продемонстрировать всю цепочку своих рассуждений. Во вре­мя рассуждений эксперта все его слова, весь "поток сознания" протоколиру­ется инженером по знаниям, при этом полезно отметить даже паузы и меж­дометия.

Вопрос об использовании для этой цели магнитофонов и диктофонов явля­ется дискуссионным, поскольку магнитофон иногда парализующе действует на эксперта, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основной трудностью при протоколировании "мыслей вслух" является принципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мысли­тельные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, различные процедурные знания типа "как завязывать шнурки"), вообще слабо коррелируют с их словесным описанием. Автор теории фреймов М. Минский считает, что "только как исключение, а не как правило, человек может объяснить то, что он знает" [Minsky, 1981]. Однако существуют люди, склонные к рефлексии, для которых эта работа является вполне доступной. Следовательно, описанная в разд. 3.3 такая характери­стика когнитивного стиля, как рефлексивность, является для эксперта более чем желательной.

Расшифровка полученных протоколов производится инженером по знаниям самостоятельно, с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" является одним из наиболее эффективных методов извлечения, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, никто ему не меша­ет, он как бы свободно парит в потоке собственных умозаключений и рас­суждений. Он может здесь блеснуть эрудицией, продемонстрировать глуби­ну своих познаний. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.

От инженера по знаниям метод "мысли вслух" требует тех же умений, что и метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных методов для реализации обратной связи между интерпретацией инженера по знаниям и представлениями эксперта.

Лекции

Лекция является самым старым способом передачи знаний. Лекторское искусство издревле очень высоко ценилось во всех областях науки и культуры.

Но нас сейчас интересует не столько способность к подготовке и чтению лекций, сколько способность эту лекцию слушать, конспектировать и ус­ваивать. Уже говорилось, что чаще всего экспертов не выбирают, и поэтому учить эксперта чтению лекции инженер по знаниям не сможет. Но если эксперт имеет опыт преподавателя (например, профессор клиники или опытный руководитель производства), то можно воспользоваться таким концентрированным фрагментом знаний, как лекция.

В лекции эксперту предоставлено много степеней свободы для самовыраже­ния; при этом необходимо сформулировать эксперту тему и задачу лекции. Например, тема цикла лекций "Постановка диагноза — воспаление легких", тема конкретной лекции "Рассуждения по анализу рентгенограмм", задача — научить слушателей по перечисленным экспертом признакам ставить диаг­ноз воспаления легких и делать прогноз. При такой постановке опытный лектор может заранее структурировать свои знания и ход рассуждений. От инженера по знаниям в этой ситуации требуется лишь грамотно законспек­тировать лекцию и в конце задать необходимые вопросы.

Студенты хорошо знают, что конспекты лекций одного и того же лектора у разных студентов существенно отличаются. Списать конспект лекций просят, как правило, у одного-двух студентов из группы. Люди, умело ведущие конспект, обычно сильные студенты. Обратное не верно. В чем же заключается искусство ведения конспекта? В "помехоустойчивости". Записывать главное, опускать второстепенное, выделять фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные предложения, уметь обобщать.

Хороший вопрос по ходу лекции помогает и лектору, и слушателю. Серьез­ные и глубокие вопросы могут существенно поднять авторитет инженера по знаниям в глазах эксперта.

Опытный лектор знает, что все вопросы можно условно разбить на три группы:

Ø умные вопросы, углубляющие лекцию;

Ø глупые вопросы или вопросы не по существу;

Ø вопросы "на засыпку", или провокационные.

Если инженер по знаниям задает вопросы второго типа, то возможны две реакции. Вежливый эксперт будет разговаривать с таким аналитиком как с ребенком, который сейчас не понимает и все равно ничего уже не поймет. Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же инженер по знаниям захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.

Продолжительность лекции рекомендуется стандартная — от 40 до 50 минут и через 5—10 минут — еще столько же. Курс обычно от двух до пяти лекций.

Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.



Дата добавления: 2021-12-14; просмотров: 489;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.012 сек.