Алгоритм извлечения знаний из текста
В заключение предложим одну из возможных практических методик анализа текстов с целью извлечения и структурирования знаний.
1. Составление "базового" списка литературы для ознакомления с предметной областью и чтение по списку.
2. Первое знакомство с текстом (беглое прочтение) с выписыванием незнакомых слов.
3. Консультации со специалистами или привлечение справочной литературы для их понимания.
4. Внимательное (второе) прочтение текста с выписыванием наборов ключевых слов (ИКС), т. е. выделение "смысловых вех" (компрессия текста).
5. Определение связей между НКС, разработка семантической структуры текста в форме графа или "сжатого" текста (реферата), фактически формирование поля знаний.
6. Третье прочтение текста и коррекция поля знаний при необходимости.
Коммуникативные методы
Пассивные методы
Термин "пассивные" не должен вызывать иллюзий, в реальности же пассивные методы требуют от инженера по знаниям не меньшей отдачи, чем такие активные методы, как игры и диалог.
Определение 2.7
Пассивные методы извлечения знаний включают методы, где ведущая роль в процедуре извлечения фактически передается эксперту, а инженер по знаниям только фиксирует рассуждения эксперта во время работы по принятию решений.
Согласно классификации (см. рис. 2.14) к этой группе относятся:
Ø наблюдения;
Ø анализ протоколов "мыслей вслух";
Ø лекции.
Наблюдения
В процессе наблюдений инженер по знаниям находится непосредственно рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности. При подготовке к сеансу извлечения эксперту необходимо объяснить цель наблюдений и попросить максимально комментировать свои действия.
Во время сеанса аналитик записывает все действия эксперта, его реплики и объяснения. Полезной может оказаться и видеозапись в реальном масштабе времени, если эксперт согласится. Непременное условие этого метода — невмешательство аналитика в работу эксперта хотя бы на первых порах. Именно метод наблюдений является единственно "чистым" методом, исключающим вмешательство инженера по знаниям и навязывание им каких-то своих структур представлений.
Существуют две основные разновидности проведения наблюдений:
Ø наблюдение за реальным процессом;
Ø наблюдение за имитацией процесса.
Обычно используются обе разновидности. Сначала инженеру по знаниям полезно наблюдать за реальным процессом, чтобы глубже понять предметную область и отметить все внешние особенности процесса принятия решения. Это необходимо для проектирования эффективного интерфейса пользователя. Ведь будущая ЭС должна работать именно в контексте такого реального производственного процесса. Кроме того, только наблюдение позволит аналитику увидеть предметную область, а, как известно, "лучше один раз увидеть, чем сто раз услышать".
Наблюдение за имитацией процесса проводят обычно также за рабочим местом эксперта, но сам процесс деятельности запускается специально для аналитика. Преимущество этой разновидности состоит в том, что эксперт менее напряжен, чем в первом варианте, когда он работает на "два фронта" — и ведет профессиональную деятельность, и демонстрирует ее. Недостаток совпадает с преимуществом — именно меньшая напряженность эксперта может повлиять на результат — раз работа ненастоящая, то и решение может отличаться от настоящего.
Наблюдения за имитацией проводят также и в тех случаях, когда наблюдения за реальным процессом по каким-либо причинам невозможны (например, профессиональная этика врача-психиатра может не допускать присутствия постороннего на приеме).
Сеансы наблюдений могут потребовать от инженера по знаниям:
Ø овладения техникой стенографии для фиксации действий эксперта в реальном масштабе времени;
Ø ознакомления с методиками хронометража для четкого структурирования производственного процесса по времени;
Ø развития навыков "чтения по глазам", т. е. наблюдательности к жестам, мимике и другим невербальным компонентам общения;
Ø серьезного предварительного знакомства с предметной областью, т. к. из-за отсутствия "обратной связи" иногда многое непонятно в действиях экспертов.
Протоколы наблюдений после сеансов в ходе домашней работы тщательно расшифровываются, а затем обсуждаются с экспертом.
Таким образом, наблюдения — один из наиболее распространенных методов извлечения знаний на начальных этапах разработки. Обычно он применяется не самостоятельно, а в совокупности с другими методами.
Анализ протоколов "мыслей вслух"
Протоколирование "мыслей вслух", или "вербальные отчеты" [Моргоев, 1988], отличается от наблюдений тем, что эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т. е. продемонстрировать всю цепочку своих рассуждений. Во время рассуждений эксперта все его слова, весь "поток сознания" протоколируется инженером по знаниям, при этом полезно отметить даже паузы и междометия.
Вопрос об использовании для этой цели магнитофонов и диктофонов является дискуссионным, поскольку магнитофон иногда парализующе действует на эксперта, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.
Основной трудностью при протоколировании "мыслей вслух" является принципиальная сложность для любого человека объяснить, как он думает. При этом существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того, часть знаний, хранящихся в невербальной форме (например, различные процедурные знания типа "как завязывать шнурки"), вообще слабо коррелируют с их словесным описанием. Автор теории фреймов М. Минский считает, что "только как исключение, а не как правило, человек может объяснить то, что он знает" [Minsky, 1981]. Однако существуют люди, склонные к рефлексии, для которых эта работа является вполне доступной. Следовательно, описанная в разд. 3.3 такая характеристика когнитивного стиля, как рефлексивность, является для эксперта более чем желательной.
Расшифровка полученных протоколов производится инженером по знаниям самостоятельно, с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" является одним из наиболее эффективных методов извлечения, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, никто ему не мешает, он как бы свободно парит в потоке собственных умозаключений и рассуждений. Он может здесь блеснуть эрудицией, продемонстрировать глубину своих познаний. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.
От инженера по знаниям метод "мысли вслух" требует тех же умений, что и метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных методов для реализации обратной связи между интерпретацией инженера по знаниям и представлениями эксперта.
Лекции
Лекция является самым старым способом передачи знаний. Лекторское искусство издревле очень высоко ценилось во всех областях науки и культуры.
Но нас сейчас интересует не столько способность к подготовке и чтению лекций, сколько способность эту лекцию слушать, конспектировать и усваивать. Уже говорилось, что чаще всего экспертов не выбирают, и поэтому учить эксперта чтению лекции инженер по знаниям не сможет. Но если эксперт имеет опыт преподавателя (например, профессор клиники или опытный руководитель производства), то можно воспользоваться таким концентрированным фрагментом знаний, как лекция.
В лекции эксперту предоставлено много степеней свободы для самовыражения; при этом необходимо сформулировать эксперту тему и задачу лекции. Например, тема цикла лекций "Постановка диагноза — воспаление легких", тема конкретной лекции "Рассуждения по анализу рентгенограмм", задача — научить слушателей по перечисленным экспертом признакам ставить диагноз воспаления легких и делать прогноз. При такой постановке опытный лектор может заранее структурировать свои знания и ход рассуждений. От инженера по знаниям в этой ситуации требуется лишь грамотно законспектировать лекцию и в конце задать необходимые вопросы.
Студенты хорошо знают, что конспекты лекций одного и того же лектора у разных студентов существенно отличаются. Списать конспект лекций просят, как правило, у одного-двух студентов из группы. Люди, умело ведущие конспект, обычно сильные студенты. Обратное не верно. В чем же заключается искусство ведения конспекта? В "помехоустойчивости". Записывать главное, опускать второстепенное, выделять фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные предложения, уметь обобщать.
Хороший вопрос по ходу лекции помогает и лектору, и слушателю. Серьезные и глубокие вопросы могут существенно поднять авторитет инженера по знаниям в глазах эксперта.
Опытный лектор знает, что все вопросы можно условно разбить на три группы:
Ø умные вопросы, углубляющие лекцию;
Ø глупые вопросы или вопросы не по существу;
Ø вопросы "на засыпку", или провокационные.
Если инженер по знаниям задает вопросы второго типа, то возможны две реакции. Вежливый эксперт будет разговаривать с таким аналитиком как с ребенком, который сейчас не понимает и все равно ничего уже не поймет. Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же инженер по знаниям захочет продемонстрировать свою эрудицию вопросами третьего типа, то ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.
Продолжительность лекции рекомендуется стандартная — от 40 до 50 минут и через 5—10 минут — еще столько же. Курс обычно от двух до пяти лекций.
Метод извлечения знаний в форме лекций, как и все пассивные методы, используют в начале разработки как эффективный способ быстрого погружения инженера по знаниям в предметную область.
Дата добавления: 2021-12-14; просмотров: 483;