Факторы уверенности

<63 64 656667 68 69 >

Коэффициенты уверенности. Существенной в нечеткой логике является проблема взвешивания сведений. Предположим, что имеется следующий набор продукционных правил:

Правило 1:

ЕСЛИ x имеет ликвидный баланс

И x имеет коэффициент текущей ликвидности=2,2

ТО x выделить кредит

Правило 2:

ЕСЛИ x имеет ликвидный баланс

И x имеет коэффициент промежуточной ликвидности=0,25

ТО x выделить кредит.

Предположим, что ликвидность баланса клиента-заемщика x оценивается на 1 (определенность равна 1) и коэффициент текущей ликвидности, равный 2,2 оценивается на 0,7. Тогда условия ликвидности, входящие в правило 1, имеют совместное значение степени истинности, равное 0,7 (операция min). Предположим для простоты, что степень истинности заключений в правилах совпадает со степенями истинности их условий (хотя это не обязательно). Тогда степень истинности заключения «x выделить кредит» равна 0,7.

Для правила 2, известно, что степень истинности условий «х имеет ликвидный баланс» равна 0,5 и «х имеет коэффициент промежуточной ликвидности=0,25» равна 0,25, тогда степень истинности заключения «х выдать кредит» равна 0,25 (операция min).

Теперь, как нам рассматривать эти противоречивые значения: максимальное, минимальное или какую-либо функцию от двух чисел?

Проблемы возникают и в том случае, если два свидетельства не вступают в противоречие: два различных правила, указывающих в пользу одного и того же заключения, обычно усиливают знание к нему, давая более высокое значение степени истинности, чем среднее или максимальное. Такие же трудности имеют место, если действие нескольких таких правил не может быть полностью компенсировано правилом, указывающим противоположное действие. Исследование этих проблем относится в большей степени к теории свидетельств, чем к нечеткой логике. Использование нечеткой логики само по себе не решает проблем, связанных с взаимным взвешиванием раздельных (и, возможно, противоречивых) сведений. Рассмотрим одну из схем, использующую свидетельства для получения степени уверенности в предполагаемой гипотезе.

Эта схема предложена Шортлиффом и применяется в ЭС MYCIN. Она основывается на так называемых коэффициентах уверенности, предназначенных для измерения степени доверия к заключению, которое является результатом полученных свидетельств. Коэффициент уверенности - это разность между двумя мерами:

КУ[h:e]=МД[h:e]-МНД[h:e],

где КУ[h:e] - уверенность в гипотезе h с учетом свидетельств e; МД[h:e] - мера доверия гипотезе h при заданном e, тогда как МНД[h:e] - мера недоверия h при свидетельствах e.

Коэффициент КУ может изменятся от -1 (абсолютная ложь) до +1 (абсолютная истина), принимая также все промежуточные значения между -1 и +1. Значения МД и МНД могут изменяться только от 0 до +1. Заметим, что эта формула не позволяет отличать случай противоречащих свидетельств, когда МД и МНД обе велики, от случая недостаточной информации, когда МД и МНД очень малы. Заметим также, что КУ, МД и МНД не являются вероятностными мерами.

До сих пор из нечеткой логики в этой формуле использовались операции MIN, MAX и вычитание из 1. Существенной была введенная формула уточнения, по которой новую информацию можно сочетать со старыми результатами. Она применяется к мерам доверия и недоверия, связанными с каждой гипотезой. Формула для МД имеет следующий вид:

МД[h:e₁,e₂]=МД[h:e₁]+МД[h:e₂](1-МД[h:e₁]),

где запятая между e₁ и e₂ означает, что e₂ следует за e₁. Аналогичным образом уточняется МНД. Смысл формулы состоит в том, что влияние второго свидетельства e₂ оценивается смещением МД в сторону полной определенности на расстояние, зависящее от второго свидетельства.

Эта формула имеет два важных свойства:

1. Она симметрична относительно следования e₁ и e₂.

2. По мере накопления подкрепляющих свидетельств величина МД (или МНД) движется к определенности.

Возвратимся к предыдущему примеру, указывая в скобках значение МД для свидетельств.

Правило 1:

ЕСЛИ x имеет ликвидный баланс (0,75)

И x имеет коэффициент абсолютной ликвидности (0,6)

ТО x выделить кредит.

Правило 2:

ЕСЛИ x имеет ликвидный баланс (0,5)

ИЛИ x имеет коэффициент абсолютной ликвидности (0,7)

ТО x выделить кредит.

Операция И в первом правиле определяет минимальное из значений 0,75 и 0,6 т.е. 0,6. Операция ИЛИ во втором правиле требует взятия максимального из значений 0,5 и 0,7, т.е. 0,7.

Тогда гипотеза, что “x выделить кредит” поддерживается правилом 1 со значением 0,6 и правилом 2 со значением 0,7. Применяя приведенную формулу, получаем

МД[кредит: правило 1, правило 2] =

= МД[кредит: правило 1] +

+ МД[лредит: правило 2] ∙

∙ (1- МД[информатика: правило 1]) =

= 0,6 + 0,70,4 = 0,88.

Таким образом, объединенная мера доверия оказывается выше, чем при учете каждого свидетельства, взятого отдельно. Это согласуется с нашей интуицией, что несколько свидетельств в одном направлении подкрепляют друг друга. Заметим, что порядок использования правил 1 и 2 не влияет на результат. Схема Шортлиффа допускает также возможность указывать надежность не только свидетельств, но и правил. Каждое правило снабжено так называемым “коэффициентом ослабления”, числом от 0 до 1, показывающим надежность правила. Пусть в нашем примере надежность правила 1 равна 0,65, а правила 2 - 0,75. Полученные ранее значения для правила 1 - 0,6 и правила 2 - 0,7 следует умножить на соответствующие коэффициенты ослабления 0,65 и 0,75, что дает значение 0,39 для правила 1 и 0,525 для правила 2. Применяя формулу уточнения Шортлиффа, получаем

МД[кредит: правило 1, правило 2] = 0,39+0,255 ∙0,61=0,71025.

Попытки Шортлиффа дать теоретическое обоснование этим методам были не слишком убедительны. Однако опыт использования предложенных приемов в системе MYCIN и при решении финансово-экономических задач дал хорошие результаты.

Трудности с методом Байеса. Несмотря на полезное использование теоремы Байеса, ее применение требует знания многих вероятностей. Например, метод Байеса позволяет определить вероятность экономического явления (спад, подъем, кризис и т.п.) определенной причины:

где сумма по i распространяется на все экономические явления;

D_i- i-е явление; E - свидетельство; P(E) - априорная вероятность; P(E|D_i) - условная вероятность того, что будет свидетельство (причина) при наличии экономического явления D_i.

Обычно невозможно определить полные значения этих вероятностей на все случаи жизни для одного предприятия. На практике свидетельство накапливается по частям. Это требует значительного времени и стоимости, особенно когда требуются проверки. Эти факторы времени, стоимости и потенциального риска к предприятию обычно ограничивают число тестов, выполняемых для хорошей диагностики.

Удобная форма теоремы Байеса выражает накопление свидетельств по частям:

где E₂ - новое свидетельство, добавляемое к существующему свидетельству E₁, чтобы сформировать новое свидетельство:

E=E₁ÙE₂ .

Хотя формула является точной, все эти вероятности обычно неизвестны. Такая ситуация становится тем хуже, чем больше частей свидетельства накапливается и чем больше требуется вероятностей.

Доверие и недоверие. Кроме проблемы накопления всех условных вероятностей для метода Байеса, другая важная проблема появляется в связи с доверием и недоверием. Прежде всего, доверие противоположно недоверию и поэтому P(H)+P(H')=1 и P(H)=1-P(H').

Для случая апостериорной гипотезы, которая связана со свидетельствами E:

12.1

Однако, исследование показателей с выражением знаний в форме (12.1).

является исключительно нежелательным.

Например, рассмотрим следующее правило:

ЕСЛИ

1) клиент имеет постоянную работу;

2) клиент имеет адекватную прибыль;

3) клиент имеет адекватное имущество

ТО степень доверия тому, что кредитная закладная будет одобрена, равна 0,7, т.е.

12.2)

где E_i, i=1,2,3 соответствует трем условиям в правиле.

Формула (12.2) эксперта может оказаться непростой для инженера по знаниям и поэтому последний использует также формулу (12.3):

(12.3)

Нежелание эксперта согласиться с уравнением (12.3) показывает, что эти числа 0,7 и 0,3 являются подобными доверию, а не вероятностям.

Меры доверия и недоверия. В системе MYCIN уровень уверенности

был определен как разность между мерой доверия и недоверия:

(12.4)

где CF - фактор уверенности в гипотезе H при выполнении свидетельства E, MB - мера увеличения доверия гипотезе H при наличии свидетельства E, MD - мера увеличения недоверия гипотезе H при наличии свидетельства E.

Фактор уверенности позволяет комбинировать меру доверия и недоверия в единственное число.

Комбинирование мер доверия и недоверия в одно число имеет два применения. Первое, фактор уверенности может быть использован для упорядочения гипотез по их важности. Например, если предприятие имеет некоторые причины, свидетельствующие о возможных экономических явлениях, тогда экономическое явление с уровнем CF будет тем, которое первым исследовано путем упорядочения проверок.

Меры доверия и недоверия были определены в терминах вероятностей следующим образом:

(12.5)

Теперь max{0, 1} всегда равен 1 и min{0, 1} равен 0. Смысл записи 1 и 0 в терминах max и min состоит в том, чтобы показать формальную симметрию между MD и MB.

Уравнения (12.5) для MB и MD различаются только в замене max на min и наоборот. В соответствии с этими определениями некоторые характеристики указаны в табл.12.1.

Таблица 12.1. Некоторые характеристики MB, MD, CF

Характеристики	Значения
Пределы	0 £ MB £ 1 0 £ MD £ 1 -1 £ CF £ 1
Уверенность в истинности гипотезы P(H'\|E)=1	MB=1 MD=0 CF=-1
Уверенность в ложности гипотезы	MB=0 MD=1 CF=-1
Отсутствие свидетельства P(H\|E)=P(H)	MB=0 MD=0 CF=0

Фактор уверенности CF указывает чистое доверие гипотезе, учитывая некоторое свидетельство. Положительное значение CF означает, что свидетельство поддерживает гипотезу, поскольку MB>MD. Значение CF=1 означает, что свидетельство окончательно доказывает гипотезу. Значение CF=0 означает одну из двух возможностей. Первая, значение CF=MB-MD может означать, что MB=MD=0, т.е. свидетельство отсутствует. Вторая, возможность, если MB=MD и оба значения не равны нулю. Результат в этом случае означает, что уверенность отвергается неуверенностью.

Отрицательное значение CF означает, что свидетельство благоприятствует отрицанию гипотезы, поскольку MB<MD. То есть недоверие гипотезе превышает доверие ей. CF=-70% означает, что недоверие гипотезе на 70% больше, чем доверие ей. CF=70% - доверие гипотезе на 70% больше, чем недоверие.

Заметим, что важна только разность между значениями по отдельности. Например,

CF=0,6-0=0,7-0,1.

Факторы уверенности позволяют эксперту выражать доверие, используя значение недоверия:

CF(H,E)+CF(H',E)=0,

Это означает, что свидетельство, поддерживающее гипотезу, уменьшает поддержку отрицания гипотезы на равное число, так что сумма всегда равна нулю.

Например, закладная одобряется, если

CF(H|E)=0,7, CF(H'|E)=-0,7,

которое означает:

1) я уверен на 70%, что будет одобрена закладная, если мой рейтинг высокий;

2) я уверен на -70%, что не будет одобрена закладная, если мой рейтинг низкий.

Отметим, что -70% может иметь место, так как факторы уверенности определены на интервале -1£ CF(H, E)£1, где нуль означает отсутствие свидетельства. Таким образом, значения, больше нуля благоприятствуют гипотезе, в то время как значения меньше нуля благоприятствуют отрицанию гипотезы. Утверждения 1) и 2) эквивалентны использованию факторов уверенности, аналогичных тому факту, что “да” - это отрицание “нет”. Значения CF могут быть выбраны вопросами: “Насколько вы уверены в том, что “высокий” рейтинг поможет одобрению закладной, если свидетельство подтверждает гипотезу?” или “Насколько вы уверены в том, что ваш “высокий” рейтинг поможет одобрению закладной?” Ответ 70% на каждый вопрос будет CF(H|E)=70% и CF(H'|E)=-70%.

Вычисления с использованием факторов уверенности. Хотя первоначальное определение фактора уверенности было CF=MB - MD, были трудности с этим определением, так как одна часть неподкрепленного свидетельства может управлять утверждением многих других частей свидетельства. Например, десять частей свидетельства могут произвести MB=0,999, одна неподтвержденная часть с MD=0,799.

CF=0,999 - 0,799=0,2.

В системе MYCIN для посылки правила должно быть CF>0,2.

Игнорирование порога привело бы к активации многих правил с малым значением CF или его отсутствием, что существенно уменьшило бы эффективность системы.

Определение CF в MYCIN было изменено и имело вид:

чтобы ослабить влияние одной части неподтверждения свидетельства. При таком определении MB=0,999 и MD=0,799 получаем значение

которое сильно отличается от ранее полученного значения 0,2 и таким образом не активизирует правило, поскольку не более, чем 0,2. Здесь значение 0,995 является причиной активации правила.

В системе MYCIN способы для комбинирования свидетельства в посылке правила показаны в табл. 12.2.

Таблица 12.2. Правила системы MYCIN для комбинирования предшествующего свидетельства элементарных выражений

Свидетельство E	Уверенность в посылке
E₁ и E₂	min{CF(H,E₁),CF(H,E₂)}
E₁ или E₂	max{CF(H,E₁),CF(H, E₂)}
не E	-CF(H, E)

Например, если логическое выражение для комбинирования свидетельств имеет вид:

(E₁ И E₂ И E₃) ИЛИ (E₄ И НЕ E₅),

то свидетельство E может быть вычислено как:

E=max{min{E₁, E₂, E₃}, min{E₄, -E₅}}.

Для значений E₁-=0,9; E₂=0,8; E₃=0,3; E₄=-0,5; E₅=-0,4 получаем результат E=max{min{0,9, 0,8, 0,3}, min{-0,5, (-0,4)}} = max{0,3, -0,5} = 0,3

Вычисление фактора уверенности для правила

ЕСЛИ E, ТО H

задается формулой

(12.6)

где CF(E,e) - фактор уверенности свидетельства E, компенсирующего посылку правила при неопределенном свидетельстве е; CF(H, E) - фактор уверенности гипотезы в предположении, что свидетельство известно с уверенностью, когда CF(E, e)=1;

CF(H, e) - фактор уверенности гипотезы, который основывается на уверенности в свидетельстве e.

Таким образом, если все свидетельства в посылке известны с уверенностью, то формула для фактора уверенности гипотезы имеет вид

поскольку CF(E, e)=1.

В качестве примера этих факторов уверенности рассмотрим CF для закладной в правиле, которое мы обсуждали выше, где фактор уверенности гипотезы при наступлении некоторого события равен CF(H,E)=CF(H,E₁ÙE₂ÙE₃)=0,7 и он также называется фактором затухания.

Фактор затухания базируется на предположении, что все свидетельства E₁, E₂, E₃ известны с уверенностью. То есть

где e наблюдаемое свидетельство, ведущее к заключению, что E_i известны с уверенностью. Эти факторы CF аналогичны условным вероятностям P(E,e) свидетельства в системе ПРОСПЕКТОР.

Трудности с системой ПРОСПЕКТОР появляются, когда все свидетельства неизвестны с определенностью. Интерполяция формулы в системе ПРОСПЕКТОР была использована для случая неопределенного события. В случае системы MYCIN основная формула (12.6) используется для определения значения CF, поскольку CF(H,E₁ÙE₂ÙE₃)=0,7 небольшое значение для неопределенного свидетельства.

Например, определим, что

CF(E₁, e)=0.5,

CF(E₂, e)=0.6,

CF(E₃,e)=0.3,

тогда

CF(E,e)=CF(E₁ÙE₂ÙE₃,e)=min{CF(E₁,e), CF(E₂,e), CF(E₃,e)}=min{0.5, 0.6, 0.3}.

Поскольку CF посылки, CF(E,e)>0.2, то посылка рассматривается истинной и таким образом правило активируется. Фактор заключения будет равен

CF(H, e)=CF(E, e) ∙CF(H, e)=0,3 ∙0,7=0,21.

Предположим, что другое правило так же включает ту же гипотезу, но с другим фактором уверенности. Факторы уверенности правил, включающих одинаковые гипотезы, вычисляются путем функции комбинирования для уже определенных факторов уверенности:

где формула для CF_combin зависит от знака имеющихся факторов. Функция комбинирования для более чем двух факторов применяется путем повторного вычисления по формуле (12.7) n факторов и (n+1) факторов:

если оба больше нуля

Предположим, что третье правило имеет такое же заключение, но с CF₃=-0,4. Тогда вторая формула (12.7) дает результат

Формула (12.7) допускает коммутативность события, т.е. CF_combin(X, Y)=CF_co_m_bin(Y, X), и таким образом порядок получения свидетельств не влияет на результат.

Вместо того, чтобы хранить отдельно значения MD и MB для каждой гипотезы система MYCIN хранит текущее значение CF_combinдля каждой гипотезы и комбинирует его с новым свидетельством в соответствии с формулой (12.7).

Трудности с фактором уверенности. Несмотря на успешное практическое применение факторов уверенности в системе MYCIN, имеются трудности с их теоретическим обоснованием. Хотя факторы уверенности и используют теорию вероятностей и теорию возможностей в качестве теоретического фундамента, все же они были построены для специального случая. Главным преимуществом факторов уверенности была простота вычислений, посредством которых неопределенность могла быть распространена в системе. Факторы уверенности также позволяют легко понять и четко отделить доверие от недоверия.

Однако имеются и проблемы с фактором CF. Одна из проблем состоит в том, что значения CF могут быть противоположны условным вероятностям. Например, если P(H₁)=0,8, P(H₂)=0,2 P(H₁|E)=0,9, P(H₂|E)=0,6, то CF(H₁,E)=0,5 и CF(H₂|E)=0,75.

Поскольку одна из целей CF - упорядочить гипотезы в соответствии с причинами, то противоречие с гипотезой будет состоять в том, чтобы иметь высокую вероятность P(H|E) и низкий фактор уверенности CF(H|E).

Вторая главная проблема с фактором CF состоит в том, что в общем случае P(H|e)¹P(H|i)∙P(i|e), где i - некоторая промежуточная гипотеза, базирующаяся на свидетельстве E, и еще фактор уверенности двух правил в цепи вывода вычисляются как независимые вероятности CF(H, e)=CF(H,i) ∙CF(i, e).

Эта формула истинна только в специальном случае, когда статистическая популяция со свойством H содержится в популяции со свойством i и что содержится в популяции со свидетельством e. Успех системы MYCIN в игнорировании этих проблем состоит, вероятно, в выполнении короткой цепи вывода и использовании простых гипотез.

<63 64 656667 68 69 >

Дата добавления: 2016-10-26; просмотров: 4889;

Поиск по сайту

Узнать еще

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по географии

Публикации по медицине

Публикации по педагогике

Разделы публикаций