Байесовский принцип

Рассмотрим случай, когда технический объект подвергается испытаниям с целью определить возможности его дальнейшего использования. При такой постановке задачи фактически предполагается два возможных состояния объекта:

- состояние, допускающие возможности его дальнейшего использования (вероятность p₁);

- cостояние, исключающие возможность его дальнейшего использования (вероятность p₂).

Соответственно и множество возможных решений D, будет включать два решения:

d₁ - объект находится в состоянии ,

d₂ - объект находится в состоянии .

Пусть объективным признаком возможных состояний является некоторая измеряемая на опыте случайная величина X (например, начальная скорость, износ канала ствола и пр.).

Будем полагать, что закон распределения этой величины известен. При этом для обоих состояний объекта вид закона один и тот же (например, нормальный), но параметры разнятся, так что:

где - M[X] в состоянии ,

- M[X] в состоянии ,

– D[X] в состоянии ,

Представим плотность и на рисунке:

Выделим на этом рисунке некоторую граничную точку x₀ такую, чтобы при x <x₀ преобладающим является состояние w₁, тогда надо принимать решение d₁, а при x>x₀ – w₂, которому должно соответствовать решение d₂.

Однако, как видно из рисунка, при x>x₀ объект может пребывать в состоянии w₁ с вероятностью:

Это вероятность, с которой может быть принято решение d₂, хотя объект пребывает в состоянии w₁. Цена этого неправильного решения будет С₁₂.

Аналогично при x<x₀ может проявиться состояние w₂ с вероятностью:

Это вероятность принятия неправильного решения d₁, когда в действительности объект находится в состоянии w₂. Цена такого неправильного решения будет C₂₁.

В остальных случаях решения будут правильными с ценами С₁₁ и С₂₂ соответственно. Это так называемые «премии» за правильные решения.

Вероятности, с которыми могут появляться премии, равны:

Таким образом, по итогам испытаний могут быть приняты как правильные, так и неправильные решения и функция потерь при этом может быть представлена матрицей вида:

Как было видно, каждый элемент данной матрицы может появиться на практике с определенной вероятностью, то есть матрице C («матрице платежей») ставится в соответствие матрица вероятностей P:

Здесь p_ij - условные вероятности. Для перехода к безусловным вероятностям надо первую строку матрицы P’ умножить на p₁ (вероятность w₁), а вторую на p₂ (вероятность w₂):

Очевидно, что математическое ожидание C будет некоторой усредненной ценой. Обозначим M[C] = R. Тогда:

(2.1)

Зависимость (2.1) называется функцией среднего риска. Формально это функция, аргументом которой является величина х₀. Естественно потребовать для x₀ такого значения, при котором величина R была бы минимальной, то есть заложить условие:

(2.2)

Значение R = R_min называется байесовским риском.

Правило принятия решений, основанное на байесовском риске, называется байесовским принципом решения на множестве D.

В развернутом виде зависимость (2.1) выглядит следующим образом:

Поэтому:

Откуда:

(2.3)

Обычно С₁₁ = С₂₂ и тогда: (2.4)

Если > λ, то x < x₀ и принимается решение d₁.

В общем случае R – функционал:

<9 10 11 12 131415 >

Дата добавления: 2022-05-27; просмотров: 142;

Поиск по сайту

Публикации по технике и механике

Публикации по биологии

Публикации по информатике

Публикации по строительству

Публикации по физике

Публикации по химии

Публикации по электронике

Публикации по искусству

Публикации по географии

Публикации по медицине

Публикации по педагогике

Разделы публикаций