НЕПОЛНОЕ СТАТИСТИЧЕСКОЕ ОПИСАНИЕ ДАННЫХ НАБЛЮДЕНИЯ. ПАРАМЕТРИЧЕСКОЕ ОПИСАНИЕ АПРИОРНОЙ НЕОПРЕДЕЛЕННОСТИ
Сказанное выше о статистическом описании параметров , можно отнести и к данным наблюдения х. В соответствии с фактическим объемом знаний функция правдоподобия может быть определена с той степенью подробности, которая характерна для случаев, перечисленных в § 3.1. При этом аналогично классу можно ввести класс распределений вероятности (функций правдоподобия) для наблюдаемых данных х, к которому принадлежат все возможные при данном состоянии наших знаний распределения вероятности х ( ). Этот класс, естественно, зависит от параметров функции правдоподобия , определяющих последствия принимаемых решений и соответствующие им потери.
Однако, пожалуй, наиболее универсальным способом статистического описания априорной неопределенности и учета имеющихся ограниченных сведений применительно как к данным наблюдения х, так и к ненаблюдаемым параметрам , является параметрический способ, который рассмотрим более подробно.
Пусть, например, совокупность данных наблюдения х представляет собой последовательность , о которой известно, что все ее компоненты - независимые нормально распределенные величины с математическими ожиданиями , зависящими от , и неизвестной одинаковой дисперсией . Это дает основание определить условную плотность вероятности – функцию правдоподобия с точностью до одного неизвестного параметра , характеризующего интенсивность помехи, которая затрудняет наблюдение и принятие решения относительно :
. (3.2.1)
Приведенный пример - простейшая иллюстрация той распространенной на практике ситуации, когда имеющиеся априорные сведения качественного характера (независимость и нормальность ) дают возможность задать структуру необходимых распределений вероятности с точностью до каких-либо дополнительных неизвестных параметров.
Немного усложним этот пример, предположив для конкретности, что может принимать всего два значения и (это соответствует задаче принятия двухальтернативного решения). Пусть при математическое ожидание при всех и при
, (3.2.2)
где - известные величины; а - неизвестный коэффициент. Этот усложненный случай соответствует, например, задаче обнаружения сигнала известной формы, но неизвестной интенсивности на фоне шума неизвестной интенсивности. Как и в предыдущем примере, можно определить функцию правдоподобия с точностью до некоторого числа неизвестных параметров, а именно
,
, (3.2.3)
причем при функция правдоподобия зависит от одного неизвестного параметра , а при - от совокупности двух параметров { , а} и для любых значений этих параметров полностью определена.
Если в общем случае обозначить через совокупность дополнительных (по отношению к ) параметров, от которых зависит функция правдоподобия при данном значении , то подходящим выбором этих параметров можно добиться описания структуры функции правдоподобия , соответствующего имеющимся ограниченным статистическим сведениям относительно данных наблюдения х. В зависимости от полноты и детальности этих сведений структура функции правдоподобия может быть более или менее сложной, а количество неизвестных параметров велико или мало, но само параметрическое описание априорной неопределенности является практически универсальным способом учета ограниченных априорных сведений. По-видимому, стоит подчеркнуть, что в соответствии с введенным в гл. 2 определением как совокупности параметров, непосредственно влияющих на последствия от принятия решения и входящих в функцию потерь, под понимаются все другие параметры, от которых зависит распределение вероятности данных наблюдения х. При этом возможны случаи, когда все или часть параметров физически однородны с параметрами .
Приведем еще примеры параметрического описания для априорных распределений вероятности .Рассмотрим сначала заведомо предельный случай. Пусть , дискретно и имеет значения l = i = 1, …, m, которые могут приниматься с вероятностями . Если априорное распределение вероятности неизвестно, то в качестве неизвестных параметров могут рассматриваться сами эти вероятности , формальное задание которых с учетом естественных ограничений , определяет необходимое распределение вероятности через т - 1 неизвестный параметр.
Пусть далее представляет собой последовательность , описывающую процесс, подлежащий фильтрации, или состояние управляемого объекта и т. п., и пусть известно, что эта последовательность удовлетворяет рекуррентному соотношению (при непрерывном времени соответствующему дифференциальному равнению)
, (3.2.4)
где - известные величины, возможно, зависящие от управляющего воздействия; а - неизвестный коэффициент; - последовательности независимых нормально распределенных величин с нулевым математическим ожиданием и одинаковой неизвестной дисперсией . (Для случая, когда каждая из компонент и соответственно являются векторами некоторого порядка , а - соответствующей матрицей порядка , а заменяется на неизвестную корреляционную матрицу порядка , уравнение (3.2.4) описывает очень широкий класс линейных динамических объектов (или процессов) -го порядка, испытывающих воздействие случайных возмущений.) При этом соотношение (3.2.4) определяет марковскую последовательность с переходной плотностью вероятности
, (3.2.5)
зависящей от двух неизвестных параметров а и . Полная плотность распределения вероятности определяется с помощью (3.2.5) по формуле (3.1.7) и также является функцией этих неизвестных параметров.
По аналогии с обозначим через совокупность неизвестных параметров, от которых зависит априорное распределение вероятности с плотностью для параметров . В общем случае это дает возможность при ограниченных априорных сведениях о х и , задать - класс всех распределений известного вида , зависящих помимо , от совокупности неизвестных параметров и - класс распределений вида , зависящих от совокупности неизвестных параметров . Разным значениям , вообще говоря, могут соответствовать различные наборы параметров со своей областью изменения ( ). Очевидно, что подобно параметрам параметры являются аргументами функции правдоподобия . Отличие между этими двумя совокупностями заключается в том, что первая непосредственно влияет на последствия принимаемого решения и определяет величину потерь, в то время как совокупность параметров не является аргументом функции потерь и не влияет на последствия решений непосредственно. Эта совокупность характеризует ту дополнительную неопределенность, которая имеет место из-за неполного знания статистических свойств наблюдаемых данных х при каждом данном значении .
Совокупность параметров используется для описания не полностью известной априорной статистики . Содержание этой совокупности должно быть таково, чтобы имелась возможность определить с точностью до этих параметров априорное распределение вероятности с плотностью при некоторых значениях из области значений ( ).
Стоит отметить, что среди параметров и могут быть одинаковые, или даже совокупность параметров может содержать в себе всю совокупность параметров . Пусть, например, исходное статистическое описание данных наблюдения х состоит в задании плотности распределения вероятности , где - две совокупности параметров, первая из которых полностью неизвестна, а вторая статистически связана с совокупностью параметров , так что она подчиняется распределению вероятности с плотностью , зависящей от третьей совокупности неизвестных параметров . Представляя в виде
,
где - плотность распределения вероятности , заданная с точностью до совокупности параметров , и выполняя интегрирование по получаем плотность распределения вероятности
,
которая зависит от и . Обозначив совокупность этих параметров через , получим стандартное представление для функции правдоподобия , где совокупность параметров включает в себя и параметры , от которых зависит плотность априорного распределения вероятности.
Приведем другой пример более конкретного вида. Пусть , то есть принимает дискретные значения с вероятностями , и величины неизвестны. Тогда - совокупность параметров ( ), подчиненных ограничениям , . Пусть также совокупность данных наблюдения х есть , где величины ( )и х взаимно независимы, распределение вероятности величины х зависит от и имеет условную плотность вероятности
,
авеличины не зависят от и имеют плотность распределения вероятности
,
где - те же функции, что и выше, а - те же значения вероятностей, которые описывают распределение параметра . Полная совокупность данных наблюдения имеет плотность распределения вероятности
изависит от совокупности параметров ,а плотность априорного распределения вероятности для
зависит от совокупности тех же параметров, то есть в данном случае
,
и обе совокупности полностью совпадают.
Приведенные примеры иллюстрируют возможности параметрического описания априорной неопределенности и богатство возникающих при этом возможностей.
Параметрическое описание является удобным средством для учета имеющихся качественных представлений о статистическом поведении наблюдаемых данных х и параметров в сочетании с незнанием детальных количественных характеристик, точно определяющих это описание. Именно такое сочетание наиболее характерно для большинства прикладных задач. Качественные представления, основанные на физической сущности рассматриваемой задачи, дают возможность задать структуру распределений вероятности для х и , а параметры и сосредоточивают в себе имеющуюся неопределенность, не допускающую дальнейшую детализацию и уточнение качественной структуры. В роли параметров и в практических задачах могут выступать интенсивности полезных сигналов, несущих информацию о , и сопровождающих их помех, времена корреляции, характеристики объектов управления, параметры аппроксимирующих функций или дифференциальных уравнений, используемых при описании процессов и т. п. При параметрическом описании можно использовать также идеи прямых вариационных методов, вводя распределения и в виде обрывков рядов по какой-либо полной системе известных функций. Последнее дает возможность использовать параметрическое описание формально, расширяя границы его применения на те случаи, когда апелляция к физическому содержанию задачи затруднительна.
Наконец, если х или имеют конечное множество значений, то в качестве параметров и можно рассматривать сами неизвестные вероятности этих значений. Таким образом, параметрическое описание априорной неопределенности является достаточно универсальным средством учета ограниченных априорных сведений.
Это описание должно удовлетворять двум подчас противоречивым требованиям. Во-первых, оно должно качественно правильно и по возможности количественно точно отражать наши ограниченные априорные знания, так чтобы распределения с плотностями и действительно представляли при каких-нибудь и возможные в данной задаче распределения. Во-вторых, число параметров не должно быть слишком велико. Увеличение размерности приводит к ухудшению качества решения основной задачи как из-за сложности технической реализации алгоритмов обработки данных наблюдения х, так и из-за утраты некоторой доли входной информации, которую неизбежно приходится затрачивать для определения значений или исключения неизвестных мешающих параметров. Поэтому синтезируемую в условиях априорной неопределенности систему целесообразно дополнять алгоритмом проверки правильности априорных предположений, положенных в основу принятого в данной задаче параметрического описания. Задача такого алгоритма - установить, верно ли качественно введенное описание (например, при фильтрации процесса - соответствует ли действительности аппроксимация полиномом заданной степени с неизвестными коэффициентами или эта модель неудовлетворительна) и достаточно ли числа введенных параметров. Такой алгоритм дает возможность при необходимости усложнить параметрическое описание, увеличив число параметров или качественно изменив модель априорной неопределенности.
Введение дополнительных «мешающих» параметров при задании функции правдоподобия для описания неопределенности статистических свойств данных наблюдения х является традиционным для тех разделов математической статистики, которые имеют дело со статистическими выводами и принятием решений. Этим способом получены весьма существенные результаты, в особенности применительно к задаче проверки сложных статистических гипотез, где удалось получить ряд строгих результатов. Этот подход широко использован при синтезе приближенно оптимальных систем обработки информации более широкого класса.
Дата добавления: 2018-05-10; просмотров: 1068;