Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 23
Текст из файла (страница 23)
3. Способ комбинации сигнала я, и шума й, в канале Н,. 4. Оператор объекта з = Р (з, и). 5. Априорные вероятностные характеристики случайного процесса г. 6. Вероятностные характеристики шума д. 7. Способ комбинации шума й и сигнала и в канале 6. 8. Выражение функции риска И'. Требуется выработать оптимальное управление и *, т. е. такое управление, которое минимизировало бы средний риск Л. В излоекенной постановке задача пока принципиально не отличается от вадачи без накопления информации, рассмотренной в предыдущем параграфе, различие пока эе состоит лишь в количестве данных (три помехи вместо одной). Существенное различие, однако, возникает тогда, когда па основании ряда измерений величины у в предшествующие моменты времени мы Рвс.
5-5. можем уточнить вероятностную характе- ристику процесса х„т. е. найти его а и о с т е р и о р н у ю в е р о я т н о с т н у ю х а р а к т еристику. В том случае, когда характер процесса измерения и обработки измеренной информации не зависит от процесса управления и, мыимеемдело с независимым накоплением информации. Для того чтобы ознакомиться с методикой решения задач данного типа, начнем с рассмотрения одной из составных частей системы, а именно той ее части, где происходит измерение и уточнение вероятностных характеристик задающего воздействия х .
Блок-схема этой части показана на рис. 5-5. На ней показанй канал связи П, и часть управляющего устройства ПР, вырабатывающая некоторый сигнал е), содержащий в себе указание, основывающееся на результатах наблюдения предыстории у (~) о том, как надлежит действовать дальше. Этот сигнал и' назовем ре|пением о том, к какому классу следует отвести поступивший на вход устройства принятия решения ПР сигнал. В зависимости от типа требуемого решения й можно указать следующие основные типы теории статистических решений. 1.
Теория двуольтернативных решений. Случайный процесс зависит от одного неиавестного параметра Х: 120 Хе=х (Ю, й). Например: х = Л э|в (со с + сре), где ю, и срв заданы. Параметр Л при этом может принимать лишь одно из двух значений: либо Л„либо Лм В частном случае, когда Л, = О, Л, ~ О, получаем з а д а ч у обнаружения сигнала. В более общем случае Л может быть многомерным вектором, каждая компонента которого может принимать одно из двух значений Ло или Л„: Л11 Л13 ' ' ' Л12а Л= или Л„Лэм ...,Л, . В этом случае могут быть два решения, каждое из них должно выражаться определенным сигналом. 2.
Теория мноеоальтернотивнмх решений. В этом случае параметр Л может иметь г различных значений, и решения е( должны выражаться посредством г различных сигналов, соответствующих г аначениям параметра Л. о. Теория оценки параметров. Параметр Л может принять любое из бесконечного множества значений в некоторой области 'ье' (Л) с априорной плотностью вероятности Р (Л). Теория оценки параметров дает возможность выработать бесчисленное множество сигналов д, обычно в форме функции е( (Л). 4.
Теория оценки процессов. Параметр Л является функцией времени Л (~), и требуется оптимальным в каком-либо смысле образом оценить форму и параметры этой функции. Мы можем представить себе три конечно- или бесконечномерных, в зависимости от характера задачи, пространства; пространство сигналов Хе = (хм, хем ..., х,), пространство наблюдений У = — (у„у„..., у„) и пространство решений Р = (4, 4, д,). Так как каждому наблюдению у,. должно соответствовать свое решение о„то пространство решений представляет собою отображение пространства наблюдений, а правило отображения, которое является одновременно и алгоритмом управляющего (или приемного) устройства, в теории статистических решений называется стратегией устройства. Возможны два типа стратегий — регулярные, где каждой точке пространства У соответствует определенная точка пространства Р, и случайные, где каждому фиксированному У соответствует некоторая плотность распределения вероятности Ь (Р(У) точек пространства Р.
Регулярную стратегию можно рассматривать кан предел случайной стратегии, когда дисперсия точек пространства Р, соответствующих наблюдаемому вектору Уе, стремится к нулю и точки Р пространства концентрируются в бесконечно малой окрестности точки Рю соответствующей Х, яо регулярной стратегии. В пределе для регулярной стратегии й(01то) =б!~ — ~з(~ з)1, (5-28) где б — дельта-функция. Функция Л (Й1У,) называется решающей ф у н к ц не й. Теория статистических решений указывает методы определения оптимальных решающих функций на основе критериев оптимальности, связанных с ошибками решения. Если решение В оказалось неправильным в оценке сигнала Х„то ошибка решения оценивается функцией потерь И" = Из(Х„Р), которая должна иметь наименьшее значение при правильном решении.
Часто в качестве функций потерь принимаются функции вида сВ(х,— д~)з, с ь!х; — д;1и т.д. Простой или элементарной функцией потерь называют функцию вида: ( — со, Х,=В И'(Хо В)=(-б(Хо В)=~ 1 Х Х) У с л о в н ы м р и с к о м называют математическое ожидание функции потерь при фиксированном сигнале Х,: г(Хо Х))=М(И' (Хо ())) = ~ И (Хз В) Р(0 ~Хо) ~И. (5 30) и (и) При атом, если известен закон действия решающего устройства, то Р (В ~ Х,) = ~ Л (б1У) Р ()' ~ Х,) сИ. (5-Зг) п(ю Плотность вероятности Р (У~ Х,) полает быть найдена, если заданы вероятностные характеристики шума и способ комбинации сигнала с шумом.
Полный (средний) риск выражается зависимостью: Л=ЛХ(г)= ~ г(Хю Л)Р(Х )~И. (5-32) и стм 122 Задачи теории статистических решений — это задачи о нахождении решающих функций, минимизирующих средний риск. Очевидно, что вид оптимальной решающей функции зависит от вида выбранной функции потерь. Теория статистических решений дает возможность на основе данных наблюдений оценивать вероятностные характеристики Р (Х,1У) (или Р () 1)"), если ь параметр, характеризующий Х,.
При атом могут быть два основных типа задач. В первом типе (бейесовы задачи) до наблюдения известны некоторые априорные характеристики, например Р (Хз). В результате решения задачи происходит уточнение априорной плотности вероятности Р (Х,) и находится апостериорная плотность вероятности Р (Х» < У). Во втором типе задач априорные плотности вероятности неизвестны совершенно. Рассмотрим на простейшем примере двуальтернативного решения бейесову задачу.
Пусть задан внд функции измеряемого воздействия х»(1, Л), где Л вЂ” параметр, принимающий одно из двух значений Л, или Л . Заданы априорные вероятности этих значений р, и р». Решение й может принимать также два значения: Н, (решение Л= Л,) д= д» (решение Л=Л,). Выберем функцию потерь в виде (5-33) 1, «(~Л т. е. при правильном решении потери равны нулю, при неправильном — единице. Пусть условные вероятности решений Ы, и Ы» при фиксированном Л равны р («1, <Л) и р («1»<Л). Удельный риск (5-30) определится суммой г(Л, Д) =И'(Л, д,) р(с(„< Л)+ И'(Л, д,) р(й«<Л). Выпишем значения удельного риска для значений Л, и Л, и учтем, что в соответствии с (5-33) И (Л„ 1,) = И (Л„ 3,) = 0, И (Л„ 1,) = И (Л„ 1,) = 1.
Тогда: г(Лп Д) = И'(Л„сЮ,) р(дт< Л,)+ И'(Л„«К») р(д»< Л,) =р(Н«<Л»); < г(Л„Д) = И~(Л„Й») р(с1,< Л»)+ И" (Л»„б») р(сК» < Л,) =р(«1» < Л,). ) (5-34) Интеграл в формуле (5-32) среднего риска также заменяется суммой В=г(Лп Д) р,+г(Л„Д) р. Подставив (5-34), получим (5-35) Л=рьр((,<Л,)+р,р(1,<Л,). Величина р (д» < Лт) = а есть вероятность получить решение Л = Лм в то время как Л = Л,, т. е.
вероятность ошибки при Л = Л,; величина р (д,<Л») = р есть вероятность ошибки при Л = Л,. В задачах об обнаружении сигнала на фоне шума, где Л» = О, «» называется ошибкой «ложной тревоги» (решаем, что 1ЙЗ сигнал есть, хотя на самом деле его нет), а р — ошибкой «ложного отбоя» (решаем, что сигнала нет, хотя он есть). Тогда средний риск равен безусловной вероятности ошибки В = д = р а + р»р. (5-36) В теории связи критерий оптимальности, равный безусловной вероятности ошибки, называется к р и т е р и е м К о т е л ьн и к о в а. Таким образом, функция потерь, выраженная в виде (5-29), приводит к критерию Котельникова. Название «бейесовы задачи» дано потому, что их решение может быть выполнено с помощью формул Бейеса, позволяющих определить апостериорные плотности вероятности по заданным априорным.
Пусть Л может принимать г значений Лд, Л„..., Л„с априорными вероятностями р (Л,), Р (Л,), ..., р (Л„). Введем понятие о пространстве наблюдений вектора У = (у„у„..., у,). Если известна плотность вероятности в точке пространства Р (у„у„..., у„), то вероятность попадания конца вектора внутрь элементарного объема «(»« (У) пространства наблюдений »« (У) равна Р (У) ЫЯ (У), вероятность же попадания в одну из точек всего пространства П равна единице: (5-37) и (г) Вероятность того, что вектор параметров имеет значение Л и одновременно того, что конец вектора У находится в объеме Ый (У) есть вероятность сложного события, которая, согласно теории вероятностей, может быть определена через произведение вероятностей двояким образом: либо через вероятности р (Л) и Р (У ~ Л), либо через р (Л) У) и Р (У) посредством выражения р (Л)(Р (У ! Л) Нй (У)] = р (Л / У)\ Р (У) ~И (У).
(5-38) Сократив на дй(У), получим формулу Бейеса для апостериорной вероятности (Л)У) Р(Л))'()'~Л) (5-39) Р (У) Функция Р (У ~Л), выражающая вероятность получить наблюдение У при фиксированном значении параметра Л, называется функцией правдоподобия. Эта функция обычно может быть заранее установлена на основе рассмотрения конкретной задачи, поэтому представляет интерес в правой части формулы Бейеса выразить Р (У) через Р (У ~ Л). Сделать это можно, кросуммировав для разных у = 1, 2, ..., г левые и правые части выражений р(Л,) Р(У/Л;) =Р(У) р(Л;) У).