Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 24
Текст из файла (страница 24)
В результате суммирования получим ,5', р(Л;)Р(У!Л))=Р(У),У', р(Л;!У)=Р(У), (540) ! ! »=! г так как сумма ~ р(Л;(У) =1. Тогда формула Бейеса принимает )=1 вид р (Х!) Р (У ( Х)) У, Р (Л;) Р (Ъ ! Л)) (5-41) Точно так же можно получить формулу Бейеса и для случая непрерывного распределения вектора Л с априорной плотностью вероятности Р (Л): Р (Х) Р (У ( Л) $ Р (л) Р (у ( л) ла (л) ' а<ю 12$ Можно показать!189), что если в качестве критерия оптимальности принять критерий В. С. Котельникова (5-36) или в качестве функции потерь — функцию вида (5-29), то решение бейесовой задачи выбора или оценки параметра сводится к нахождению такого значения Л, при котором апостериорная вероятность Р (Л ~ У) принимает максимальное значение.
В зависимости от конкретных условий иногда при решении задач типа бейесовых применяют видоизмененные критерии. Так, в теории связи часто применяются критерии, учитывающие, какая иа ошибок («ложной тревоги» или «пропуска») наиболее опасна, которые содержат зги ошибки с различными весами. В частности, применяется критерий Неймана — Пирсона (252)— наименьшая вероятность пропуска сигнала при заданной вероятности ложной тревоги.
Если, что часто встречается в практических задачах, мы имеем дело с совершенно новой системой, о поведении которой еще не накоплено никаких статистических данных и априорные вероятности в которых неизвестны, то такие задачи не относятся к типу бейесовых. Для их решения приходится прибегать к различного рода гипотезам, основываясь на здравом смысле и интуиции. Еще на ранней стадии развития математической статистики со времен Лапласа, в случаях, когда априорное распределение вероятности Р (Л) неизвестно, часто прибегали к гипотезе о том, что зсе значения Л равновероятны, т.
е. принимали априорную плотность вероятности постоянной. Если мы считаем Р (Л) = сопзС и Р (У) = сопз1, то в формуле (5-39) апостериорная вероятность оказывается пропорциональной функции правдоподобия. Это дает основание в качестве одного из методов в теории статистических решений принять, в случае, если априорные плотности распределения неизвестны, в качестве эвристического критерия оптимальности к р и т е р и й м а к с и- мума правдоподобия. Если задан вектор У, то функция правдоподобия Р (?'~А) зависит только от ь: Р (У ( Х) = А (х).
(5-43) В соответствии с правилом Р. Фишера, наиболее правдоподобным считается то значение параметра»„при котором функция правдоподобия Ь ()) максимальна. Другим распространенным в теории статистических решений методом решения является наиболее пессимистический м е т о д м и н и м а к с а. В соответствии с этим методом сначала отыскивается «наихудший» сигнал Х**, при котором условный риск г при данном Л будет максимальным: (5-44) г (Х**, Л) = шах г (Х*, Л) л' далее находится такая решающая функция Л*, для которой наи- худший риск будет минимальным: г (Х**, Л*) = ш)п г (Х»*, Л) = пап шах г (Х*, Л). (5-45) Ь а х Решение Л* называется м и н и и а к с н ы м, а соответствующая ему стратегия — м и н и м а к с н о о п т и м а л ь н о й. Минимаксная стратегия дает наилучшие результаты в наихудших условиях.
Она появилась в теории игр, где игрок ожидает наибольшего ущерба от противника. В случае же, когда наихудшие условия маловероятны, минимаксная стратегия может оказаться не наилучшей. Основные понятия теории статистических решений, изложенные выше, весьма наглядно интерпретируются в «пространстве риска». Рассмотрим двуальтернативные решения, для которых пространство вырождается в плоскость и имеет наглядную геометрическую трактовку.
Регулярные стратегии изображаются на плоскости риска точками, координаты которых равны условным рискам для каждой из двух альтернатив. Значения риска г (Х„Р) откладываются по оси абсцисс, значения г (Х„В) — по оси ординат. Стратегию можно считать тем лучшей, чем меньшие значения риска ей соответствуют. С этой точки зрения можем утверждать, что страстегия Х), лучше стратегии Р» (рис. 5-6), так как оба условных риска для нее меньше, но сравнить стратегии В, и Р» по этому признаку уже нельзя. Случайные стратегии на плоскости риска могут быть изображены следующим образом. Пусть мы выбираем одну из двух стра- 0 г(ЛвР) г(Льдчг) г(Лд,)5) Рис.
6-7. видеть, что эта же точка соответствует применению стратегии Р, с вероятностью дддю стратегии Рд с вероятностью дздд и стратегии Р, с вероятностью дз. Выполняя все аналогичные построения для нескольких регулярных стратегий ЄЄЄ1)„Р, (рис. 5-7, а), убедимся, что любая из внутренних точек выпуклого ааштрихованного многоугольника, вершины которого соответствуют первичным регулярным стратегиям, соответствует некоторой смешанной стратегии. 127 тегий: либо Р, с вероятностью д„либо .Р, с вероятностью д,.
Такая случайная стратегия Рд (рис. 5-6) имеет условный риск г()д„Рд)=ддг( „Рд)+д,г()„Р,); 1 (5-46) г () д Рд) ддг ()дд Рд) + дзг () я Рд) 1 Если одна из стратегий Р, или Р, выбирается обязательно, то д, + дд = 1 и все стратегии Р;, соответствующие различным значениям д„ будут изобра- гйьб) жаться точками, лежащими на прямолинейном отрезке д7ЛьРд) — — — — ---ч)дд РдРд. Стратегии, при которых многократно случайным I ! образом применяются раз- д7+Д) — —— личные регулярные страте- азываются с дд е ш а н г(Л,б,) — — -+ — ' — — — А ными стратегиями. Соединим прямой точки ~ЛЛвб) Р, и Рд (прерывистая линия на рис.
5-6). Любая точка Р, на этой прямой соответст- Рис. 6-6. вует новой смешанной стратегии, для которой применяется стратегия Р, с вероятностью д, н стратегия Р1 с вероятностью д„причем д, + д == 1. Нетрудно гГЛ , б) гДЛ,,б) а) б) Ю В бейесозых задачах средний риск равен Л=р г()., Р) + рзг()., Р). (5-47) Рассмотрим систему, в которой аадающее вовдействяо имеет ввд: зе(с) =а)(с), (5-48) где С (с) — заданная фупкцкя времекв; )с — параметр, который может прк- нимать два зпачекяя )с и аз с вероятностями р, я р, соответственно.
Так как одно кз этих двух зпачепйй параметра возникает обязательно, то (5-49) Пусть шум й(б складывается в канале связи с полезвым сигналом зз (с) аддптявяо: к(с) =*,(с)+)с(с). (5-50) 126 Линия Л = сопзс на плоскости риска представляет собой прямую линию с угловым коэффициентом — рз/рс. Величина риска В для втой прямой пропорциональна длине перпендикуляра, опущенного на прямую из начала координат, поэтому уменьшению среднего риска Л соответствует движение прямой влево, по направлению к началу координат. Для многоугольника ЄЄЄЄР, на рис. 5-7, а наименьшему значению риска соответствует вершина Р,. В общем случае прямая с наименьшим Л проходит через одну из вершин многоугольника стратегий и позтому в общем случае бейесова стратегия есть стратегия регулярная.
Лишь в частном случае, когда прямая для наименьшего Н совпадет с одной из сторон, бейесова стратегия может оказаться смешанной. При минимаксном подходе оптимальная стратегия Р* обеспечивает наименьшее значение максимума условного риска, т. е. для рассматриваемого изображения на плоскости — максимального из двух возможных значений г ()ч, Ре) и г ()с„Ре). Для определения минимаксно-оптимальной стратегии проведем биссектрису ОГ в первом квадранте. Будем двигаться из начала координат по биссектрисе.
Если биссектриса пересекается с многоугольником стратегий, то точка первой встречи Ре и определит мннимакснооптимальную стратегию. Действительно, для атой точки оба значения риска равны между собою и меньше максимального риска для любой другой точки многоугольника. В общем случае минимаксно-оптимальная стратегия будет смешанной, поскольку встреча биссектрисы с контуром многоугольника в общем случае происходит не в вершине. Если биссектриса Ог' не пересекает многоугольника (рис.
5-7, б), то для определения минимаксно-оптимальной стратегии с движущейся по биссектрисе точкой Ь надо связать вертикальную линию ЬС и горизонтальную с Н. Оптимальная стратегия соответствует точке многоугольника, впервые встретившейся с одной из зтих линий (на рис. 5-7, 6 — точка Р,). В общем случае зто вершина, и тогда мпнимаксно-оптимальная стратегия регулярна. Шум Ь; представляет собою последовательность независимых случайных величин с нормальной плотностью распределения и дисперсией оз: Г ь1) Р(Ь!) = ехр1 — — ' ! =.уы (5-52) Требуется оценить значение параметра Л, т. е. установить, будет ли Л =- Л, или Л = Л по данным наблюдений у„ у„..., у„. При решении задачи как с помощью формулы Бейеса, так и по методу максимального правдоподобия, нам нужно будет определить функцию правдоводобия Р (У ~ Л).
Из (5-51) имеем Ь! = у! — ЛГ(Г!). Подставляя (5-53) в (5-52), найдем (5-53) Р(уГ!Л) = . ехр) — ' 2, ' ( . (5-5(!) Г (у! — ЛГ (Г!))3 ! )'2 —. Так как отдельные значения Ь! при равных ! статистически независимы, то независимы и у; — ЛГ (Г!), а плотность вероятности для множества вели- 'и!н уз, уз " у, равна произведению г Р(У!Л)=- П Р(у,~л)= Г=! г о' (2я)"Гз ~ 2оз э~э Г=! (5-55) Апостериорные вероятности найдем по формуле Бейеса: Э(~У! ~ ~, ~'=.1, 2. р,р(У, Л,)+р,р(У!Л) (5-55) Нам надо выбрать то из значений Л, которое дает максимум либо апостю риорной вероятности, либо функции правдоподобия. Поэтому удобно найти отношение правдоподобия, равное ~ (Л,) Р (У ! Л,) " =~(Л,)=Р(У!Л,) (5-57) Отношение апостериорных вероятностей равно Р(Лт!У) р! ! у) Р( ! У) .Р.