Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 25
Текст из файла (страница 25)
(5-58) При решении вадачи по методу максимума апостериорной вероятности, получим Лх, если — ~Л(У))1 Лз, если — Л(У)(1 Рз (5-59) 12Э В системе делается г наблюдений в моменты Гю Гэ, ..., б величин у„ ую." уг. Очевидно, У' = зэ + Ь; = ЛГ ПЭ + Ь!. (5-51) При решении по методу максимума правдоподобия получим другое значение порога: [ Лэ, если Л (У) ) 1 ) ) »э, если Л (У) ( 1 ) (5-60) В случае нормального распределения логарифмируем (5-55) и обозначаем Г ~ [у! — Л,( (э,))э — ~ [у! — Л,[(!,))э = Р (У). (5-61) э=! 1=! Неравенства (5-59) и (5-60) при этом сводятся к виду: для максимума апостериорной вероятности Р (у) ( 2оэ! и Рэ Рэ Р(у) ) 2оэ)п Рээ Рэ (5-62) для максимума правдоподобия (5-63) Характер шума тот же, что и выше, дисперсия н!ума оэ = 1. Находим »,=025; Л,=О; э 5 Р(У) = ~ [у! — 0,25е ![ — Я у! э—— э=! э=! = (О 2 — О 25э э)э + (О 3 — О 25е э)э + (0,15 — О 25е э)' + (0,10 — О 25э ')э + + (0,05 — 0,25е э)э — 0,2э — 0,3э — 0,15э — 0,10э — 0,05э = — 0,0521.
(5-65) В соответствии с принципом максимума правдоподобия искомый сигнал присутствует, так как Р (У) < О. В соответствии с принципом максимума апостериорной вероятности при Рэ = Р, имеем тот же результат, но при Р, —.,Е Р, ответ будет зависеть от величины ДиспеРсии ое и отношениЯ Рэ/Рэ.
Чтобы получить алгоритм для обнаружения сигнала при непрерывном измерении, разделим время наблюдения Т на»э равных интервалов б! и устремим й — со, Ьг — О. Получим т т Р(У) = [ [д — »ч( (!))э 6! — ~ [У вЂ” Лэ[(!))э К!. 6 (5-66) (зо Рассмотрим числовой пример. Определить, присутствует ли сигнал вида вэ(С) = 0,25е э! (5-64) в наблюдаемой последовательности: уэ = у (0,2) = 0,20; уэ = у (0,4) = 0,30; уэ — у (0,6) — 0,15, Уэ = У (0,8) = 0,10! Уэ = у (1,0) = 0,05.
т Л ~ у (с) ) (с) й ~ — ' „ о (5-87) т где из =Лз ~ () (г))ззй — энергия сигнала. Ь Па основании (5-87) можно построить схему оптималького обиаружеяия (рис. 5-8). В момеит г = Т происходит сравнение выхода интегрирующего авеиа с величиной 0,5Ее, Эту схему иазывают сиихровиым детектором. Рассмотрим разомкнутую систему У управления (рис.
5-4). Задача оптимизации для нее отличается от рассмотренной выше задачи непринципиально. Отличия сводятся к тому, что в звеньях Рис. 5-8. А, С, В, которые можно рассматривать как обобщенное приемное устройство, действуют внутренние шумы, и к тому, что ищется алгоритм не всей этой части, а лишь части А. Пусть задающее воздействие хе (г) дискретно и действует в моменты времени в: — Е з (5-68) ез ез ( з ) Л вЂ” вектор со случайными координатами Л=(Л„Л„..., Л ). (5-69) Задана априорная плотность вероятности вектора Л, т.
е. совместная априорная плотность вероятности величин (5-70) Р(Л) = Р (Л, Л, ... Л ). Шум Ь представляет собой чисто случайную последовательность величин Ь, с заданной плотностью вероятности Р (Ь,). Заданы также способ комбинации сигнала хе, и шума Ь, оператор безынерционного объекта ~ез ~ (язз пз) (5-71) где Р— заданная функция; вид функции (5-72) з, = з„(я, )е), где )з — случайный вектор: )з =(Мт Ию ° ° )з ) (5-73) Априорная плотность вероятности Р ()з) задана. Плотность шума Р (р,) считается постоянной. 131 При испольаоваяии правила максимума правдоподобия и обнаружении сигнала (Лз = О) получим условие существования сигнала в виде Функция потерь, соответствующая дискретному времени з, задана в виде х И' = ~Ч~ Ив, (г, х„, х,).
(5-74) в=о Требуется определить оптимальную стратегию управляющего устройства А. В числе величин, подлежащих определению, характеризующих оптимальную стратегию, наиболее существенна оптимальная плотность вероятности Г (и,). Эта величина зависит от всей информации, накопленной управляющим устройством в виде последовательности значений уо, у1, ..., у, 1. Введем в рассмотрение временные векторы; Ув=(уов У1 Ув)' хов (Хоов Х01в ' ', Хов). (5-75) Очевидно, Г, (и,) = Г, (и, )у, 1).
Надо выбрать Г, так, чтобы обеспечивался минимум среднего риска 77. Рэс. 5-9. Чтобы найти выражение для среднего риска, нам надо знать ряд условных вероятностей: Р (х,)э,), Р (и,)и,), Г, (и,)у, 1), Р (у, ! х„) (см. рис. 5-9). Из этих вероятностей Р (и, ) и,) находится по заданным Р (у,) и закону смешивания шума д с сигналом и; Р (х, ~ и,) выражается через заданную Р ()о) и найденную Р (и, ~ и„) по формулам (5-71) и (5-72); Г, (ив ~ ~у,,) является искомой; Р (у, 1)х„1) при безынерционном канале связи и случайном характере помехи может быть выражено в виде Р(у. )и,, )=Р(у, у, ", у. ~х,.
)= в — 1 в — 1 П Р(У!) "о,в-1)=П Р(У!)ХО1); (5-79) "в = М (Оув ) хов) = ~ И'в (8 хов, хв) (хв ~ хов) 1111. (5 71) в(х ) 132 (так как в безынерционном канале Р (у,) зависит только от хм, а не от предыдущих значений х) плотности же Р (у, ! хм) могут быть найдены по исходным данным.
Напишем сначала выражение для условного удельного риска при фиксированном векторе х„: Р(хо~хо,о)= ~ Р(хо~во)Р(зо~хоо)Ж(), а (Оо) (5-78) которая выражается в виде суммы вероятностей для х, попасть в диапазон х„х, + Нх, при различных и„но фиксированном х„. Подставив (5-78) в (5-77), получим 'о= ~ Рув(г> хово хо) Р(х,) з,) Р(го ~ хоо) (Я~ (5-79) а (хо, оо) где интегрирование уже ведется по двумерной области (т. е.
имеем упрощенную запись двукратного интеграла). Средний удельный риск В, равен В,= ~ г,Р(Х)й(). (5-80) а (и) Подставляя (5-79) в (5-80) и производя дальнейшее разворачивание выражений Р (х,(и,) и Р (и,(хо,), получим окончательно В,= ~ И',(г, хо„х,)Р(х,)з,)Р(з,(и,) Х х Г,(и. !Уо о-о) Р(уо,о ъ! хо,о,) Р(Х) д1). (5-81) Полный риск равен В= ~ч; В,. в О (5-82) Выделим под интегралом функцию $, (и„, у „,), зависящую от искомого управления и, и компонент вектора наблюдения: $,(и„уо, о)= ~ Р(х,)г,)Р(го~и,) Х а (о о,) Х ( $ И'(г, хоо (г Х) х,) Р (уо,о -о!хо о-о) Р ()о) с)й ()~)) й) (х„е,). (5-83) (а (о) Из (5-81) и (5-83) можно видеть, что Во = $ г (Уо, о-о) ')~ (Уо -ъ)э а ("в-о) (5-84) где У(уо,о о)= ~ Г,(и,~уо,.
о)$,(хо. Уо,. о)оИ(и,). (5-85) а(о) 133 Так как х, зависит от и„то, зная вероятностную характеристику помехи, можно найти Р (х, ~ о,), но сама величина и, также случайна и закон ее распределения зависит от х,„т. е. представляет собой функцию распределения Р (о, ~х„) На основании теоремы о среднем, учитывая положительность подынтегральных функций, можно записать: 1 (ув ..) = ($,)вр ) Г, (и, ~ ув ..) в(Я, (5-86) Рассмотрим функцию Г, (и,) = 6 (и, — ив). Очевидно Г, удовлетворяет условию ) Г,ввй=1. Далее, учи- и (5-89) тывая, что так как 6(х — хе) вр(х) Ых= чв(х*) (5-90) и подставляя (5-90) в левую часть (5-87), получаем (1(ув,, Ь („„,.)= $ 6(и,— ив")Ь,( „ув,,)в(а= я (и,) =%,(и,")=(Вв) им=(1)ш, .
(5-9() Следовательно Х достигает своего минимума при испольвовании стратегии (5-89). Но как мы видели, стратегия типа дельта-функции есть регулярная стратегия; таким образом, в данном примере подтвердилось утверждение о регулярности бейесовой стратегии, ранее полученное путем геометрической интерпретации. Оптимальный алгоритм управляющего устройства сводится к выбору й, минимизирующего $, с учетом всех наблюдаемых значений у, в ,*...) = ш(п(ив, ув, в-в). (ив) (5-92) Таким образом, $, является в данной задаче критерием оптимальности для выработки оптимального управления регулярными методами, рассмотренными нами в предыдущих главах.
Если $34 но, так как Гв есть плотность вероятности, то Г(и,(у...) вввв =1, и (ив) (5-87) Х (ув, в — в) = — (Вв) вр ~ (Вв)вяз Отсюда видно, что минимально возможное значение функции 1 равно Я,)шм для каждого у, д. Однако, когда 1 минимально при каждом у... минимален и средний удельный риск В„а следовательно, и полный риск В. Пусть и,' — значение и„прн котором достигается минимум функции $, (и,) в области Я (и,) возможных значений и,. 5 (ив) = ш(п $, (и,). (5-88) (") ув = лов + йв> и,=и,+у,; х,=е, +р.
Плотности вероятности шумов и параметра [л нормальны: «< Мв)в>. Р(д,) = — — —. ехр < — —" о У2я 1 2ов> Р([«) = — =-ехр > — ~ о У'2я 2о„" Далее хо, = Л, где Л вЂ” нормальная случайная величина. (5-95) (5-93) (5-94) (5-96) Функция потерь задается в виде о о И'= ~~ Ив,= ~', (х,— х,)'. (5-97) Найдем сначала в формуле (5-83), Ив,[г, х„(г, а <л> интеграл, заключенный в фигурные скобки Л), х,[Р(у... [хо, ) Р(Л) <11«(Л) = в — ! [хов (Л) — х„)' П Р (у„ [ х„) Р (Л)<11«(Л) = «-о О в †! (Л вЂ” х,)о ~ [ Р (Уо«[Л) Р (Л) «[Л.
(5-98) и <л> Так как Ь« = у, — хо« вЂ” — ум — Л, то вероятность того, что у« окажется в интервале от у„до у„; + «)уо«равна вероятности того, 135 функцию 5, можно рассчитать заранее, то структурная схема управляющего устройства будет состоять из блока памяти БП, блока формирования функции $ и автоматического оптимизатора одного из типов, например рассмотренного в [183, 184) или в [186]. Если же получение функции з в явном виде затруднительно, то блок $ может быть построен в виде вычислительного устройства, выполняющего интегрирование в соответствии с (5-83).
Численный пример на вычисление оптимальной стратегии рассмотрен в [189). Не останавливаясь на детальных выкладках, мы приведем лишь общую схему решения. Уравнения системы имеют вид: что помеха в канале Н окажется в интервале от у„— Л до ум— Л + ду»о поэтому Р(у» ]Л)= ехр à — (™ аь г"2я ( 2о,', (5-99) Дальнейшее сводится к подстановке в интегралы полученных функций и нахождению определенных интегралов. Даже в таком элементарно простом случае (все каналы и объект беэынерционны, помехи аддитивны, чисто случайны и имеют нормальные априорные распределения) выкладки получаются довольно громоздкими, хотя и несложными.
Читатель может проследить их в [189). В конечном итоге получается $ = Г» [1+э»(ди 1)2] (5-100) где В„е и д — постоянные на каждом шаге г (в том смысле, что они не зависят от и,). Поэтому минимум $, находится из условия т»и,— 1=0 или в — 1 Л,+ф ') км «-а % 1 ив — е— (5-101) 'й)' При г =- 0 оптимальное значение и должно быть просто равным значению х«« = Х» на входе А; при достаточно больших г, когда накопится значительная величина суммы Ху, и,"' приближенно равна (5-102) Таким образом, в данном случае управляющее устройство просто должно усреднять входную наблюдаемую величину.
Этот резуль- тат вполне соответствует интуитивным представлениям. 6-4. Системы е актнвным накоплением ннформацнн. Сннтео онетем дуального управления 133 В замкнутой системе (рис. 5-10) процесс изучения помехи з, действующей на объект, может быть сделан активным. Задавая на объект «пробные» воздействия, можно получить изменения выхода объекта х, изучая которые и сопоставляя их с воздействиями на объект, мы сможем получать более полную информацию о помехе з (в которую могут входить также и случайные изменения характеристик объекта).