Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 26
Текст из файла (страница 26)
Управляющие воздействия в системе вообще нужны для приведения объекта в желаемое состояние, но они могут использоваться и для изучения помехи. В атом случае они носят двойственный «дуальный» характер. Управление, при котором используются управляющие воздействия такого двойственного характера, называется д у а л ь н ы м у п р а в л ен и е м. Рассмотрим изображенную на рис. 5-10 систему при следующих данных относительно ее элементов, координат и воздействий.
Все величины в системе рассматриваются в дискретные моменты времени г = О, $, ..., г, ..., п, где п фиксировано. Значения переменных, соответствующие текущему моменту г = г, обозначаются индексом и Задающее воздействие х,, подводится к управляющему устройству А через безынерционный канал связи Н„в котором Рис. 5-10. оно смешивается с шумом Ь,. В результате этого смешения на вход управляющего устройства подается не величина х„, а у,„которая является ваданной функцией р„= у„(х„, Ь,,).
Управляющее устройство вырабатывает управление и„которое, пройдя через безынерционный канал С, смешивается с шумом д, в этом канале и превращается в величину и„определяемую заданным законом и, = о, (и„у,), которая подводится ко входу объекта Н. На объект действует помеха з„в состав которой могут входить случайные изменения нагрузки и характеристик объекта. Считаем, что объект не обладает памятью и его выходная координата в, определяется функцией х, = — г" (и„з,), которую мы считаем конечной, однозначной и дифференцируемой.
К объектам без памяти можно относить не только безынерционные объекты с однозначными статическими характеристиками, но и динамические объекты, для которых рассматриваются только установившиеся значения х„ при входной величине и,. Выходная величина объекта з„*смешиваясь с шумом Ь„в безынерционном канале обратной связи образует величину 137 у, = у, (хв, Ь,), которая с обратным знаком подается на вход управляющего устройства А. Рассмотрим бейесову аадачу, считая заданными априорные вероятностные распределения Р (Ь,,), Р (Ь,), Р (д,) случайных последовательностей Ьо» Ь, и й» которые мы считаем чисто случайными.
Воадействие х,, и помеху з, мы будем считать случайными функциями, зависящими от случайных векторов Х и р соответственно: хо =хо (8, Х); Ь=(Л»1~ ...,Л,); з,=хв(о, р); р=(р р. "р) (5-103) (5-104) Плотности вероятности векторов Р (Х) и Р ()О) также считаются заданными. Все внешние воздействия з,, х„х,„ЬО» Ь, и д, считаются статистически независимыми.
Так как функции и, = ю, (и„у,), у, = у, (х„Ь,), у,, = = у,, (х,„Ь, ) известны, то мы можем определить условные плотности вероятности Р (и, ) и,), Р (у,, )хо,) и Р (у, )х,), которые поэтому также считаются заданными. Для определения оптимальной стратегии введем функцию потерь И~, равную сумме удельных функций потерь: — Х ~'в(О, Хв, Хов) (5-105) и средний риск Л, равный сумме удельных рисков Л,: (5-106) Введем также временные векторы: Р, (а,) = 1, (и, ~ и, » у.-» уо.) при которых полный риск Л будет минимальным.
(5-108) 138 Пв=("О В1, ° ") Хав=(ХОО Хо» ..., Хо ); т~=(зов гтв . гв)в уов=(уоов уо» в уов)в (5"107) х,=(хо, х1, ..., х,) У =(Ую У1 ° ° Ув). Каждый из этих векторов представляет собою совокупность всех дискретных значений соответствующих координат в момент О = г и все предшествующие моменты и таким образом воплощает в себе первичную информацию о соответствующей величине, накопленной к моменту О = О. Найдем оптимальные плотности вероятностей Г,==О; Г,(и,) Й1=1. п(в ) (5-109) Величины Г,.
(1 = О, 1, ..., и) назовем удельными стратегиями, а их совокупность — полной стратегией. Решение задачи о нахождении оптимальной стратегии начнем с установления выражения для условного удельного риска. Условный удельный риск выражается кратным интегралом от произведения удельной функции потерь И', на апостериорные вероятности всех случайных величин, от которых она зависит: г,= ~ ут',[г, х„(Х, г), х,)Р,(3~)Р,(к,)Р,(п)Р,(и,)дй. (5-110) й(Х,й,х,м ) При определении апостериорной плотности вероятности учтем, что канал Н, не входит в замкнутую цепь и позтому оценка 1 будет зависеть только от фиксированных значений у,. Поэтому мы можем для совместной плотности вероятности Р (Х, у„) напи- сать Р() Уш)=Р())Р(уев~))=Р() ~уш)Р(уш) (5111) Откуда (5-И2) В атой формуле типа Бейеса Р (Х) — априорная плотность вероятности для Х; Р (у,,) — априорная (безусловная) плотность вероятности для у,,; Р (уач)Х) — функция правдоподобия, определяемая из свойств канала Н,.
Так как по предположению значения йм независимы для различных 1, а канал Н, безынерционный, то (5-113) Напомним, что безусловная вероятность Р (у„) может быть выражена через суммы (при конечно-альтернативных задачах) илк 139 Индексами г у плотностей вероятности будем отмечать условные апостериорные вероятности, вычисленные с учетом накопленной к моменту 1 = з информации.
В расшифровке, при каких переменных вычисляется условная вероятность Р, (и,), фигурируют не только текущее значение р,„но и вся его предыстория у,„ а также предыстория связанных с управляющим устройством величин у,, и и, „имевших место до прихода очередного сигнала у,, Так как Г, плотность вероятности, то для нее справедливы следующие дополнительные соотношения: через интегралы от произведений Р ()о) на Р (у,))о), как это было сделано в (5-41) и (5-42). Вычисление апостериорной плотности вероятности Р, ()о), таким образом, в данной задаче выполняется так же, как это делалось и в предыдущем параграфе при рассмотрении обычных разомкнутых систем с пассивным накоплением информации, что связано с обособленностью контура Но.
Гораздо сложнее обстоит дело с вычислением апостериорной вероятности Р, (р), так как для этого вычисления уже используется вся информация об объекте, и в каждом такте априорная плотность вероятности Р ()д) заменяется апостериорными плотностями Р, ()д), все более точно характеризующими вектор )д. Выразим через произведения вероятностей совместную плотность вероятности Р ()д и -д| Уо-д ! Уоо) = ~ (" -и У -д ) )д Уоо) ' ()д) = = Р0д) ио „у, д, уоо) Р(н, „уо д) уоо), (5-114) где Р ()д) = Р, ()д) — априорная (безусловная) плотность вероятности )д. При этом вместо Р ()д, у„) мы пишем Р (р) потому, что )д не зависит от ) или уо,. Отсюда Р ()д) = Р 0д / и, д, у, д, уо„) = Р (ао — и Уо-д ~ Уоо) ддд) ("-д Уо-д~до У' (5 115) Р (к,, у ~ дд, у ~) До (дд) ~ДО ' а (в) Для вычисления функции правдоподобия Р (в,, у,, / )д, у,,) в замкнутой системе рассуждаем следующим образом.
Плотность вероятности появления сначала пары значений и„у„затем последовательно пар и„ уд; ио, у, и т. д. при фиксированном )д равна произведению следующих сомножителей: 1) плотности вероятности первого из этих событий Р (и„ у,))д, у„); 2) плотности вероятности второго события и„ уд при условии, что произошло первое — Р (ид, уд))д, ио, у„ у„); 3) плотности вероятности третьего события ио, у„при условии, что произошли первые два Р (ио, уд ~ )д, и„уд, уод) и т.
д. Р (и, „у, ) )д, у„) = Р (и, уо 1 )д, у ) х х Р (и„уд) )д, и„уо, у„) Р(ио, уо))д, и„у„уод) ... Х Х . Р(и, „у, д) )д, и, о у -о уо,. д) (5-116) Рассмотрим д-й множитель О ( д ( г — 1 Р(ид, уд))д, к; „уд „уо,)= =Р(уд))д, и„н, д, у, д, ум) Р(ид) и, и, д, у; „ум). (5-117) 14й В первом сомножителе правой части (5-117) уо если фиксировать )о и ио, не изменится, если фиксировать также у,. „ио, и у,,; поэтому этот сомножитель можно обозначить Р (у;~)о, и!); второй же сомножитель на основании аналогичных рассуждений можно обозначить Г, (и! ~ уоп п, „уо,), поскольку он представляет собой выражение случайной стратегии управляющего устройства. Сокращенно будем обозначать ее просто Г!.
Итак, в-в — ! ! в — 1 '(. У,.~), у.в)=~Д Р(у;)р, т)~Д Го, (5-118) в=о о=о где Г, обозначает Р, (и,) (величина, не зависящая от наблюдений, которой при Е = 0 е!це не было). Подставив (5-118) и (5-112) в (5-115) и учтя, что Рз (и,) = Г„получим г= ~ Иг[з х хо(г в.)] — -- — — ' Х Р ()!) Р (Уо.
~ а) в в з вз Ов Р (Уов) о (ь и "в "в) в — ! !)в) П Р (у! ) )в и!) в х Р (х, ~ )о, г, и,) — --':: — — —, и Г,.НЙ. Р(уз-! ив в Ум) в=о (5-119) Для получения выражения для среднего риска учтем, что векторы у,„ к, ! и у, „ вообще говоря, заранее неизвестные, могут принимать различные значения. Пусть Р (у„, и, о, у, !) совместная плотность вероятности этих векторов. Тогда средний удельный риск получим, усредняя г, по этим значениям В,= ~ г,Р(у„, вз „, у, ) !воо. ! ("ов' ов-!'ов-!) (5-120) Учитывая, что Р (у ..