Введение в теорию исследования операций. Гермейер (1971) (1186148), страница 45
Текст из файла (страница 45)
Что касается (251), то его выполнение эквивалентно условию 280 (гл. ш оптимьльиыз стглтзгии Эта формула обобщает обычную формулу фильтрации (при отсутствии неопределенности), не учитывающую априорную информацию. В простейшем случае Р =Р= сопя! Ке 1 КО!0 257 В+!К О+ К О+ К При этом максимин платежа по (250) равен — 1[ ' 1+( ' ) Р11= — ' (257') К'~;Ц( — 1)р,1+'Е р]Р, (258) прн условии Хр~ —— 1 и ограничениях (252). / Тогда имеем необходимые условия экстремума, если он достигается не на границе (252): 2К' ~ ч~' (1 — 1) р, ~ (! — з) + 2Р,р, + Х = 0; ! ( з ~ 1. Отсюда можно записать р, = — (с,— с, (! — з)], ! (259) где с,= —; с,=К' э (! — 1)р,. 2 ' Вставляя в это выражение с, значение р, по (259), пелучим с, = К'с, ~, (1 — 1) — — К'с, ~ (1 — 1)' —, ~=! 1=! Если (256) не выполнено, то на стратегии накладывается условие ~э~',р, = 1.
При этом значение К, в (250) уже не играет роли, а р,=.О. Здесь нахождение максимина сводится к нахождению минимума $21) ПРИМВРЫ МАКСИМИНОВ И МИНИМЛКСОВ 281 т. е. (! — 1)— ! 11, 1=1 с,=А с, !+К~ ~ (1 — 1)~— ))! 1=! или 1" К'(! — 1) ~(! — 1)— 1>1 1 1=1 с" Рг= 11 (260) 1 !+К' ~(1 — 1)1 1 1)! 1=1 Что касается с„ то оно определится из условия 4 = р,=1 при подстановке в него (260). Это и даст окончательное решение, единственность которого обеспечивает доказательство того, что оио реализует минимум, если он достигается не на границе области (262).
Если измерения равноточны, т. е. Т), = сопз1, то з(! — 1) 1К' РВ = с [1 — (1 — з) з)э+к~ ( !) (21 !)~. (261) При К=О, т. е. когда объект не маневрирует, все р, одинаковы, и получаем обычное осреднение. Однако формула (260) не всегда обеспечивает нахождение абсолютного минимума. При малых 01 (260) может дать для коэффициентов с малым номером отрицательные р,. Тогда минимум следует искать среди р, ) 0 только прн з, больших некоторого 1,.
В остальном поиск минимума будет мало чем отличаться от рассмотренного; нет необходимости повторять его. Отметим лишь, что при Р= О (26!) дает отрицательные значения р, для всех з, кроме з-1. Поэтому здесь оптимальная стратегия состоит в полном отказе от осреднения (фильтрации) измерений; нужно просто брать последнее. Минимакс в рассматриваемой задаче тривиален. Действительно, если у1 (или хотя бы у;) заранее известно, 282 [гл. ш ОНТНМЛЛЬНЫЯ СТРАТЕГНН то больше делать нечего; не нужно ни фильтровать, ии даже вообще измерять (со случайной ошибкой).
Оптимальная стратегия здесь состоит в назначении у, =у, (случай вполне эквивалентный случаю отсутствия ошибок измерения Р=О); само значение минимакса равно нулю. Характерной и интересной особенностью этой задачи является то, что минимакс автоматически включен уже в рассмотрение; он, очевидно, соответствует случаю К,=О, который, например, по формулам (257) — (257') и дает все только что сказанное. Это наилучший максимин (при заданных К и Р;). Наихудший максимин получается, конечно, при К,=со, т.
е. при отсутствии сколько-нибудь достоверной априорной информации. Чтобы судить о возможной разнице между этим максимином и минимаксом, можно взять, например, очень ! хороший случай К=О при Р,=Р. Здесь р,= —,, а макр симин равен — —,. н растет с увеличением 1. Однако это самое благополучное положение; при КФО безграничное увеличение ! становится нецелесообразным, а максимин при росте 1 отнюдь не стремится к нулю. Из (261) видно, что при э=1 З(! — Ц ГКв Рв=с ~1 (1 1)ар ! !Гв(! ц!(2! ц] и при увеличивающемся 1 становится отрицательным ( предел с ~1 — — 1 ( О); таким образом, первые измерения 81 не следует учитывать при фильтрации. 1Ч.
Модель поиска экстремума. Как было показано в главе 11 в модели поиска экстремума (модель 111), оценка эффективности стратегии х= (х„ ...„ х„) равна х — х, х„— х„ *мг= — Йшах (х,; 1 — х„; Отсюда немедленно следует, что оптимальной страте- гией при заданном числе п точек х„..., х„будет 1! ! ! ! л — !! х=! —, — + —,...,— + — ', в — ~2„2л „" ал л 1' х! — ! т. е. хг-:; 1=1, ..., л. 2л $211 ПРИМЕРЫ МАКСИМИИОЗ И МИИИМЛКСОВ 283 Максимин, очевидно, равен — , минимакс в этой Л задаче равен нулю. Однако в этом случае критерий не вогнут по х и, следовательно, можно ожидать, что цена игры ие равна максимину.
Действительно, в главе П была показана смешанная стратегия, имеющая эффективность, большую чем макснмин. У. Вернемся к задаче о поиске оптил1ального момента включения дублирующего агрегата Я 16). Ограничимся случаем одинаковых агрегатов, т. е. Т,=Т,. Критерий эффективности здесь имеет вид « Т = (т; р (1Ц = ) р Я й+ р (т) Т,. (262) о На р(1) наложены условия: « Ю ~ рЯЙ =Т;, 2) 1р(1)й=Т*,+Р„ а в остальном р(1) неопределенно — «стратегия прнродыл.
Стратегией оперирующей стороны является выбор т. Поскольку случай Р,'-РТ,' разобран в 2 16, будем искать макснмин и оптимальное гарантирующее т при условии Р, ( Т',. Так как на закон распределения 1 — р(1) наложены три условия (включая ~И[1 — р(1)]=1), по теореме Х при поиске 1п1 Т (т, р (1)! достаточно рассматривать только Р(О р(1), состоящие из трех площадок (кроме р(1)=0), т.
е. считать вероятными разве только три значения 1ы г„г,: р(1)=1 при 1 (1„ р(1)е а при 1,(1(1„ р(1) =Ь прн 1,(1(1„ р(1)=0 при 1 ) 1,. Условия, наложенные на р(1), дают 1,+а(1,— $,)+Ь(1,— 1,) =Т„ 284 (гл. ш ОПТИМЛЛЬИЫЕ СТРАТЕГИИ Отсюда (т,— г,— а(г,— г,)) (т,— )1)*+о,— 0 — ) (г,— г1)' ' Условие Ь)0 дает (Т, — г,)'+ Р, )~ (1 — а) ((, — гг)', (263) а Ь(а: (Т,— 1г)'(а [(Т,— 1г)'+Рг). (263') Если г,>т, то (262) равно т+Т„т.е.
максимально возможному значению, а отнюдь не минимуму. Поэтому необходимо г, < т (если, конечно, это не противоречит (263) — (263')). Будем теперь фиксировать а и г', > т и уменьшать гы тогда первый член (262) будет умейьшаться, в то время как второй останется равным аТ,. Таким образом, при 1,>т г, выгодно уменьшать до 0 или пока позволят (263) и (263'). Как видно из вида этих ограничений, уменьшение г, при данных а и 1, никак не может нх нарушить, а разве только уменьшает граничное 1гм (если оно определяется (263)).
Но тогда уменьшение г, до г,=т может только уменьшить первый член в (263) за счет уменьшения (~'". Итак, целесообразно с точки зрения минимума (262), чтобы г,<т. Будем пока считать т<Т,. При таких условиях, и если га > т, имеем (т,— ),— а(г,— г,))' Т [Г; Р(г)[ — (т г ),+г) О )(г г ),Т1+г,+ (т, — г,— а (г,— гдр з)+(т,— Г,у+,— (1 — а) (Г,— Г,)~ ( Фиксируем величины 1, +а(г,— 1г) = с и ~,. Тогда Г,— с 1 — а= — и (тг — г)' р(~)1 =с+(Тг+т (в)(т, г,)з+р, р а)(г г,) ° (264) Очевидно, что критерий эффективности при фиксированных с и Г, уменьшается, когда 1г растет.
Рост 1, ограничивается илн (263), или (263'), йлн условием (,~(~„ $211 ПРИМЕРЫ МАКСИМИИОВ И МИИИМАКСОВ 285 Но тогда по (264) Т,,' Т+, — = — (Т1 2Т1 — 2т 2 (т( Т,). Однако такое т не оптимально, ибо есть т=О; со, для которых гарантированное Т(т, р(с)1 =Т,. Таким образом, оптимальное т должно удовлетворять неравенству т~РТ,— О, (267) )с — с или же тем, что а= 1 — — ') О.
Последнее условие по г,— ),- существу не ограничивает сы поскольку прн а=О уже заведомо не выполнено (263'). Условие (263), будучи переписано в виде (Т,— Г,)'+О,)(1,— с)(1,— 1,), также никак не ограничивает роста с,. Поэтому Г, должно определяться из условия: (Т,— с,)' = — ~' 1(Т, — (,)'+ А),], (265) Поскольку нужно наибольшее возможное со положительный знак у корня опущен. Покажем теперь, что для оптимального т производные от (264) по с, ( т и по с в точках (с, (,), удовлетворяющих (265), неположительны. Если пренебречь положительным знаменателем, то производная по г, равна )'), — Т, '— 2Т,т+ (Т, + т) ((, + с) — с(,. (266) Поскольку максимальное значение (Т, +т) (с, +с) — с(, получается при с', =с=т, то верхняя граница указанной производной будет достигаться при с, =с= (, — т и равна О,— Т;+т'.
Если эта величина положительна, т. е. т > РсТ,' — 0ы то существуют сколь угодно близкие к т с„с, и с, для которых производная положительна и, зйачйт, (Т,+т — ),) 1 (Тс — )с)'+ 01 — (),— с) (),— Се) 2Т,— ),— с 286 (гл. ш ОПТИМАЛЬНЫЕ СТРАТЕГИИ о,т, Т(т)=Т, +т — (,,),+, (268) Как уже говорилось, при М ~ГТ',— О, а производная (264) по (, тогда будет отрицательна для т, < т. Возьмем теперь производную по с.
Опять пренебрегая положительным знаменателем и учитывая, что в силу отри- цательности (266) (Т,— (,)'+ Р,— (1,— с) ((,— (,) <(Т, +т — (,Н2Т,— 1,— с), получим производную по г, в виде 1(Т, — (,)'+ О, — ($, — с) ((, — 1, Я '— — (Т,+т — 1,) (2 (Т,— с) ~(Т,— (,)'+О,— ((,— с) ((,— 1,Ц+ +(Т,— с)'(Ф,— г,)) < (Т,+т — ~,) Ц(Т,— (е)*+О,— — ((,— с)((,— (,)] (2(Т,— с)+(с — Ф,))— — 2 (Т,— с) ((Т,— Г,)*+ О, — (Г,— с) (Ю,— ГЯ— — (Т, — с)' ((, — (,)) = ((с — т,) ((Т, — (,) '+ О,— †($, — с)(г, — г,)1 †(Т, — с)' (Г, — г,)) (Т, + т — 1,). Если последнюю величину взять в точке (с, (е), удовлет- воряющей (265), то можно ее переписать в виде ( ТЕИтъ+ ) яТ ( )е+О (т — еу+ Π— (г,— с) (г,— ге)) (Т вЂ” (,)' — (Т,— с)' [(Т,— (,)'+ОД = — ((,— (,) (Т вЂ” г,) ) =О.
Последнее опять следует из (265). Итак, для оптимальных гарантирующих т при фикси- рованных г', и с минимум (264) достигается при (, т, а, если фиксировано с, то при го удовлетворяющем (265). При этом производная по с отрицательна, и, значит, с, реализующее минимум, равно своему наибольшему зна- чению, т. е. 1, т. Но тогда и (, т. Итак, необходимо (267). При этом минимальное Т (т, р (1Ц достигается при (, = с = (, — т и равно, оче- видно, 2 211 ПЕИМЕЕЫ МАКСИМИНОВ И МИНИМАКСОВ 287 минимум Т [т, р(!)](Т,. Таким образом, минимум (262) по р(!) определен для всех т( Т,. Осталось его опреде- лить при т ) 1, и при т > Т,.