Введение в теорию исследования операций. Гермейер (1971) (1186148), страница 28
Текст из файла (страница 28)
Что касается ожидаемого (гарантируемого) исследователем исхода операции, то он, очевидно, равен $ 161 ПОНЯТИЕ ОПТИМАЛЬНОЙ СТРАТЕГИИ Но тогда ш1 Р~~р(х); у~( 1п1 зпр Р(х, у), и ЕН ФЕН Л ЕМ, и поскольку справа стоит константа, то н зпр 1П1 Р~~р(х), у1 ( 1п1 зпр Р (х, у), (172) ф(.Ъ) РАН РЕН ЯВМ, что и требовалось. Тем самым одновременно доказана простая, но важная Теорема Х111.
Если возможно получение и оптимальное использование полной точной и не уменьшающей области возможных стратегий М, информации о неопределенных факторах у, то нецелесообразно использовать смешанные стратегии. Замечания. 1. Если неопределенных факторов нет, то условия теоремы выполняются автоматически и, следовательно, в этом случае не нужно создавать искусственные случайности. 2. Важно отметить, что определение исследователем операции оптимальной стратегии х,(у) не требует знания цели противника или каких-то предположений о нем, не требуется и предположений о знании нлн незнании противником стратегии оперирующей стороны. Наоборот, оценка гарантированного результата Р, применения стратегий х„даваемая исследователем операции, не знающим конкретного у, основывается на предположе пнях о наихудшем противнике, преследующем противоположные интересы.
Знание цели противника изменит оценку (170) так, как это указано в $8. 3. Из (169) и (164) ясно, что х„есть абсолютнооптимальная стратегия в любом множестве стратегий М, содержащем х„и с множеством значений х, не выходящем за рамки М,. В частности, это относится и к множеству М„содержащему все функции х=х(у), удовлетворяющие единственному условию хЕМ,. Точно так же и стратегии х'„являются з-абсолютно оптимальными (гл.
ш ОПТИМАЛЬНЫЕ СТРАТЕГИИ в любом множестве стратегий М, не выходящем за рамки М, и содержащем х,',. Не меняя утверждений, можно, конечно, считать и смешанные стратегии включенными в М,. Величина Ра Р«ЦЮ (173) выражает ожидаемый прирост наилучшего гарантированного результата операции за счет получения идеальной информации о выборе противника (точной и не требующей расходов на ее получение) и потому может считаться ценностью информации оперирующей стороны о противнике, цель которого противоположна нашей или неизвестна. Если Ц, = О, то нет необходимости стремиться к получению информации о у прн условии, что применение смешанных стратегий ') имеет смысл.
Но даже Це ) О еще не гарантирует осмысленности погони за информацией, поскольку последняя может быть ошибочной и дорогостоящей; для окончательного решения вопроса необходимо составить модель операции, учитывающую все зти обстоятельства. Прн Ц,=О оптимальная смешанная стратегия будет оптимальной й в множестве М„ однако, в отличие от х„не будет абсолютно оптимальной. Если же Ц,=О, то не имеет смысла пользоваться смешанными стратегиями и хранить втайне свои решения от противника. Наконец, если Ц,=Ц,=О, т. е. если Р„=Р;, зцр (п1 Р(х, у)= 1п1 зпр Р(х, у), (174) а ем«а ег« кем а ем, то нет особого смысла использовать смешанные стратегии и стремиться к получению информации о значениях неоп- ') Точнее следует скавать, что при Ц«=0 исследователь операции не может гарантировать никакого выигрыша аа счет получения впоследствии оперирующей стороной информации о у.
Однако если вта информация «бесплатна», то она, конечно, всегда может принести пользу, если противник отклонится от своей оптимальной стратегии. Повтому «бесплатной» информацией всегда, конечно, надо польвоваться. Но «бесплатной» информация бываег очень редко. По»тому практически высказанное в тексте утверждение верно. 6 151 ПОНЯТИЕ ОПТИМАЛЬНОЙ СТРАТЕГИИ 169 ределенных факторов; стратегия х, оказывается оптимальной в М„, т.
е. при любой информированности оперирующей стороны и противника; разумеется, х„как правило, не будет абсолютно оптимальной. Функция Р (х, у), удовлетворяющая (174), называется функцией с седловой точкой на М,х)т', если верхние и нижние границы достижимы. Тогда (174) можно переписать в виде шахт(ПР(х, у)= пппшахР(х, у).
(174') » Р Р» Функции Р(х, у), равные х*+у' н (х — у)' при О< <х<1; 0<у<1, дают соответственно примеры функций с седловой точкой и без нее; в первом случае максимин и минимакс равны 1, а во втором макснмин равен нулю, а минимакс — 1/4. Для краткости далее н в общем случае наличия равенства (174) будем говорить о функции с обобщенной седловой точкой, хотя это не полностью соответствует сложившейся терминологии.
Все сказанное Об использовании информации и Р„относилось к возможности получения информации о неопределенных факторах у. Если же возможно получение оперирующей стороной точной и «бесплатной» информации о конкретном значении случайных факторов г, то оптимальной стратегией Оперирующей стороны окажутся х„, для которых уже для неосредненных Р Р(х„у, г) = гпах Р(х, у, г). (175) » «мр Следовательно, оптимальная х„будет теперь уже функцией х„(у, г), а ожидаемый (гарантированный) результат операции Р,= 1П1 ~ «пах Р(х, у, г) й<р(г) ~) Р«м»«М, ) 1п1 «пах ) Р(х, у, г)й«р(г)=Р,. (176) Р«Н Х«М, Величина Є— Р„= Ц, есть ценность информации о случайных факторах. 170 (гл.
ш оптин«льныз стгзтзгин Получение добавочно к информации о у информации о г не может, конечно, изменить выводы теоремы ХП1. Примером получения и использования такой информа- ции является отмеченное в модели надежности «холодное» резервирование, когда резервный агрегат включается по получению информации о выходе из строя дублируемого агрегата. Стрельба с коррекцией по предыдущим выстрелам также является подходящим примером. Вид выражений (170) и (176) противоположен по по- следовательности знаков максимума и минимума виду(163); кажется тем самым, что гарантированные оценки (170) и (176) не укладываются в общие рамки.
Однако это просто обман зрения. Ведь (170) и (176) представляют собой не выражение максимальной гарантированной оценки по не- которому классу стратегий, а гарантированную оценку эффективности ш1 Р[х, (у), у1 или 1п1 ~ Р[х.(у, з), у, г1«йр(г) з«м »«и одной стратегии х, (у) или х„(у, г) в полном соот- ветствии с (67), если учесть, что шах Р (х, у) или ««м„ ~ шах Р(х, у, г) п4р(г) в силу (169) и (175) представ««м, ляют собой просто значения Р(х(у), у) и Р[х(у, г), у1 для этих стратегий. С другой стороны, (170) н (176) дают, как уже гово- рилось, абсолютно лучшие результаты в множествах М, и М, всех функций вида х(у) и х(у, г) соответствен- но.
Поэтому, конечно, шах ш1 Р(х, у)= ш1Р(х„у)= ш1 шахР(х, у)=Р„, у«м, у«л »«м»«л. «м шах ш1 Р (х, у) = Р,. (177) л«м у«м в Выражения Ц„Ц, и Ц,+Ц„=Р,— Р'„дают соответ- ственно ценность полной информации противника о реше- ниях оперирующей стороны, оперирующей стороны о про- тивнике и вообще информации друг о друге.
Однако очень $151 пОнятие Оптимлльной стглтегии 171 часто желательно иметь оценку ценности любого прироста информации. Если речь идет о приросте информации оперирующей стороны о противнике (а именно это в основном нас и интересует), то ценность такого прироста можно записать в виде прироста наилучшего гарантированного результата. Несколько конкретизируем это в довольно общих предположениях. Пусть М, и М,— множества стратегий х, разрешенные двумя случаями информированности оперирующей стороны и не выходящие за пределы М„или, точнее, пусть информация, лежащая в основе множества М„заключается в том, что оперирующая сторона узнает значения заданной функции л (и) =(г"'(и). гл" 6)).
Тогда множество М, состоит из всех стратегий вида х,=х ~й,(р)11 хЕ м«Убое (178) где х 1т7,) — произвольные функции. Аналогично определяется и множество М,. Соответственно в общем случае ценность изменения йнформированности можно выразить формулой ЬЦ=Ц,— Ц,= зпр 1п1 Р(х, у) — зцр !п1 Р(х, у). (178') «ЕМ «ЯМ «ЯМ~Я«У Знак АЦ покажет, какой из сравниваемых случаев информированности более ценен. В частности, если существует вектор-функция ф(1т) такая, что 1т,(у)=<р1т1,(у)1 при всех уЕ Ф, то естественно считать, что информация, соответствующая М„включает информацию, соответствующую М„ибо знание вектора 1т,(у) влечет за собой и знание 1т, (у). При этом ЬЦ)0, поскольку М,~М„так как любая стратегия (178) может быть представлена в виде х, = х И Я, (рц = л' Я, (р)) и, следовательно, является стратегией из М,.