Введение в теорию исследования операций. Гермейер (1971) (1186148), страница 27
Текст из файла (страница 27)
Однако справедливость этого тезиса легко восстановить. Во-первых, абсолютно оптимальные стратегии можно искать отдельно, пользуясь просто определением (164). Во-вторых, если они существуют, то, изменяя критерий эффективности, легко получить операцию, в которой они уже будут являться просто оптимальными, и других оптимальных не будет. Для этого достаточно ввести критерий эффективности РЕ(х, у)=Р(х, у) — зпр Р(х, у). (165) «ЕМ Поскольку всегда Р*(х, у) ~0, то, очевидно, зпр 1п1 Р*(х, у)(0.
«Е М УЕ Н С другой стороны, столь же очевидно всегда ппп зцрРе(х, у)=0. Рея «еМ Справедлива следующая Л е м м а. Если х, — абсолютно оптимальная стратегия для критерия Р (х, у), то она оптимальна для Р*(х, у), причем 1п1 Р'(х„у) = Гпах 1п1 Р'(х, у) =ппптпах Р* (х, у)=0. ЕЕФ «ЕМ Р.А' вен «см (165') В Ю. Б. Геэиеаеа 162 (гл. ш ОПТИМАЛЬНЫЕ СТРАТЕГИИ Обратно, если выполнено (165'), то любая оптимальная для РЕ(х, у) стратегия есть абсолютно оптимальная стратегия для Р(х, у). Доказательство.
Пусть х, абсолютно оптимальна для Р(х, у). Тогда в силу (164) немедленно имеем Р" (х„у) =0 при любых уц 1«'. Отсюда и из отмеченных свойств РЕ(х, у) немедленно следует (165'), а значит, и все первое утверждение леммы. Пусть, наоборот, выполнено (165') и х оптимальна для Р* (х, у). В силу Р"(х„ у) ( 0 из (165) следует Р*(х„у)=0 для любых уЕ)т'. Но отсюда Р(х„у)= = зцрР(х, у) для любых убй(, что и доказывает абсо- ДЕМ лютную оптимальность х, для Р(х, у).
Все сказанное позволяет нам в дальнейшем не выделять отдельно вопросы, относящиеся к абсолютно оптимальным стратегиям, поскольку они так илн иначе сводятся к просто оптимальным; однако все же в некоторых случаях будут выделяться некоторые вопросы, связанные главным образом с существованием абсолютно оптимальных стратегий.
Вернемся к вопросам оптимального выбора. Наиболее «простым» случаем оптимального выбора является случай, когда х = х не зависят от у, т. е. когда не предполагается получение или использование информации о неконтролируемых факторах (в том числе и о случайных, если они есть). Этот вариант отражает выбор стратегии для оперирующей стороны, знающей в течение всей операции не более того, что знает исследователь операции. Поскольку зто соответствует наименьшей возможной информированности ее (если не считать, что исследователь операции более осведомлен, чем вся оперирующая сторона), то и результат проведения операции в соответствии с общими априорными принципами 2 7 должен быть наименьшим. Это утверждение является следствием очевидного неравенства — если Ме=тм, то: зцр 1п1 Р(х, у)( зпр 1п1 Р(х, у) К«МУ«У «ЕМ'й«Н й 15! ПОНЯТИЕ ОПТИМАЛЬНОЙ СТРАТЕГИИ 166 Возьмем теперь множество М, возможных значений вектор-функций х=х(у) при всех уЕ у и всех хЕ М.
Тогда, если в М входят все функции х=х=сопз1 при хс Ме (т. е. если М~М„где М,— множество стратегий вида х=х), то, очевидно, РР"„=-Г„(Ме) = зпр !п1 Р(х, д)( зпр 1п! Р(х, у) (166) «е ме кем к ем уел/ Это и есть математическое выражение принципа роста результата с ростом информированности оперирующей стороны. Существенным здесь является предположение о том, что множество М, как множество стратегий, не зависящих от у и г, содержится в М и что, применяя только независимые от у стратегии, нельзя расширить зто множество М, всех возможных значений х. Последнее может произойти, потому что информация чего-то стоит (в смысле активных средств), и за счет ее получения в операции могут уменьшиться возможности воздействия оперирующей стороны, выраженные в множестве М,.
Таким образом, (166) не есть само собой разумеющееся неравенство, несмотря на его простоту. Вдальнейшем под М, будем понимать именно максимально возможное множество стратегий типа х=х. Неравенство (!66) остается, конечно, справедливым и в том случае, когда М, не содержащее всех стратегий из М„содержит все-таки хоть одну стратегию х, из числа оптимальных гарантирующих для М, (или приближенно оптимальных с соответствующим видоизменением (166)).
Поскольку М, выражает границы возможных действий оперирующей стороны (аналог ограничений на управление*)), то оно должно быть известно всегда. Но также ') Стоит обратить внимание на то, что всякое множество М страгегий х ограничено практически двумя несколько различными факторамн: а) ограниченностью множества значений х, т. е. множества Ме; вто обычно есть выражение ограниченности активных средств; б) допустимым видом фуниций х=х (у), что является результатом ограниченности ожидающейся информацки оперирующей стороны нли способов ее яспольаования. 164 (гл. ш олтимлльные стглтвгии ясно, что х= сопз1 является простейшей в реализации стратегий.
Поэтому недопустимо получать результат худший, чем может дать М,. Отсюда следует, что правильно организованное (достаточно полное) множество стратегий должно содержать для осторожности хотя бы одну из оптимальных гарантирующих стратегий х, из М,. Но х, можно определить, только находя максимин Р, — о для М,; таким образом, эта задача является первой и необходимой задачей на оптимум при исследовании операций. Вслед за этим возникает вопрос, нельзя ли улучшить ожидаемый результат по сравнению с (163), не используя конкретную информацию о у.
На первый взгляд это невозможно. Однако в действительности такая возможность заключена, например, в изложенных в начале этого раздела предположениях о цели разумного противника, а именно: если эта цель известна, то (см. ~ 8) можно видоизменять оценку эффективности стратегий, а следовательно, и оптимальный результат. Такой путь приводит к играм с непротивоположиыми интересами (недостаточно разработанным) и находится несколько в стороне от основного направления курса. Он не будет здесь разбираться, хотя бы уже потому, что знание цели противника †э хоть и не прямая информация о у, но все же увеличение информации о неопределенных факторах, которая может быть выражена (в условиях, указанных в $8) в уменьшении множества У.
Другая, для нас более интересная, возможность заключена в применении введенных в предыдущем разделе смешанных стратегий. Образуем всевозможные смешанные стратегии <р(х), исходя из чистых стратегий из М,; при этом, как уже говорилось, чистые стратегии будут являться частным случаем смешанных. Это приводит к расширению множества стратегий относительно М, н, следовательно, к увеличению (или хотя бы неуменьшению) максимина, который для этого случая будем обозначать: Р,= вцр 1п1 Р~~р(х), у]. ч (г) л л л л ФМ~ ПОНЯТИЕ ОПТИМАЛЬНОЙ СТРАТЕГИИ 166 $15] Ограничиваемся случаем отсутствия информации о случайных г, тогда г Г1ф (х), у~ = ~ г (х, у) Г!ф (х).
(167') Однако, как уже известно, величина (167) осмысленна и гарантированна, только если известно, что противник не имеет информации о выборе конкретной стратегии х при реализации случайной стратегии ф(х). Таким образом, и здесь хотя и не предполагается информация о у и о целях противника, но информация о противнике тем не менее увеличивается. Этот вариант заслуживает внимания из-за соответствия действительным условиям во многих случаях. Во всяком случае ясно, что если противник — природа, то такая ситуация типична. Множеству М, всех смешанных стратегий соответствует и своя оптимальная по (!63) стратегия.
Поскольку !п! г" (х, у) (а значит, и г~) может счи- РЕМ таться вполне реализуемой для разумного противника, если он имеет информацию о х, то величину г — г~=Ц )О (168) можно считать мерой ценности информации противника о конкретном выборе х оперирующей стороны. Одновременно это и ценность информации о неинформированности противника.
Случаем, прямо противоположным полной неинформированности оперирующей стороны, является вариант, когда оперирующая сторона будет знать точно и полностью у и сможет любым способом реализовать эту информацию (информация о г пусть отсутствует), не выходя все же за пределы значений х из М,. Если получение и реализация этой информации никак не уменьшают максимального линожества значений стратегий М„ то при заданном у наилучшей стратегией опе рирующей стороны будет, очевидно, х„для которой г" ! х„у1 = гпах Р (х, у).
(169) кямв 166 [гл. ш ОПТИМАЛЬНЫЕ СТРАТЕГИИ 1п1 Гпах Р(х, у)=Р,. РЕУ,» ЕМв (170) Выше, в лемме (160) из $14, уже было показано, что зта величина всегда не меньше, чем Р„. — о Если верхняя граница Р(х, у) недостижима, то, определяя х„' как стратегию, для которой зцр Р(х, у) — е(Р(х„, у), .в ЕМв будем иметь приближенную е-оптимальную стратегию х'„(у) =х„' и ожидаемый результат не меньше, чем !И1 зир Р(х, у) — Е=Р,— е. РЕК .в Емв Покажем теперь, что всегда ш1 зцр Р(х, у)=Р„)Рв)Р„.
(171) Р Е АВ .В Е Мв Поскольку второе неравенство уже доказано, обратимся к первому. Имеем ~ ейр(х) =1 и р1~р(х); у]=) Р(х, у)йр(х)( Мв (зцр Р(х, у) ° ) Гмр(х) = зцр Р(х, у). .еам, м, Лам, Эта х, оказывается, таким образом, функцией х„= х„(у) и является оптимальной стратегией, рекомендуемой исследователем операции при ожидающейся информированности оперирующей стороны о у. Оптимальная х, определяется здесь с помощью операции максимума, а не максимина, как в общем случае, и оказывается функцией у, что естественно, поскольку предполагается знание оперирующей стороной значений у, неизвестных исследователю операции.