Введение в теорию исследования операций. Гермейер (1971) (1186148), страница 17
Текст из файла (страница 17)
Однако параметр а здесь не известен, а ограничен неравенствами указанного типа или более общего: аЕЕ, где Š— некоторое заданное множество. 3) Неизвестен тип закона распределения, но известно или ограничено конечное число его характеристик. В качестве таковых обычно выступают или значения 1(г;) в некоторых точках г; или моменты закона распределения ) г'ф(г)=М,; 1=0, 1,... Ограничения неопределенности 1(г) (т. е.
информации о законе распределения) выглядят здесь следующим образом: 1'(г) — неубывающая функция, и при 1<1< т, 0<1(п 0 "а <~(гт)<Ь <1; 0<с;<)г'4(г)<дс (90) К этому, конечно, могут быть прибавлены условия: при г < г, 1" (г) =0 или при г ) г 1(г) = — 1 и другие аналогичные условия, которые описывают область возможного изменения г. Объединенно все эти виды информации о законе распределения могут быть записаны в виде неравенств г, < ~ г, (г) 4 (г) < г;, 1 < 1 < 1„(91) где г,(г) — известные функции, в частности, при г,(г)=1 для г<гт и «,(г)=0 для остальных г получаем первую группу условий (90).
Таким образом, при оценке эффективности в моделях со случайными факторами приходится иметь дело с разной степенью точности знания закона распределения, и это обстоятельство является существенным моментом, затрудняющим оценку эффективности и приводящим к появлению неопределенных факторов. Между тем обычно оценка эффективности базируется без особых оснований на принятии наиболее благоприят. ного первого случая информированности о закенах распределения.
100 ОЦЕНКА ЭФФЕКТИВНОСТИ СТРАТЕГИЙ [ГЛ. Ц К указанным трем типам постановок вопроса так или иначе близки все другие. Приведем примеры. 1. Иногда вместо первой группы условий (90) (или вместе с ней) задаются условия на дифференциальный закон распределения 1(г): 0(1'(г)(У. (92) Если считать ф(г)=1'(г) функцией ограниченной вариации, заданной на интервале [О; 11 с нулевыми значениями на концах, то 1 1 1 ') г'111(г) = ) г1 ф (г) 1[г = ††,.
) Е1+' Йр (г), о о о е1 ['(г,.) = ~ 1р (г)Г[г = ~ (г — г) йр (г). о о Если теперь соответствующие интегрирования по частям провести и в (66), то видим, что задача в этом случае остается по существу такой же, как и в случае 3), с заменой 1(г) на Гр(г). Условие 0(1р(г)(1т' заменяет при этом 0<1(г)(1, а монотонность Р(г) заменяется ограниченностью вариации ф (г). Оценка эффективности стратегий в случае условия (92) может базироваться на известных леммах типа леммы Неймана — Пирсона.
Эти леммы будут приведены далее. По существу некоторые из этих результатов ранее были получены А. А. Ляпуновым, но в менее подходящей трактовке. 2. В теории надежности часто вместо 1(1)=1 — р(1) (р (1) †вероятнос безотказной работы элемента в течение времени 1) и 1'(1) используется интенсивность отказов Л(1) =) (1)1(1-1(1)]. Из опыта кроме моментных характеристик 1(1) получают еще интегральные характеристики Х (1) — средние интенсивности отказов в виде неравенств 3~ < ~ Х (1) 1[1 (Х. Но это неравенство влечет за собой 1 — 1(1Г) 3 ( 1п 1 1(1,) < Х 101 К 11) УЧЕТ СЛУЧАЙНЫХ ФАКТОРОВ или е- 1 (г,) — 1 (т,) ) еь — 1, е" 1(1,) — 1(1,) < е" — 1.
Очевидно, эти условия есть опять-таки условия типа (91). Так, напрнме~, левая часть первого неравенства соответствует г (1) =е- — 1 при 1 <1,; г(1) = е-при1,.-ЛЯ, й и г(1)=0 в остальных точках. 3. В статистике, при получении опытным путем векторов а или Г(г) и моментов Мн широко используются для оценок измеряемых величин доверительные границы и соответствующие доверительные вероятности.
При этом неравенства (90) или а, < а < а, объявляются не достоверными событиями, а событиями, имеющими определенную (доверительную) вероятность. Если мы признаем некую доверительную вероятность достаточной гарантией достоверности, то неравенства (90) или а, < а < а, при соответствующих доверительных границах могут рассматриваться как обязательные неравенства, и мы приходим к третьему варианту информированности о законе распределения. Однако можно, хотя без особенного эффекта, использовать знание доверительных вероятностей иначе, а именно: ошибки при измерении, например, величины а (или М;) можно объявить случайными, а доверительные вероятности — законами распределения этих ошибок. Тем самым появляются новые случайности, а именно — а или М, и 1(г), и следует вновь повторить все операции осреднения йад критериями за счет добавочных случайных факторов, в результате чего вернемся так или иначе к указанным трем типам постановок задач.
Если закон распределения 1(г, а) зависит только от одного случайного параметра а с законом распределения Ср(а, р), то осреднение условного закона распределения 1(г, а): ~ (г, р)= ~1(г, а)ЫФ(а„р), приведет к рассмотрению нового (безусловного) закона распределения Цг, р), зависящего от известного или неизвестного параметра 11. 102 ОЦВИКА ЭФФВИТИВНОСТИ СТРАТЕГИЙ (ГЛ. и Если известна функция Ф(а, р), то (при известном 7(г, и)) известен и вид закона 7(г, р).
В других случаях информированности о Ф(сс) (так же, как и при известной ГР(ГГ, (1)) иногда может быть целесообразен иной ход сведения задачи к укаэанным трем типам. Так как известно 7(г, и), то после осреднения по г критерий (66] будет функцией только а.
А при осреднении по а как раз и повторяются все три типа задач. ПуетЬ тЕПЕрЬ В ОПЫТЕ ИЗМЕряЮтСя СаМИ 7(гт)е ау= = а~+ВТ с замеренным значением ау и законом распределения ошибок Ф(е) и моменты М;=т;+ЛИГ;. Тогда, фиксируя е, и ЛИГИ мы при оценке эффективности должны прежде всего определить все 7(г), минимизирующие (66) при условии, что М; и 1(г~) известны точно (поскольку фиксированы е и Ат;).
Полученная гарантированная оценка эффективности окажется зависящей только от е7 и АРЛИ и, осредняя ее по этим величинам, вернемся к указанным трем типам задач. Итак, имеет смысл рассматривать три типа задач оценки эффективности, сводящихся к нахождению (67) прн неопределенности в 7(г), остающейся для указанных трех типов информированности, т. е.
к нахождению 1п1 )... ~ )Р' [х(у,), у,ДГЦ, (у„) ... ~„(у, ) по функциям ~;(уп), ограниченным информацией указанных трех типов. Кроме того, отметим, что часто вместо моментов М, бывают известны центрнрованные моменты, например, вместо М, дисперсии Р =М, — М„*. Если при этом центрированные моменты известны точно, то точно известны и М„ и задача оценки эффективности не меняется. Если же, скажем, М, и Р только лишь ограничены, то задача оценки эффективности может быть представлена вначале как задача с точно известным М, и ограниченным М, (вслед за Р), а затем уже происходит вторая минимизация по возможным значениям М,.
Возможна, конечно, и другое описание задачи, но тогда область изменения М, и М, не может рассматриваться как пря- к И1 учзт случАЙных ФАХТОРОВ мое произведение областей изменения М, и М„что внесет соответствующие осложнения в оценку эффективности, не меняя ее существа. Вид закона распределения 1(г, а) (а тем более закон полностью) может быть известен или из длительного и массового эксперимента, что, например, для новых образцов техники, как правило, невозможно, или из математических и общих физических соображений. К последнему относятся указания на выполнимость условий, позволяющих применять асимптотические законы теории вероятности — предельные законы. Перечислим основные предельные законы, наиболее часто используемые в настоящее время в практике оценок и сравнения эффективности.
1. Нормальньй закон распределения. Закон может использоваться, когда случайная величина есть сумма большого количества независимых случайных величин с дисперсиями, малыми относительно суммарной дисперсии. Применяется для характеристики процессов измерения и рассеивания при стрельбе.
Однако, например, измерение с помощью калибров наверняка не может им характеризоваться. То же, видимо, относится и к стрельбе самонаводящимися снарядами. П. Закан Пуассона для числа появлений т события: ьт е-а ЛН (93) где а †средн значение числа появлений. Закон Пуассона возникает или как предел биноминального закона распределения, имеющего место при повторении независимых испытаний, или же как характеристика простейшего потока событий (например, вызовов в телефонной станции), т.
е. потока ординарного, исключающего появление двух событий в один и тот же момент, и без последствия (вероятность появления того или иного количества события в любом интервале времени не зависит от того, что было ранее). Закон Пуассона особенно широко применяется в теории массового обслуживания, а также в работах по эффективности стрельбы. Использование его в теории стрельбы было связано с тем обстоятельством, что закон (32) при одновременном стремлении гп — со и а 0 104 оцвккл эьькктввкости стглтвгий 1гл.