Диссертация (1149594), страница 14
Текст из файла (страница 14)
Опорное множество плотности (,, ) обозначим как{︀}︀ , , = | (,, ) > 0 , = 1,2,(5.3)а математическое ожидание для (,, ) при фиксированных и как∫︁ (, ) = (,, ), = 1,2.Пусть плотность 1 (,, 1 ) задана параметрически. Обозначим какℱ2,,2∫︁{︁= 2 (,,2 ) : 2 (,,2 ) = 1,∫︁}︁2 (,,2 ) = 2 (,2 ), 2 ,2 , = 1 ,1 , (5.4)класс всех плотностей 2 (,,2 ) при фиксированных и 2 , имеющих математическое ожидание 2 (,2 ).
План * , максимизирующий критерий∫︁() (,1 ) = inf2 ∈Θ2inf 2 ∈ℱ2,,21,2 (, 1 ,2 , 1 , 2 ) ()(5.5)будем называть () -оптимальным. Этот критерий является локальным всмысле работы [27], так как он зависит от параметра 1 .92Также мы можем зафиксировать плотность 2 (,,2 ) и обозначить как∫︁{︁= 1 (,,1 ) : 1 (,,1 ) = 1,∫︁}︁1 (,,1 ) = 1 (,1 ), 1 ,1 , = 2 ,2 , (5.6)ℱ1,,1класс всех плотностей 1 (,,1 ) при фиксированных и 1 , которые имеютматематическое ожидание 1 (,1 ).
План * , максимизирующий критерий∫︁() (, 1 ) = inf2 ∈Θ2inf 1 ∈ℱ1,,1(5.7)1,2 (, 1 ,2 , 1 , 2 ) (),будем называть () -оптимальным.Для простоты мы далее будем предполагать, что функции 1 (,,1 ),2 (,,2 ), 1 (,1 ), 2 (,2 ) дифференцируемы по , , 1 и 2 соответственно,несмотря на то, что эти предположения можно ослабить при необходимости.В статье [11] для критериев (5.5) и (5.7) были получены явные представления.
Для критерия (5.5)∫︁ {︂() (,1 ) = inf2 ∈Θ2}︂∫︁+1+log {− − ( − 2 (,2 ))} 1 (,,1 ) (),(5.8)где величины и , зависящие от , 1 и 2 , находятся из системы уравнений∫︁−1 (,,1 ) = 1, + ( − 2 (,2 ))∫︁( − 2 (,2 ))1 (,,1 ) = 0 + ( − 2 (,2 ))(5.9)и удовлетворяют ограничениям + ( − 2 (,2 )) < 0, ∀ ∈ 1 ,1 , .Аналогичное представление было найдено для (5.7).Ниже доказано, что внутренняя оптимизационная задача в критериях (5.5) и (5.7) может быть сведена к решению одного нелинейного уравнения.Также получены более простые представления для критериев (5.5) и (5.7), чтопозволило существенно ускорить численное нахождение полу-параметрическихпланов.93Теорема 15.(a) Пусть при всех ∈ опорное множество для плотности 1 (,,1 ) является интервалом, то есть 1 ,1 , = [, min , , max ], причем ,min < 2 (, 2 ) <,max при всех 2 ∈ Θ2 .
Пусть также при всех ∈ и при всех 2 ∈ Θ2 ,уравнение∫︁1 (, , 1 ) = 11 + ( − 2 (,2 ))(5.10)имеет единственный ненулевой корень (, 1 , 2 ) который удовлетворяетусловию−11< (, 1 , 2 ) < −.,max − 2 (, 2 ),min − 2 (,2 )(5.11)Тогда критерий (5.5) принимает вид∫︁ ∫︁() (, 1 ) = inf2 ∈Θ21 (, , 1 ) log∫︁ ∫︁= inf2 ∈Θ21 (,, 1 )()2* (,,2 ){︀}︀log 1 + (, 1 , 2 )( − 2 (,2 )) 1 (, , 1 )(),(5.12)где “оптимальная” плотность 2* в (5.5) задается как2* (, , 2 ) =1 (, , 1 ).1 + (, 1 , 2 )( − 2 (,2 ))(b) Пусть интегралы∫︁2 (, , 2 ) exp(−) и∫︁2 (, , 2 ) exp(−)(5.13)94существуют при всех ∈ и при всех . Тогда критерий (5.7) принимаетвид1* (,, 1 )()2 ∈Θ2 2 (,,2 )∫︁ ∫︁[︀ {︀ ′}︀]︀log ( ) − 2 (, , 2 ) exp(− )′ ( )(),= inf∫︁ ∫︁() () = inf2 ∈Θ21* (, , 1 ) log(5.14)где “оптимальная” плотность 1* в (5.7) задается как1* (, , 1 ) = ∫︀2 (,,2 ) exp(−(, 1 , 2 )),2 (,,2 ) exp(−(, 1 , 2 ))(5.15) = (, 1 , 2 ) — это ненулевой корень уравнения∫︀ (, , 2 ) exp(−)∫︀ 2= 1 (, 1 ),2 (, , 2 ) exp(−)(5.16)∫︀а ′ () = ′ (, , 2 ) = 1/ 2 (, , 2 ) exp(−) .Доказательство.
(a) Для простоты введем обозначения1 (,,1 ) = 1 (), 2 (,,2 ) = 2 (), 1 (, 1 ) = 1 , 2 (, 2 ) = 2 .(5.17)Из формы критерия (5.5) следует, что нужно минимизировать{︂∫︁1,2 (, 1 ,2 , 1 , 2 ) =log}︂1 ()1 ()2 ()(5.18)при ограничениях∫︁2 () = 1, и∫︁2 () = 2 .Если{︂ = log}︂1 ()1 () + 2 () + 2 () ,2 ()(5.19)95то мы получаем уравнение Эйлера-Лагранжа1 ()=−+ + = 0,22 ()откуда выводится выражение для “оптимальной” плотности 2 ():2 () =1 (). + (5.20)Естественно предполагать, что ̸= 0, так как иначе = 1 и 2 () = 1 (). Изуравнений (5.19) и (5.20), получаем∫︁∫︁1 ()2 () =+∫︁∫︁1 + 11 =1 () −1 () = − . + + 2 =Отсюда следует, что = 1 − 2 , и2 () =1 ().1 + ( − 2 )Подставляя новое выражение для 2 () в оставшееся ограничительное условие,получаем∫︁1 () = 1.1 + ( − 2 )(5.21)По предположению теоремы уравнение (5.21) имеет единственное ненулевое решение в интервале (5.11) и поэтому условие 1 + ( − 2 ) > 0 выполнено длявсех ∈ 1 ,1 , .
Отсюда следует, что 2 — это плотность.(b) Из формы критерия (5.7) следует, что нужно минимизировать (5.18)при ограничениях∫︁1 () = 1, и∫︁1 () = 1 .(5.22)96Если{︂ = log}︂1 ()1 () + 1 () + 1 (),2 ()то мы получаем уравнение Эйлера-Лагранжа= log1{︂1 ()2 ()}︂+ 1 + + = 0откуда выводится выражение для “оптимальной” плотности 1 ():1 () = 2 () exp(−1 − − ).Обозначим′ = exp(−1 − )и подставим полученное выражение для 1 () в оба ограничительных уравнения∫︁∫︁1 () = ′∫︁1 () = ′2 () exp(−) = 1,∫︁2 () exp(−) = 1 .Объединяем эти уравнения и получаем финальное уравнение для ∫︀ () exp(−)∫︀ 2= 1 ,()exp(−)2(5.23)которое уже необходимо решать численно.Таким образом, нахождение значений критериев (5.5) и (5.7) при фиксированном сводится к численному нахождению корней уравнений (5.10) и (5.16)относительно .Когда мы решаем уравнение (5.10), то естественно предполагать, что <0, если 1 (,1 ) < 2 (,2 ), так как в этом случае функция 1/[1 + ( − 2 (,2 ))]возрастает, если ∈ 1 ,1 , , что позволяет нам сместить среднее функции1 (,,1 )/[1 + ( − 2 (,2 ))] вправо.
Аналогично, если 1 (,1 ) > 2 (,2 ),97то естественно искать > 0. Следующая лемма формализует приведенные рассуждения:Лемма 4. Пусть22 (,2 ) =∫︁( − 2 (,2 ))2 2 (, , 2 )существует и является строго положительной. Если есть решение уравнения (5.10), которое удовлетворяет (5.11), имеет тот же знак, что иразность 1 (,1 ) − 2 (,2 ).Доказательство. При доказательстве леммы будем также использовать обозначения (5.17).
Пусть есть решение уравнения (5.10) и 2* есть “оптимальная”плотность, задаваемая уравнением (5.13). Тогда∫︁∫︁1 − 2 =2* ()1 () −∫︁=1 ()=( − 2 ) = 1 + ( − 2 )}︂11 () 1 −1 + ( − 2 ){︂∫︁∫︁( − 2 )2 ()∫︁{︀ 2}︀( − 2 − 2 + 22 ) + 2 − 22 2 ()∫︁∫︁2= ( − 2 )2 () + (2 − 22 )2 () = 22 ,⏞⏟==0где 22 есть дисперсия плотности 2 () и 22 > 0.Пример 1. Пусть 1 (,,1 ) есть усеченная плотность нормального распределения ((,1 ), 1) заданная на интервале [−3 + 1 (,1 ), 3 + 1 (,1 )]. Этаплотность является функцией от 1 (,1 ) и из соотношения (5.13) следует,что в данном случае “оптимальная” плотность 2* (,,2 ) является функцией от 1 (, 1 ) и 2 (,2 ). На рисунке 5.1 показаны графики функции 2* для1 (,1 ) ≡ 0 и различных значений 2 (,2 ) на интервале [−3,3].
Значение корня уравнения (5.10) показано сверху над каждым рисунком.Основная разница между подходом, предложенным в [11], и подходом,описанным в теореме 15, заключается в более простом способе вычисленияinf2 ∈ℱ2,,21,2 (,1 ,2 ,1 ,2 ).(5.24)980.1density value0.20.30.4η1(x,θ1) = 0, η2(x,θ2) = 0.5, λ = −0.3950.00.00.1density value0.20.30.4η1(x,θ1) = 0, η2(x,θ2) = −0.5, λ = 0.395−3−2−10y123−3−10y1230.1density value0.20.30.4η1(x,θ1) = 0, η2(x,θ2) = 0.4, λ = −0.35220.00.00.1density value0.20.30.4η1(x,θ1) = 0, η2(x,θ2) = −0.4, λ = 0.3522−2−3−2−10y123−3−10y1230.1density value0.20.30.4η1(x,θ1) = 0, η2(x,θ2) = 0.3, λ = −0.28410.00.00.1density value0.20.30.4η1(x,θ1) = 0, η2(x,θ2) = −0.3, λ = 0.2841−2−3−2−10y123−3−2−10y123Сплошная линия — график плотности 1 усеченного стандартногонормального распределения, заданного на интервале [−3,3]; пунктирнаялиния — график плотности 2* , которая задается формулой (5.13), дляразличных значений 2 (, 2 ) = ∓0.5, ∓0.4, ∓0.3.Рисунок 5.1 — Иллюстрация к примеру 1 параграфа 5.199Это упрощение оказывает существенное влияние на скорость численного решения задачи, а также на его устойчивость.
Отметим, что результат из [11] требует численного решения системы из двух нелинейных уравнений (например, сиспользованием метода Ньютона) каждый раз при вычислении (5.9) для всехточек , использующихся при получении оптимального плана, максимизирующего критерий (5.7), и для всех значений параметров 2 ∈ Θ2 , задействованныхпри минимизации в упрошенной версии критерия (5.8) из [11].
С вычислительной точки зрения это довольно серьезная задача, сходимость которой зависит отвыбора начального приближения для итерационной процедуры. С другой стороны, теорема 15 сводит задачу вычисления (5.24) к решению одного нелинейногоуравнения на заданном интервале. Эта задача легко решается, например, с помощью метода бисекции или метода золотого сечения.В ходе численных экспериментов (смотри параграф 5.4) было обнаружено,что для многих значений независимой переменной значение функции (5.9) немогло быть получено, так как метод Ньютона не сходился к такому решениюсистемы, которое удовлетворяло бы условию + ( − 2 (, 2 )) < 0, причемтакая ситуация наблюдалась даже в тех случаях, когда начальное приближениев методе Ньютона бралось очень близко к ожидаемому решению (полученномус помощью подхода из теоремы 15). В тех же случаях, когда метод из [11] давалположительный результат, метод из теоремы 15 работал чуть более чем в двараза быстрее (смотри последний пример в § 5.4).5.2Теоремы эквивалентности для полу-параметрическихоптимальных плановВ этом параграфе мы сформулируем теоремы эквивалентности для критериев (5.5) и (5.7):Теорема 16.
Пусть выполнены предположения теоремы 15 и inf 2 ∈Θ2 в критериях (5.5) и (5.7) достигается в единственной точке 2* ∈ Θ2 для оптимального плана * .(a) Тогда план * является () -оптимальным тогда и только тогда, когдадля всех ∈ выполнено неравенство:1,2 (,1 ,2* ,1 ,2* ) −∫︁1,2 (,1 ,2* ,1 ,2* ) * () ≤ 0.(5.25)100При этом равенство в последнем выражении достигается только в опорныхточках оптимального плана * . Здесь 1,2 (,1 ,2 ,1 ,2 ) определяется в (5.1) и2*∫︁= arg inf2* (,,2 ) =2 ∈Θ21,2 (,1 ,2* ,1 ,2 ) * (),1 (,,1 ),1 + ( − 2 (,2 ))а находится как корень уравнения (5.10).(b) Тогда план * является () -оптимальным тогда и только тогда, когдадля всех ∈ выполнено неравенство:1,2 (,1* ,2 ,1 ,2* )∫︁−1,2 (,1* ,2 ,1 ,2* ) * () ≤ 0.(5.26)При этом равенство в последнем выражении достигается только в опорныхточках оптимального плана * .
Здесь2* = arg inf2 ∈Θ21* (,,1 ) = ∫︀∫︁1,2 (,1* ,2 ,1 ,2* ) * (),2 (,,2 ) exp(−)2 (,,2 ) exp(−)и находится как корень уравнения (5.16).Эта теорема является прямым следствием теоремы эквивалентности для-оптимальных планов из работы [10]. Часть (a) утверждает, что критерий() (,1 ) является частным случаем критерия -оптимальности для дискриминации между плотностью 1 (,,1 ) и плотностью 2* (,,2 ), которая задается формулой (5.13).
Часть (b) утверждает, что критерий () (,1 ) является частным случаем критерия -оптимальности для дискриминации между плотностью 1* (,,1 ), которая задается формулой (5.15), и плотностью2 (,,2 ).5.3Связь полу-параметрических критериев с критерием -оптимальностиВ этом параграфе мы докажем две теоремы, связывающие полу-параметрические критерии с критерием -оптимальности. Следующий результат опи101сывает достаточное условие для того, чтобы -оптимальный план был также() -оптимальным планом.Теорема 17.















