Диссертация (1149594), страница 7
Текст из файла (страница 7)
Так как(︀)︀(︀)︀ −1 = cos ( − 1) arccos() + sin ( − 1) arccos() ,уравнение (2.12) переписывается в виде:√︀(︀)︀(︀)︀2 1 − 2 4 − 1 cos ( − 1) arccos()(︀[︀]︀)︀(︀)︀+ 4 + 22 + 1 − 22 4 + 1 sin ( − 1) arccos() = 0.√Умножим полученное выражение на 1/ 1 − 2 , считая, что ̸= ±1. В итоге:(︀)︀(︀[︀]︀)︀2 4 − 1 −1 () + 4 + 22 + 1 − 22 4 + 1 −2 () = 0.Последняя формула работает для ≥ 2.37Таблица 2 — Опорные точки -оптимальногоплана для дискриминации моделей (2.9) 1 , . .
. ,2223−1, − 2+1 , 2+1 , 1√︁√︁2 +12 +1−1, −,0,22 , 14−1, −5−1,√√√√42 +5+142 +5−142 +5−142 +5+1,−,,,4444√√√√2222− 2 +3 , − 2 +1 , 0, 2 +1 , 2 +3 , 11В таблице 2 приведены опорные точки -оптимального плана для дискриминации моделей (2.9), полученные как корни полиномов (2.10) и (2.11) изтеоремы 5, при небольших значениях .2.3EMAX-модель и квадратичная модель2.3.1Локально-оптимальный планВ этом параграфе приводится пример реальной прикладной задачи, длякоторой, благодаря теореме 4, можно получить аналитическое решение.
Рассмотрим пару конкурирующих регрессионных моделей:1 (,1 ) = 1,1 +1,2 ;1,3 + (2.14)2 (,2 ) = 2,1 + 2,2 (2,3 − ),заданных на промежутке ∈ [0, 500]. Вектор априорных значений для параметров первой модели 1 задается следующим образом1 = (1,1 ,1,2 ,1,3 ) = (60, 294, 25).Это часть задачи 4.2 из работы [15]. Введем функцию1,2 − 2,1 − 2,2 (2,3 − )1,3 + 1,3= 1,1 + 1,2 −− 2,1 − 2,2 2,3 + 2,2 21,3 + = 1 + 2 + 3 2 −,+(,,) = 1 (,1 ) − 2 (,2 ) = 1,1 +38где 1 = 1,1 + 1,2 − 2,1 , 2 = −2,2 2,3 , 3 = 2,2 , = 1,3 . Заметим, что∫︁sup inf1(,,) () = sup inf 2 2∫︁(,,)2 ().Мы получили, что задача нахождения -оптимального плана для пары моделей (2.14) эквивалентна задаче для пары1 (,̃︀1 ) =1;+(2.15)22 (,̃︀2 ) = 1 + 2 + 3 .при ∈ [0,500].
При этом оптимальный план зависит только от (в нашемслучае = 1,3 = 25) и умножение 1 (,̃︀1 ) на константу не повлияет на оптимальный план. Чтобы воспользоваться теоремой 4, необходимо перевести задачу на промежуток [−1,1]. Заметим, что имеет место взаимно однозначноесоответствие() = − () = − (250 − 250),где () = 1/( − ) и () = 250/( + ). Если пробегает отрезок [−1,1] отбольшего значения к меньшему, то = 250 − 250 пробегает отрезок [0,500]. Витоге имеем() = − (250 − 250) = −25011==.250 − 250 + − − +250250(2.16)То есть мы получили, что опорные точки -оптимального плана * для дискриминации моделей (2.15) совпадают с опорными точками для пары моделей (2.1)+250250= 1.1, переведенными на промежуток [0,500] с помощьюсоответствия = 250 − 250 и записанными в обратном порядке.
Используятаблицу 1, получаемпри = 2 и =*1 = 0,[︂]︂1*2 = 250 − 250+,2 2[︂]︂1*3 = 250 − 250 − +,2 2*4 = 500.(2.17)39Для того, чтобы получить веса, воспользуемся тем, что∑︁⃒[︀]︀* 1 (* ,1 ) − 2 (* ,2* )2 (* ,2 ) ⃒⃒=12⃒⃒=0(2.18)2 =2*для любого -оптимального плана * = {*1 , . . . ,* ; 1* , . . . ,* }, где 2* — решениеоптимизационной задачи inf 2 ∈Θ2 в (1.12) при = * . Этот факт можно найти,например, в [7] (теорема 2.2). Учитывая, что[︀]︀1 (* ,1 ) − 2 (* ,2* ) = − 1 (*+1 ,1 ) − 2 (*+1 ,2* ) , = 1, .
. . , − 1,(2.19)так как опорные точки принадлежат чебышёвскому альтернансу, получаем систему линейных уравнений относительно *⎧⎪⎪1* − 2* + 3* − 4* = 0⎪⎪⎪⎪⎨ * − * + * − * = 01 12 23 34 4⎪⎪1* 21 − 2* 22 + 3* 23 − 4* 24 = 0⎪⎪⎪⎪⎩ * + * + * + * = 14321Первые три уравнения в системе получаются из (2.18) и (2.19), а последнее —это естественное ограничение на веса. Решая систему, получаем2* (22 − 24 ) − 21 (23 − 24 )=,21 − 23]︂ [︂ 2]︂[︂ 21 3 − 24 1 3 − 42 − 24 2 − 4*2 =/ 2,−−2 21 − 23 2 1 − 31 − 23 1 − 313* = − 1* ,214* = − 2* .21*(2.20)Таким образом, формулы (2.17) и (2.20) задают искомое аналитическое представление точек и весов -оптимального плана для дискриминации моделей (2.14).
Подставляя числовые значения, получаем[︃* =]︃044.782 294.782 500.0.348 0.452 0.152 0.048402.3.2Робастный планОбсудим теперь задачу построения робастных планов для пары моделей (2.14). Напомним, что величинаEff(,1 ) =1,2 (,1 ),sup 1,2 (,1 )называется эффективностью плана при фиксированном 1 . Чтобы компенсировать зависимость оптимального плана от выбора параметров 1 обычно используют робастные критерии, один из которых мы сейчас рассмотрим.
Будемсчитать, что вместо одного фиксированного значения 1 у нас имеется априорное распределение на множестве Θ1 параметров первой модели. Стандартизированным байесовским -оптимальным называется план, доставляющиймаксимум величине SB (), равной интегралу эффективности по априорномураспределению (смотри, например, статью [32]).Пусть априорное распределение сосредоточено в конечном количестве точек ℎ и является равномерным. Тогдаℎ1 ∑︁()SB () =Eff(,1 ).ℎ =1(2.21)Заметим, что критерий (2.21) эквивалентен критерию () =∑︁∫︁[︀]︀2 (, ) − (,, ) (),, inf,=1, ∈Θ(2.22)где = ℎ + 1, (, ) = 1 (,1 ), при = 1, . . . ,ℎ, ℎ+1 (,ℎ+1 ) = 2 (,2 ),() = 1 при = 1, .
. . ,ℎ и матрица = {}ℎ+1,=1 имеет вид⎡0⎢⎢01⎢ = ⎢ℎ⎢⎢⎣000 ...0 ......0 ...0 ...⎤(1)0 1/ sup 1,2 (,1 )(2) ⎥0 1/ sup 1,2 (,1 )⎥⎥⎥.⎥(ℎ) ⎥0 1/ sup 1,2 (,1 )⎦00(2.23)41Заметим также, что стандартный -критерий (1.12) эквивалентен (2.22) при = 2, 1,2 = 1, 1,1 = 2,1 = 2,2 = 0. Численным алгоритмам для поискаоптимальных относительно критерия (2.22) планов ( -оптимальных планов)посвящена глава 3 (результаты опубликованы в [15]). Основная проблема, мешающая применить методологию из главы 3, состоит в том, чтобы вычислитьматрицу , которая в данном случае зависит от ℎ обычных -оптимальных()планов. В сущности, sup 1,2 (,1 ), = 1, . . . ,ℎ можно вычислить напрямую,но в нашем примере мы можем воспользоваться тем, что эти величины равныквадратам величин наилучшего приближения для соответствующих задач чебышёвской аппроксимации.
Посчитаем стандартизированный байесовский пландля дискриминации моделей (2.15) с равномерным априорным распределениемдля параметра , сосредоточенным на(1)(10)Θ1, = (1, , . . . ,1, ) = (25,50,75,100,125,150,175,200,225,250).Эта задача соответствует (см. формулу (2.16)) нахождению стандартизированного плана для моделей (2.1) с равномерным априорным распределением для, заданным на(1)(10)Θ1, = (1, , . . . ,1, ) = (1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2.0).В этом случае по формуле (2.5) для величины наилучшего приближения имеем()sup 1,2 (,1, )=2 , =4+22,[1 − 2 ] =()1,√︁()− (1, )2 − 1, = 1, . .
. ,10.(2.24)Подставим (2.24) в (2.23) и воспользуемся алгоритмом из [15], реализованным впакете [17] для R, который будет описан далее по тексту в главе 3, чтобы найтиоптимальный относительно критерия (2.22) план для пары (2.1). Воспользуемсяописанным выше способом перевода опорных точек с отрезка [−1,1] на отрезок[0,500] и перепишем точки и веса оптимального плана в обратном порядке, чтобы получить план для (2.15). В итоге имеем[︃*=]︃075.1663 327.8767 500.0.268 0.4100.232 0.09042*относительноТаблица 3 — Эффективность байесовского плана ()локально оптимальных критериев с фиксированными параметрами 1,()1,255075100125150175200225250Eff 0.825 0.942 0.984 0.998 0.999 0.995 0.987 0.979 0.970 0.960*с равномернымЭффективности стандартизированного байесовского плана априорным распределением на Θ1, относительно локально оптимальных планов, посчитанных в каждой отдельной точке Θ1, , представлены в таблице 3,()**явля,1, ).
Проверку того, что найденные планы * и где Eff = Eff(ются оптимальными относительно (1.12) и (2.21) соответственно, можно провести с помощью теоремы эквивалентности (см. [15], теоремы 2.1 и 2.2). Теорема эквивалентности для критерия (2.22), к которому сводятся критерии (1.12)и (2.21), может быть сформулирована следующим образом: план * является -оптимальным тогда и только тогда, когда для функцииΨ(,) =∑︁[︀]︀2, (, ) − (,̂︀, ) ,(2.25),=1̂︀где ̂︀ = ()— это значения параметров, на которых достигаются inf , ∈Θв (2.22), для всех точек ∈ выполнено неравенствоΨ(, * ) ≤ ( * ),(2.26)причем в опорных точках оптимального плана в (2.26) достигается равенство.На рис.
2.1 приводятся иллюстрации к теоремам эквивалентности. Из иллюстраций видно, что найденные планы удовлетворяют необходимым и достаточнымусловиям оптимальности.●●●●●●●00.00.2500 1000Ψ(x)0.40.6Ψ(x)20000.83000●1.0430100200300x4005000100200300400500x*а) 1,2 (,* )б) Ψ(,)*Непрерывными линиями обозначены графики функций 1,2 (,* ) и Ψ(,),задаваемых формулами (1.14) и (2.25), пунктирной — значения функционалов*1,2 (* ) и (), определенных в (1.12) и (2.22), а заштрихованными*точками — опорные точки оптимальных планов * и .Рисунок 2.1 — Иллюстрации к теоремам эквивалентности для оптимальных*планов * и 44Глава 3. Построение байесовских -оптимальных плановОбычный -критерий оптимальности для планов дискриминации имеетряд существенных недостатков: он является локальным, то есть зависит от фиксированных параметров одной из моделей, подходит только для сравнения двухконкурирующих моделей и не является симметричным относительно выбора модели, параметры которой мы фиксируем.
Из литературы известны несколькообобщений -критерия, компенсирующие перечисленные выше недостатки. Такдля дискриминации нескольких регрессионных моделей в работе [13] был предложен критерий -оптимальности, который представляет из себя взвешеннуюсумму попарных квадратов разностей между конкурирующими моделями, причем для каждой пары параметры одной из моделей фиксированы, а параметрыдругой находятся по методу наименьших квадратов. -критерий также является локальным, так как зависит от фиксированных заранее параметров.















