Диссертация (1149594), страница 11
Текст из файла (страница 11)
В качестве стартового использовался стартовый план из [13]. График функции Ψ(, ˜1 ) после первой итерации алгоритмапредставлен на рисунке 3.2. Опорные точки плана ˜1 показаны на этом рисунке выколотыми точками. Отметим, что во всех опорных точках ˜1 функцияΨ(, ˜1 ) принимает одно и то же значение, как и утверждается в лемме 3. Чтобынайти план с аналогичной эффективностью, алгоритму из статьи [13] понадобилось 9 итераций, каждая из которых по утверждению авторов выполняетсяза 1-2 секунды.●●●●●Psi5000100001500020000660100200300400500xРисунок 3.2 — График функции Ψ(, ˜1 ) после первой итерации алгоритма 3Теперь для тех же моделей рассмотрим байесовский -оптимальныйплан.
Для простоты мы задаем априорное распределение только для четырехмерного вектора параметров последней модели 4 , в то время как 1 , 2 и 3остаются фиксированными векторами. Это априорное распределение задано в81 точке из R4 следующим образом:{︀}︀1 ,2 ,3 ,4 | 1 ,2 ,3 ,4 ∈ {−1,0,1} ,(3.27)где1 ,2 ,3 ,4 = (1 + 1 , 2 + 2 , 3 + 3 , 4 + 4 ), = (1 ,2 ,3 ,4 ) = (49.62, 290.51, 150, 45.51).План, как и в прошлом примере, строится для разных значений 2 .
Веса планав соответствующих точках пропорциональны величинам(︁ ||2 )︁11 ,2 ,3 ,4 − ||2exp, 1 ,2 ,3 ,4 ∈ {−1,0,1},(2 2 )22 2(3.28)где || · ||2 есть евклидова норма. Конечный байесовский критерий (3.8) состоитиз 246 попарных сравнений конкурирующих моделей.Для разных значений параметра 2 байесовский -оптимальный планснова был найден тремя способами (как в предыдущем примере). Планы, найденные с помощью алгоритма 3 со вторым шагом из § 3.4.1, представлены в67Таблица 6 — Байесовские -оптимальные планы длядискриминации моделей (3.26)2Оптимальный план *202023023323523720.000 78.783 241.036 500.00.255 0.213 0.357 0.1750.000 84.467 234.134 500.00.257 0.225 0.351 0.1670.000 91.029 225.713 500.00.259 0.237 0.345 0.1590.000 92.692 222.735 500.00.260 0.240 0.344 0.1560.000 91.743 129.322 221.118 500.00.260 0.214 0.0360.336 0.1540.000 89.881 129.590 170.306 220.191 500.00.260 0.170 0.0910.0190.310 0.150таблице 6.
Сравнительное время работы для всех трех алгоритмов можно найти в таблице 5. Мы снова видим, что предложенные в главе методы работают существенно быстрее. При небольших значениях параметра 2 байесовский -оптимальный план сосредоточен в 4 точках считая граничные точки множества планирования. При увеличении параметра 2 количество опорных точекрастет.
Так, если 2 = 352 или 372 , байесовский -оптимальный план имеет 5 или 6 точек, считая граничные точки множества планирования. Графикифункции Ψ из теоремы эквивалентности 6 приведены на рисунке 3.3.●●●●●0100●15000Psi50000100200300400500200x●20000●400500б) 2 = 202●●●●●Psi500050001000010000Psi1500015000●300xа) 2 = 020000●10000100005000Psi15000●200006801002003004005000100200x●●20000●400500г) 2 = 332●●●●●●●Psi500050001000010000Psi150001500020000в) 2 = 302●300x0100200300x4005000100200300400500xд) 2 = 352е) 2 = 372Непрерывной линией обозначен график функции Ψ(,*2 ), задаваемойформулой (3.14), пунктирной — значение функционала (*2 ), определенногов (3.5), а выколотыми точками — опорные точки -оптимального плана *2 .Рисунок 3.3 — Графики функций Ψ(,*2 ) для планов из таблицы 669Глава 4.
Построение байесовских -оптимальных плановКритерий -оптимальности (как и обобщающий его критерий -оптимальности) предполагает гомоскедастичность и нормальную распределенностьслучайных ошибок наблюдения. На случай дискриминации двух моделей при гетероскедастичных нормальных ошибках -критерий был обобщен в работе [9].В [10] был предложен критерий -оптимальности, основанный на расстояниях Кульбака–Лейблера, не требующий нормальности и пригодный для дискриминации двух произвольных конкурирующих моделей для плотностей ошибок,причем критерии из работ [6] и [9] являются его частными случаями.В этой главе предложен метод построения байесовских -оптимальных планов для дискриминации произвольного количества регрессионных моделей. Байесовский критерий -оптимальности вводится по аналогии с байесовским критерием -оптимальности.
Численные алгоритмы из главы 3 обобщаются на случай нового критерия. Изложение в данной главе опирается наматериал из работы [16]. Алгоритмы, описанные в параграфе 4.4, также реализованы в пакете [17] для языка R.4.1Обобщение критерия -оптимальности на случай произвольнораспределенных ошибок наблюденияРассмотрим стандартное уравнение регрессии: = (,) + ,(4.1)где ∈ , а случайные ошибки независимы и имеют нулевое средние и заданную дисперсию.
В работе [10] было предложено следующее обобщение критерия -оптимальности для случая произвольно распределенных ошибок наблюдения. Будем считать, что при фиксированных и величина имеет абсолютно непрерывное распределение с плотностью (,,), среднее и дисперсиякоторой равны∫︁(,) = E = 2 (,) = var = (,,),∫︁( − E )2 (,,).70Рассмотрим теперь две конкурирующие модели для плотности (,,):1 (,,1 ), ∈ , ∈ , 1 = (1,1 , .
. . ,1,1 ) ∈ Θ1 ;2 (,,2 ), ∈ , ∈ , 2 = (2,1 , . . . ,2,2 ) ∈ Θ2 ,где — общая область определения для обеих плотностей. Расстояние Кульбака–Лейблера между конкурирующими плотностями 1 (,,1 ) и 2 (,,2 ) обозначим как∫︁1,2 (,1 , 2 ) =2 (,,2 ) log2 (,, 2 ).1 (,,1 )(4.2)Предположим теперь, что параметры первой модели фиксированы и обозначимих как 1 . Для дискриминации между двумя конкурирующими плотностями1 (,,1 ) и 2 (,,2 ) в [10] было предложено искать такой план эксперимента,который максимизирует величину∫︁KL1,2 (, 1 ) = inf(4.3)1,2 (, 1 , 2 )().2 ∈Θ2План, максимизирующий критерий (4.3), называется -оптимальным.Отметим, что критерий (4.3) не является симметричным. По сути, поменяв 1 и 2 в (4.2) местами или заменив inf 2 ∈Θ2 на inf 1 ∈Θ1 в (4.3), мы получимдругие критерии (всего четыре разных варианта).Статистическая интерпретация критерия -оптимальности такова.
Рассмотрим задачу проверки гипотезы0 : (,) = 1 (,1 ),против альтернативы1 : (,) = 2 (,2 ), ∈ Θ2 .Отношение правдоподобия для наблюдения в точке имеет следующий вид:(2 , ) =1 (,,1 ).2 (,,2 )71Тест отношения правдоподобия основан на статистике(2 , ) = −2 log (2 , ) = 2 log2 (,,2 ).1 (,,1 )При больших значениях статистики гипотеза 0 отвергается. Рассмотрим математическое ожидание статистики при том, что верна гипотеза 1 , в случаеплана, сосредоточенного в единственной точке :∫︁E1 (2 , ) = 22 (,,2 ) log2 (,,2 )= 21,2 (,1 , 2 ).1 (,,1 )Мощность теста отношения правдоподобия тем больше, чем больше значениеE1 (2 , ). Теперь рассмотрим точный план = (1 , . . . , ; 1 , . .
. , ), такой∑︀что = / , =1 = . Используя независимость наблюдений получаем∫︁E1 (2 , ) = 22 (, ,2 ) log}︂ {︂∏︁2 (, ,2 ) =1= 2∑︁1 (, ,1 )∫︁2 (, ,2 ) log∫︁=12 (, ,2 )1 (, ,1 )1,2 (,1 , 2 ) ().= 2Переходя от приближенного плана к точному плану и рассматривая значение E1 (2 ,) при наименее благоприятном 2 , когда E1 (2 ,) минимально,получаем критерий (4.3).Теперь рассмотрим обобщение критерия -оптимальности на случайдискриминации произвольного количества конкурирующих плотностей1 (,,1 ), . .
. , (,, ).Фиксированные параметры рассматриваемых моделей обозначим как 1 , . . . , .Расстояние Кульбака–Лейблера между -й и -й плотностью обозначим как∫︁, (, , ) = (,, ) log (,, ), (,, )72а соответствующий критерий∫︁KL, (, ) = inf ∈Θ, (, , )().Здесь параметры -й плотности фиксируются, а по параметрам -й плотности происходит оптимизация. Следуя обозначениям главы 3, пусть , — этонеотрицательные веса, отвечающие за вклад попарного сравнения плотностей (,, ) и (,, ) в финальном критерии.
По аналогии с тем, как мы делалиэто в предыдущей главе для критерия -оптимальности, введем симметричную версию критерия -оптимальности для ≥ 2 конкурирующий моделей1 (,,1 ), . . . , (,, ):KLP () =∑︁,=1, KL, (, ) =∑︁,=1∫︁, inf, ∈Θ, (, ,, )().(4.4)План, максимизирующий критерий (4.4), будем называть P -оптимальнымпланом для дискриминации моделей 1 (,,1 ), . .
. , (,, ). Будем далее всегда предполагать, что множества , Θ компактны и все плотности непрерывныпо . Отметим, что критерий (4.4) зависит от неизвестных на практике параметров 1 , . . . , , которые устанавливаются экспериментатором для конкурирующих моделей 1 (,,1 ), . . . , (,, ). Следовательно, критерий являетсялокальным в смысле работы [27]. Если фиксированные значения параметров1 , . . . , далеки от истинных значений, найденный оптимальный план можетиметь низкую эффективность.4.2Байесовские -оптимальные планы и их сведение клокально оптимальнымАналогично тому, как мы делали это в предыдущей главе для -оптимальных планов, сформулируем байесовскую версию критерия -оптимальности, являющуюся более устойчивой по отношению к неправильному выборуфиксированных параметров. Байесовским -оптимальным планом будем на73зывать дискретную вероятностную меру, доставляющую максимум величинеKLBP () ==∑︁,=1∑︁∫︁,KL, (, ) ( ),(4.5)Θ∫︁,,=1∫︁infΘ , ∈Θ, (, ,, )() ( )Здесь , ≥ 0 и , = 0 при любом , а мера для каждого = 1, .
. . ,задает априорное распределение для параметров плотности , такое что всеинтегралы в формуле (4.5) определены.Отметим, что для случая двух конкурирующих моделей критерий (4.5)рассматривался в работе [36]. Как было показано в [15], вычисление байесовскихпланов, оптимальных с точки зрения критерия (4.5), можно свести к вычислению локально оптимальных планов для большего количества конкурирующихмоделей. В большинстве приложений интегралы в (4.5) вычисляются численными методами, предполагающими аппроксимацию произвольных априорныхраспределений мерами с конечным носителем. Если априорные распределения дискретны и сосредоточены в точках 1 , .















