Автореферат (1149593), страница 2
Текст из файла (страница 2)
Доказаны две теоремы, связывающие полупараметрические критерии с критерием -оптимальности.Степень достоверности и апробация результатов.Правильность -оптимальных планов, выведенных аналитически во второй главе, подтверждается численными результатами. Все планы, полученные численно, былипроверены на оптимальность с помощью теорем эквивалентности. Для утверждений, доказанных диссертантом, в работе представлены полные доказательства; для остальных утверждений приведены ссылки на доказательства.Основные результаты диссертационной работы докладывались на семинаре кафедры статистического моделирования математико-механического факультета СПбГУ.
Исследования по теме диссертации были частично поддержаны грантами СПбГУ (проект 6.38.435.2015) и РФФИ (проект17-01-00161).Публикации на тему диссертации. Основные результаты диссертации изложены в трех работах [11], [12], [13], которые опубликованы в журналах, индексируемых системой Scopus.Вклад диссертанта в совместные работы. Вторая глава основанана работе [11], в которой все результаты и основной текст принадлежат диссертанту. Постановка задачи и текст вводной секции принадлежат соавтору.Третья глава основана на работе [12], в которой метод сведения байесовскихпланов к локально оптимальным, алгоритм 3.2, секция про метод оптимизации по весам, основанный на квадратичном программировании, теорема 3.3и все численные результаты принадлежат диссертанту.
Постановка задачи,итоговый английский текст и остальные теоремы принадлежат соавторам.Четвертая глава основана на работе [13], в которой адаптация алгоритма изпредыдущей работы на случай -оптимальных планов и все численныерезультаты принадлежат диссертанту. Постановка задачи, итоговый англий7ский текст и все остальные результаты принадлежат соавторам. Пятая главаоснована на работе, выполненной во время визита диссертанта в Рурскийуниверситет Бохума совместно с Х.
Детте, В.Б. Меласом и В.К. Вонгом. Теоремы 15, 17 и 18, лемма 4, а также все численные результаты принадлежатдиссертанту.Структура работы.Работа состоит из введения, пяти глав, заключения, библиографии, списка рисунков и списка таблиц. Общий объем — 119страниц, включая 9 рисунков и 14 таблиц. Библиография содержит 37 наименований.Содержание работы.Во введении аргументирована актуальность темы диссертации, приведен обзор соответствующей литературы, определены цели и задачи работы,обоснована их научная ценность.Первая глава является обзорной.
В ней сформулирована задача планирования эксперимента для дискриминации регрессионных моделей, описаноее место в математической статистике и в теории планирования эксперимента, приведен критерий -оптимальности из [2], а также дан детальный обзорсвязанных с ним результатов. Планом эксперимента называется дискретнаявероятностная мера , заданная на некотором компактном множестве планирования . Пусть даны две конкурирующие регрессионные модели 1 (,1 )и 2 (,2 ), определенные на . План называется -оптимальным для дискриминации 1 (,1 ) и 2 (,2 ), если он доставляет максимум величине∫︁1,2 () = inf2 ∈Θ2[︀]︀21 (,1 ) − 2 (,2 ) (),где 1 — это некоторый фиксированный вектор априорно заданных параметров для первой модели, а Θ2 — множество возможных параметров для второймодели. Критерий связан с нижней границей для мощности 2 -теста при проверке простой гипотезы о том, что верна первая модель с фиксированнымипараметрами 1 , против сложной альтернативы о том, что верна вторая модель при каких-то значениях параметров из Θ2 .
Нахождение аналитическихпредставлений для точек и весов -оптимальных планов является трудной8минимаксной задачей, которая решена в литературе только для случая дискриминации двух полиномиальных моделей, отличающихся на один или надва порядка, поэтому для получения -оптимальных планов обычно используют численные алгоритмы. В работе [3] было доказано, что задача нахождения -оптимального плана связана с задачей чебышёвской аппроксимациив том смысле, что опорные точки оптимального плана являются точкамимаксимума функции, представляющей из себя квадрат разности между регрессионной моделью из нулевой гипотезы и ее наилучшей чебышёвской аппроксимации альтернативной моделью.Во второй главе в явном виде получены -оптимальные планы длядискриминации полиномиальных моделей и моделей, отличающихся от полиномиальных добавлением дробно-рационального слагаемого. Для пары конкурирующих моделей1 (,1 ) =∑︁=01,1, +−2 (,2 ) =∑︁2, ,(1)=0заданных на промежутке ∈ [−1,1] при > 1, применив результат из [3] иизвестные факты из теории аппроксимации удалось доказать, что опорныеточки -оптимального плана являются корнями полиномов специального вида.-оптимальный план для дискриминации моделей (1) сосредоточен в-х точках из отрезка [−1,1], причем точки ±1 принадлежат плану при любом , а опорные точки из интервала (−1,1) являютсякорнями полиномов( + 2)Теорема 1.Ψ1 () = () − 2−1 () + 2 −2 (),(︀)︀(︀)︀Ψ2 () = 2 − 1 () + 2 − − 2 −1 (), ≥ 2, ≥ 1,√где = − 2 − 1, а () и () — это полиномы Чебышёва степени первого и второго рода соответственно.Корни полиномов из этой теоремы, а значит и опорные точки соответствующего плана, могут быть найдены для небольших в явном виде.
Аналогич9ный результат можно получить для двух других пар конкурирующих моделей1 (,1 ) =1 (,1 ) =∑︁=0∑︁=011, + 2, −2 (,2 ) =,2 − 2 (,2 ) =1, +∑︁=0∑︁2, ;(2)2, ;(3)=0заданных на промежутке ∈ [−1,1] при > 1.-оптимальные планы для дискриминации моделей (2) и (3)сосредоточены в ( + 2)-х точках. Если — нечетное, то опорные точкииз интервала (−1,1) плана для моделей (2) совпадают с корнями полиномовТеорема 2.Ψ1 () = () − 22 −2 () + 4 −4 (), ≥ 4,(︀ 4)︀(︀ 4)︀Ψ2 () = 2 − 1 −1 () + + 22 + 1 − 22 [4 + 1] −2 (), ≥ 2,а если — четное, то это верно для моделей (3).
√Точки ±1 принадлежатоптимальному плану при любом . Здесь = − 2 − 1.Глава завершается двумя примерами. В первом примере -оптимальный план для дискриминации EMAX-модели и квадратичной модели на промежутке [0,500] находится в явном виде с помощью теоремы 1. Во второмпримере для тех же моделей численно находится робастный план, оптимальный с точки зрения стандартизированного критерияℎ()1 ∑︁ 1,2 (,1 )SB () =,ℎ =1 sup 1,2 (,() )1()где 1 — это различные значения для фиксированных параметров первоймодели. Численные алгоритмы для нахождения планов дискриминации подробно обсуждаются в третьей главе работы.
Вычисления в этом примере()могут быть существенно упрощены, так как sup 1,2 (,1 ) равен квадратувеличины наилучшего приближения для соответствующей задачи чебышёвской аппроксимации. Изложение в этой главе опирается на материал из работы [11].В третьей главе предложен метод для численного построения байесовских -оптимальных планов. У стандартного критерия -оптимальности10есть несколько существенных ограничений.
В частности, он позволяет сравнить только две модели и он является локальным, то есть зависит от фиксированного априорного значения параметров одной из моделей. Для дискриминации нескольких моделей в работе [9] был введен критерий -оптимальности.Пусть имеется конкурирующих регрессионных моделей { (, )}=1 , ∈ , ∈ Θ . План называется -оптимальным для дискриминации { (, )}=1 ,если он доставляет максимум величине () = (, 1 , .
. . , ) =∑︁, inf, ∈Θ,=1∫︁ [︁]︁2 (, ) − (,, ) (), (4)где , ≥ 0, , = 0 — это веса, задающие значимость каждого попарного сравнения, а — это фиксированные параметры для соответствующих моделей;, = 1, . . . , . Ввиду зависимости от критерий -оптимальности такжеявляется локальным. Одним из способов компенсации локальности критерияявляется введение его байесовской версии, где вместо фиксированного значения параметров используется фиксированное априорное распределение. Планназывается байесовским -оптимальным для дискриминации { (, )}=1 ,если он доставляет максимум величинеB ()=∑︁,=1∫︁,infΘ , ∈Θ∫︁ [︁]︁2 (, ) − (,, ) () ( ),(5)где каждая мера задает априорное распределение на Θ для параметров модели (, ), = 1, .
. . , . Байесовский критерий (5) можно легко свести клокальному критерию (4), взяв распределения дискретными, что соответствует приближению интегралов по априорным распределениям конечнымисуммами на сетках из Θ . Критерий (5) с дискретными — это локальный -критерий вида (4) с той лишь разницей, что он предусматривает гораздобо́льшее количество сравнений между различными функциями и , чемкритерий (4), причем одни и те же пары и могут входить в критерийпо нескольку раз с разными значениями фиксированных параметров для -ймодели.Таким образом, для численного нахождения байесовских планов необходим эффективный алгоритм для нахождения локальных планов с боль11шим количеством сравнений. Будем считать, что множества Θ компактныи каждая модель (, ) непрерывна по и дифференцируема по , а также что для любого плана , для которого () > 0, и для любых и ,таких что соответствующий вес , ̸= 0, inf , ∈Θ в (4) достигается в единственной точке ̂︀, = ̂︀, () во внутренности множества Θ .
Введем функцию]︀2[︀∑︀Ψ(,) = ,=1 , (, ) − (,̂︀, ()) .В качестве базового алгоритма для построения локальных планов вработе берется версия алгоритма Аткинсона–Федорова из [2], адаптированнаядля нахождения -оптимальных планов.Пусть 0 — некоторый начальный план, а ()∞=0 — положительная вещественнаяпоследовательность,удовлетворяющая услови∑︀∞∑︀∞ 2ям lim→∞ = 0, =0 = ∞, =0 < ∞. Тогда для = 0,1, . . . поочередно выполняем два шага:(1) Находим точку +1 = arg max∈ Ψ(,),(2) Вычисляем новый план +1 = (1 − ) + (+1).Алгоритм 1.Сходимость этого алгоритма может быть доказана аналогично сходимостиалгоритма из [2]. Величина ()/sup () называется -эффективностьюплана.
Если план * является -оптимальным, а план — нет, то по теореме эквивалентности существует ˙ ∈ , такой что Ψ(,)˙> ( * ). Из этогосоотношения следует, что эффективность можно оценить снизу с помощью величины ()/max∈ Ψ(,), которая может быть вычислена на каждой итерации. Критерий остановки — достижение алгоритмом заданной нижней границы эффективности. Алгоритм 1 порождает последовательность планов с постоянно возрастающим количеством опорных точек. В финальном плане его можно сократить с помощью кластеризации или через нахождениеэкстремумов функции Ψ(, ), но с увеличением числа точек в носителе во время итерационного процесса бороться гораздо сложнее.















