Диссертация (1149594), страница 5
Текст из файла (страница 5)
Обозначим пространство вероятностных мер, заданных на , через ( ). Пусть , ∈ ( ) и — это функционал, заданный24на ( ). Напомним, что производной по Гато функционала в точке понаправлению называется функционал ([1 − ] + ) − (),→0D () = lim(1.17)а функцией влияния для функционала называется функция ([1 − ] + ) − (),→0() = D () = lim(1.18)где — это вероятностная мера, сосредоточенная целиком в точке ∈ . Если () является линейным функционалом, то есть∫︁ () =(1.19)()(),то функция влияния принимает следующий вид(1.20)() = () − ().В сущности, функционал∫︁[︀]︀21 (,1 ) − 2 (,2 ) ()1,2 () = inf2 ∈Θ2почти линейный, за исключением наличия inf 2 ∈Θ2 .
Справиться с этим дополнительным затруднением помогает следующий результат:Лемма 1. Пусть (,) =(,)(), причем функция (,) непрерывнапо и дифференцируема по . Тогда∫︀D inf (,) = inf* D (,),∈Θ∈Θ ()где*Θ () ={︂}︂ : ∈ Θ, (, ) = inf (,)***∈ΘДоказательство леммы можно найти в книге [28] на странице 75. Положим]︀2[︀(,) = 1 (,1 ) − 2 (,2 ) . Эта функция удовлетворяет условиям леммы 1,25так как выполнены предположения 1 и 2. Пусть * — -оптимальный план.Тогда по леммеD 1,2 ( * ) =(︂∫︁inf*2 ∈Θ2 ( * )]︀2[︀1 (,1 ) − 2 (,2 ) ())︂∫︁[︀]︀2−1 (,1 ) − 2 (,2 ) () .По предположению 3 множество Θ*2 ( * ) состоит из одной точки 2* , поэтомуфункция влияния в точке * имеет вид[︀]︀21,2 ( * ) () = 1 (,1 ) − 2 (,2* ) − 1,2 ( * ) = 1,2 (, * ) − 1,2 ( * ).Если * — -оптимальный план, то для любого одноточечного направления 1,2 ( * ) () ≤ 0;в противном случае найдется ˙ ∈ , для которого выполнено противоположноенеравенство.Если отказаться от предположения 3, то теорема эквивалентности будетиметь несколько более сложный вид.
Обозначим как Θ*2 множество всех решений уравнения (1.13) при * = . План * является -оптимальным тогда итолько тогда, когда существует мера (2 ), такая чтоΨ1,2 (, * ) ≤ 1,2 ( * ),(1.21)где∫︁Ψ1,2 (,) =Θ*21.7[︀]︀21 (,1 ) − 2 (,̂︀2 ) (2 ),∫︁(2 ) = 1.Θ*2(1.22)Связь критерия -оптимальности с теорией аппроксимацииЗадача нахождения -оптимальных планов тесно связана с задачей чебышевской аппроксимации. В частности, верна следующаяТеорема 2. Задача нахождения -оптимального плана для дискриминациимоделей 1 (,1 ) и 2 (,2 ), 2 ∈ Θ2 эквивалентна задаче о нахождении среди26функций 2 (,2 ), 2 ∈ Θ2 наилучшей чебышевской аппроксимации для функции 1 (,1 ) в следующем смысле:∫︁sup inf2 ∈Θ2⃒⃒2[︀]︀21 (,1 ) − 2 (,2 ) () = inf sup ⃒1 (,1 ) − 2 (,2 )⃒ ,2 ∈Θ2 ∈причем опорные точки -оптимального плана принадлежат чебышевскомуальтернансу⃒}︃⃒⃒⃒⃒⃒⃒* ∈ ⃒ ⃒1 (* ,1 ) − 2 (* ,2* )⃒ = sup ⃒1 (,1 ) − 2 (,2* )⃒ ,⃒∈{︃=где 2* ∈ Θ2 соответствует наилучшей аппроксимации.Доказательство теоремы можно найти в работе [7].
В главе 2 используя теорему 2 мы получим аналитические представления точек и весов -оптимальныхпланов для дискриминации полиномиальных регрессионных моделей и моделей,отличающихся от полиномиальных добавлением дробно-рациональных слагаемых.1.8Алгоритм для численного построения -оптимальных плановВ работах [6] и [12] также был предложен численный итерационный алгоритм для нахождения -оптимальных планов:Алгоритм 1.
Пусть 0 — это некоторый начальный план и ( )∞=0 — последовательность положительных вещественных чисел, удовлетворяющая условиямlim = 0,→∞∞∑︁ = ∞,=0∞∑︁2 < ∞.=0Тогда для = 0,1, . . . поочередно выполняем два шага:1. Находим точку из множества планирования , такую что+1 = arg max 1,2 (, ),∈272.
Вычисляем новое приближение к оптимальному плану:+1 = (1 − ) + (+1 ),где (+1 ) — это план, сосредоточенный в точке +1 .Этот алгоритм является аналогом процедуры Федорова–Уинна, которая былаизначально разработана для нахождения -оптимальных планов. Известна следующая теорема, касающаяся сходимости рассмотренного алгоритма (смотри,например, книгу [19], главу 3, параграф 4, где описан аналогичный результатдля процедуры Федорова–Уинна):Теорема 3. Алгоритм Аткинсона-Федорова сходится в том смысле, чтоlim 1,2 ( ) = sup 1,2 ().→∞Основным недостатком алгоритма 1 является большое количество точек в результирующем плане.
На каждом шаге число точек увеличивается на одну, поэтому в итоге мы имеем план, сосредоточенный в 0 + точках, где 0 —мощность носителя начального плана 0 , а — количество проделанных итераций. Подробнее этот вопрос обсуждается в главе 3, где предлагается альтернативный алгоритм, устраняющий обозначенный недостаток.ВеличинаEff(,1 ) =1,2 (,1 ),sup 1,2 (,1 )называется эффективностью плана .
Она показывает то, насколько произвольный план хуже оптимального при фиксированном 1 . Эффективность — этостандартный показатель качества плана, используемый в литературе. Если истинное значение 1 далеко от выбранного нами приближения 1 , то эффективность Eff( * (1 ),1 ), где * (1 ) есть оптимальный план, посчитанный при фиксированном 1 , может оказаться низкой. Чтобы компенсировать этот эффектобычно используют робастные по отношению к выбору 1 критерии (например,байесовские или минимаксные).Если план * = * (1 ) является -оптимальным, а план — нет, то потеореме эквивалентности 1 существует ˙ ∈ , такой что 1,2 (,)˙> ( * ,1 ).28Из этого соотношения следует, что эффективность можно оценить снизу с помощью величины̂︁ (,1 ) =Eff1,2 (,1 ),max∈ 1,2 (,)которая может быть вычислена на каждой итерации алгоритма.
По аналогииэффективность можно ввести для любого другого критерия оптимальности. Вкачестве условия остановки для всех алгоритмов в данной работе используетсядостижение заданной нижней границы эффективности.1.9Различные обобщения критерия -оптимальностиКритерий -оптимальности имеет ряд существенных ограничений.
В этомпараграфе приведен краткий обзор работ, посвященных обобщениям критерия -оптимальности, которые позволяют их преодолеть. -критерий был разработан для сравнения двух конкурирующих моделей. Авторы оригинальной работы [6] предложили в [12] его обобщение на случай дискриминации произвольного количества конкурирующих моделей. Однамодель выбиралась в качестве базовой, ее параметры фиксировались, а оптимальный план выбирался таким образом, чтобы он доставлял максимум минимальному значению среди -критериев для дискриминации базовой модели икаждой из оставшихся моделей. Симметричная версия -критерия для дискриминации нескольких моделей, -критерий, который представляет из себя взвешенную сумму -критериев для всех возможных пар конкурирующих моделей,а также численный алгоритм для нахождения оптимальных планов, основанный на многомерной чебышёвской аппроксимации, были введены в [13].
Другоеограничение -критерия — зависимость от априорных значений для параметров одной из моделей, может быть компенсировано с помощью байесовскогоподхода, который обсуждался еще в [6]. В главе 3 предложен новый численныйметод для нахождения байесовских -оптимальных планов. Еще одно ограничение заключается в требовании о нормальности и гомоскедастичности ошибокнаблюдения.
В [9] -критерий был обобщен на случай дискриминации двухмоделей при нормальных гетероскедастичных ошибках. В [10] был предложенкритерий -оптимальности, основанный на расстояниях Кульбака–Лейблераи связанный с тестом отношения правдоподобия, который не требует нормаль29ности и позволяет решать задачу дискриминации двух произвольных конкурирующих моделей для плотностей ошибок. Критерии из работ [6] и [9] являются частными случаями -критерия.
В главе 4 численный метод для нахождения -оптимальных планов обобщен на случай введенных по аналогии -оптимальных планов. В [11] был предложен полу-параметрический критерий, в котором функции регрессии для всех конкурирующих моделей и законраспределения ошибок для одной из них считаются известными, а закон распределения для оставшейся модели получается как решение специальной задачивариационного исчисления.
Изучению полу-параметрических критериев посвящена глава 5.30Глава 2. -оптимальные планы для дискриминациидробно-рациональных и полиномиальных моделей.В настоящей главе рассматривается задача построения -оптимальныхпланов для дискриминации между полиномиальными регрессионными моделями и аналогичными моделями, содержащими дополнительное дробно-рациональное слагаемое.Построение -оптимальных планов представляет собой весьма сложнуюматематическую задачу минимаксного типа и до недавнего времени (до работы [8]) осуществлялось только численными методами за исключением простейшего случая дискриминации полиномиальных моделей, отличающихся на одинпорядок (этот случай описан, например, в главе 16 книги [26], с.372).















