Методы анализа и идентификации неопределенных моделей эксперимента (1103509), страница 6
Текст из файла (страница 6)
. . , mv ; v, ṽ = 1, 2. Набор γ v = (γ1v , . . . , γmvуказанную выше «нестационарность» распределения: γiv есть доля координат вектора ξ,для которых верна i-я простая гипотеза из H v . Вероятность 0 6 πv (xs ) 6 1 определяетрандомизированное правило принятия решения π по одному наблюдению ξn = xs : свероятностью πv (xs ) принимается гипотеза H v , с вероятностью πṽ (xs ) = 1 − πv (xs ) –гипотеза H ṽ , v 6= ṽ, s = 1, . .
. , S; π1 (x) + π2 (x) = 1, ∀ x ∈ X.v (x) такая, что τ v (x) = N /N, если в результате ранШаг 2. Вводится величина τNvNдомизированной процедуры, определяемой решающим правилом π ∗ , количество тех элементов вектора x, по которым была принята гипотеза H v , равно Nv , N1 + N2 = N. Велиv (x) определяет частоту принятия гипотезы H v в серии наблюдений x , . . .
, x .чина τNs1sNv (x) попадает в это мноШаг 3. Задается множество принятия гипотезы H v . Если τNжество, то принимается гипотеза H v , в противном случае – гипотеза H ṽ , ṽ 6= v. В сущности речь идет о голосовании в пользу той или иной гипотезы, осуществляемого порезультатам каждого наблюдения в серии xs1 , . . . , xsN .Введем обозначение1Pr v (T1 < τN ≡ τN(ξ) < T2 ) = maxPr(T1 < τN < T2 | H v , γ v )vγ(11)для максимального значения вероятности события {T1 < τN < T2 } при условии, что вернагипотеза H v и истинным в эксперименте является набор долей γ v .
При фиксированныхH v , γ v величина τN является функцией случайного вектора ξ с фиксированным распределением, поэтому мы можем ввести Pr(· | H v , γ v ) – переходное (по γ v ) распределениеτN . В диссертационной работе доказана следующая теорема.19Теорема 1. Пусть в (10) потери liv = 1, i = 1, . . . , mṽ , v 6= ṽ; v, ṽ = 1, 2. Тогда1) если не существуют такие наборы γ̃ v ∈ Γv , что выполнено равенство (8),то задача проверки нестационарных сложных гипотез H 1 , H 2 разрешима и в (9) рискL∗ < 1/2. При этомmaxjSXPr(xs | Hj2 )π1∗ (xs ) ≡ E2max < 1/2 < E1min ≡ minis=1SXPr(xs | Hi1 )π1∗ (xs ),s=1и для любого E ∈ (E2max , E1min )−2Pr 1 (τN < T ) 6 N −1 2(E1min − E)= O(N −1 ),−2−12= O(N −1 ).Pr 2 (τN > T ) 6 N2(E − Emax )(12)2) если найдутся наборы γ̃ v ∈ Γv такие, что выполнено равенство (8), то задачапроверки нестационарных сложных гипотез неразрешима и в (9) риск L∗ = 1/2.Данная теорема позволяет связать условие разрешимости L∗ < 1/2 с оценками максимальной по наборам γ v переходной вероятности ошибочных решений и объемом выборки.Проведено исследование структуры оптимального решающего правила π ∗ (см.
(9)), а также особенностей его построения. Кроме того, критерий голосования применен в случае,когда liv 6= 1 для некоторых значений i, i = 1, . . . , mv , v = 1, 2.Идентификация нестационарной неопределенной модели измерений в случае произвольного конечного числа нестационарных сложных гипотез.В диссертационной работе сформулировано обобщенное условие разрешимости длязадачи проверки произвольного конечного числа V > 2 нестационарных сложных гипотез.Утверждение 2. Для того, чтобы общая задача проверки произвольного конечного числа нестационарных сложных гипотез была разрешима, необходимо и достаточно, чтобыдля любой пары сложных гипотез не выполнялось условие (8).Предложен вариант решения, являющийся обобщением критерия голосования на случай V > 2 – так называемый «игровой» критерий.
Ключевой особенностью данного подхода является то, что в его основу положен принцип проведения командных игровыхтурниров: каждая команда играет с каждой (в нашем случае команде отвечает сложнаягипотеза, и в каждой паре команд результат игры определяется с помощью критерияголосования), победитель выявляется по сумме побед.Алгоритм «игрового» критерия.Шаг 1. Рассмотрим следующие оптимизационные задачи:(v2 )v2v2(v1 )v1v1Lv1 v2 ≡ min max maxL(πv1 | H , γ ), maxL(πv2 | H , γ ) ,(13)vvπ v1 ,v2γγ21гдеL(πv(ṽ) | H ṽ , γ ṽ ) =SXs=1πv(ṽ) (xs )mṽXγiṽ Pr(xs | Hiṽ ),(14)v1 > v2 ; v1 , v2 = 1, . . . , V ;i=1задача определения номера истинной сложной гипотезы разрешима при условии, чтоmax Lv1 v2 < 1/2 (см. Утверждение 2); введем εv1 v2 = 1/2−Lv1 v2 и обозначим εe = min εv1 v2 .v1 v2v1 v220Шаг 2. При условии, что реализация случайного вектора ξ = x, для каждой парызначений v1 , v2 построим случайные величины ηnv1 , v2 такие, чтоPr(ηnv1 , v2 = 1 | ξn = xs ) = πv(v12 ) (xs ),(v )Pr(ηnv1 , v2 = 0 | ξn = xs ) = πv(v21 ) (xs ),(v )где π v1 ,v2 = hπv12 (·), πv21 (·)i – решающее правило, доставляющее минимум в (13), а такжеследующие случайные величины:NPηnv1 , v2 > 1/21, N1Pv,vn=1ϑ1 2=;ζ v1 = ϑv1 , v2 .(15)NP v1 , v2v210, Nηn6 1/2n=1Шаг 3.
Принимается сложная гипотеза с номером v ∗ = arg max ζ v .vПредложен также так называемый «частотный» критерий.Алгоритм «частотного» критерия.Шаг 1. Выбирается значение εa из множества (0, Lm ), гдеmvmv2X1XLm ≡ min vminv max γiv1 Pr(xs | Hiv1 ) −γiv2 Pr(xs | Hiv2 ) .v1 ,v2 γ 1 ,γ 2 s∈{1,...,S} i=1(16)i=1Отметим, что если условие разрешимости (см. Утверждение 2) не выполнено, то Lmравно нулю, и εa ∈ (0, Lm ) не существует.Шаг 2. По реализации случайного вектора ξ = x для каждого v осуществляетсяпоискмаксимального по всем значениям {γiv }i:1,mv числа выполняющихся неравенствmPv vνs (x) −γi Pr(xs | Hiv ) 6 εa , s = 1, 2, .
. . , S (νs (x) – частота появления элементарногоi=1исхода xs в векторе x). Для этого вводится следующие случайные величины:mPv vv1, если νs (x) −γi Pr(xs | Hi ) 6 εa ,i=1,ϑvs (x | γ v ) =mPv vvaγi Pr(xs | Hi ) > ε ,0, если νs (x) −(17)i=1ρv (x | γ v ) =SPs=1ϑvs (x | γ v ); s = 1, . . . , S, v = 1, . . . , V. Далее решается следующий набороптимизационных задач:ρv∗ (x) ≡ maxρv (x | γ v ),vγ(18)v = 1, .
. . , V.Шаг 3. Принимается сложная гипотеза с номером v = v ∗ , для которого выполняетсяуказанное в Шаге 2 максимальное число неравенств: v ∗ (x) = arg max ρv∗ (x).vЭтот критерий является модификацией разработанного в [Пытьев, 2006] алгоритмаидентификации нестационарной неопределенной модели измерений.Качество алгоритмов идентификации нестационарной неопределенной модели M, основанных на «игровом» и «частотном» критериях, охарактеризовано в терминах переходных (по наборам γ v ) вероятностей ошибочных решений, принимаемых при идентификации.21Для переходной вероятности ошибочного решения «игрового» и «частотного» критериев получены следующие оценки:∗2Pr(ζ v6=v = max ζ v ) 6 V e−2N εe ,v∗Pr(ρv6∗=v = max ρv∗ ) 6 Se−2N ·(εva )2+ e−2N ·(Lm −εa )2,(19)соответственно, где v ∗ обозначает номер истинной сложной гипотезы; при полученииданных оценок использовалось неравенство Хёфдинга [Hoeffding, 1963]39 , [Вапник, 1974],[Вапник, 1979]40 .
Построенные оценки позволили для «игрового» и «частотного» критериев доказать их состоятельность; на основе полученных результатов указана связь приведенных оценок с обобщенным условием разрешимости, сформулированным в Утверждении 2, и объемом выборки N.Проведен анализ качества алгоритмов идентификации нестационарной неопределенной модели M, основанных на «игровом» и «частотном» критериях. На основе оценок (19) показано, что в различных нестационарных неопределенных моделях в зависимости от требуемого уровня переходных вероятностей ошибочных решений и объемавыборки более предпочтительным может оказаться алгоритм идентификации, основанный либо на «игровом», либо на «частотном» критерии.В [Пытьев, 2006] построен метод проверки нестационарных сложных гипотез, применяющийся в том числе и к задаче восстановления возможностной модели по даннымнаблюдений. Согласно данному методу решение принимается следующим образом.
Дляполученной в эксперименте реализации ξ = x находятся значения νs (x), s = 1, . . . , S, ирешается оптимизационная задача:mvXvv v ∗ = arg min minmaxν(x)−γPr(x|H)(20)ssii vγ v s∈{1,...,S} i=1Далее принимается сложная гипотеза с номером v ∗ .Приведенный критерий обладает свойством сильной состоятельности (оценка v ∗ дляномера истинной сложной гипотезы является сильно состоятельной [Пытьев, 2006]). Вотличие от «игрового» и «частотного» критериев основные утверждения относительнокачества критерия, предложенного в [Пытьев, 2006], сформулированы в терминах «сходимости с вероятностью единица».В диссертационной работе произведено сравнение критериев в условиях, когда принимается во внимание фактор затрат, сопутствующих отдельному измерению или отдельному принятию решения по всей выборке.
Получено следующее: «игровой» критерий может быть рассчитан априорно вне зависимости от реальных наблюдений, и всвязи с этим он может обладать реальным преимуществом над «частотным» критериеми критерием, построенным в [Пытьев, 2006]. При учете фактора вычислительных затратпроведено сравнение качества критериев на основе значений, принимаемых функциейпотерь R(δ) для каждого из критериев. Функция потерь определялась следующим образом: R(δ) = max αv wv +aδ , где δ обозначает критерий, αv – переходная (по набору γ v )v∈{1,...,V }вероятность отвергнуть v-ую сложную гипотезу, когда она верна, wv – сопутствующие39Hoeffding W., Probability inequalities for sums of bounded random variables.









