Методы анализа и идентификации неопределенных моделей эксперимента (1103509), страница 3
Текст из файла (страница 3)
Некоторые из полученных результатов применялись автором в составе исследовательской группы, работающей над задачами анализа изображений геологических структур в рамках договора о сотрудничествемежду Физическим Факультетом МГУ им. Ломоносова и компанией «Schlumberger», порезультатам исследований был оформлен патент [Кольцов, Пытьев, Чуличков, 2005].Апробация работыРезультаты диссертационной работы докладывались на 1-й Международной научнопрактическойконференции«СовременныеинформационныетехнологиииИТ-образование», на конференциях «Математические методы распознавания образов–12», «Интеллектуальные системы и компьютерные науки–9», а также на научных семинарах кафедры МАТИС (механико-математический факультет МГУ) и кафедры КМФ(физический факультет МГУ).Публикации по теме диссертацииПо теме диссертации опубликовано 6 работ: одна работа в составе патента, 2 статьив журналах и 3 статьи в трудах конференций.Структура диссертационной работыДиссертация состоит из введения, трех глав основного текста, заключения и спискалитературы.25Кольцов Д.А., Сердобольская М.Л., Проверка сложных гипотез при отсутствии статистическойустойчивости частоты // Обозрение прикладной и промышленной математики.
М., 2006 (в печати).9Содержание работыВведение содержит обоснование актуальности рассмотренных в диссертации проблем. Кроме этого, во введении определяются цели и задачи исследования, указываетсяметодическая и теоретическая основы исследования и практическая ценность работы.Для широкого класса экспериментов математическую модель процесса измеренийможно записать следующим образом:ξi = M (i, f , νi ),i = 1, . . . , N,(1)где скалярная величина ξi задает результат i-го измерения объекта/явления; вектор fобразован интересующими исследователя, но не наблюдаемыми непосредственно, неизвестными параметрами объекта/явления (измеряемый сигнал); νi моделирует неточностьизмерений; M (·) – функция, описывающая модель формирования отдельного измерения.Если известны вид зависимости функции M (·) от своих аргументов, область ее определения и математическая природа сигнала f и «шума» νi , i = 1, .
. . , N, то модель измеренийсчитается полностью определенной. В противном случае (т.е. если какие-либо из указанных характеристик неизвестны полностью или частично) будем говорить о неопределенной модели измерений. При этом, как правило, предполагается заданным некотороемножество M возможных моделей M (·) или, в более общей постановке, класс M такихмножеств. В последнем случае мы считаем, что в (1) модель формирования отдельного измерения принадлежит априори неизвестному множеству M∗ ∈ M. Будем обозначать в общем случае неопределенную модель измерений символом M, отождествляя еев известном смысле с классом M и формальным описанием математических свойств ихарактеристик данного класса.Первая глава посвящена разработке методов анализа и идентификации объединенных неопределенных моделей измерений в случае линейной схемы измерений с аддитивным стохастическим шумом, которую мы запишем в видеξ = Af + ν,(2)где ν ≡ hν1 , .
. . , νN i – случайный вектор со значениями в евклидовом пространствеRN , A : Rm → RN – (N × m)-матрица с неслучайными элементами kAkij = aij , i =1, . . . , N, j = 1, . . . , m, моделирующая измерительный прибор, f ∈ Rm – m-мерный вектор.Анализ и идентификация неопределенных моделей измерений в случаелинейной схемы измерения с аддитивным стохастическим шумом.В начале главы вводится согласно [Пытьев, 2004] понятие модели измерений [A, Σ] :сигнал f ∈ Rm считается неслучайным априори произвольным вектором, среднее значение Eν вектора шума ν равно нулю, Σ – корреляционный оператор вектора ν.Для заданной модели измерений [A, Σ] сформулирована согласно [Пытьев, 2004] задача интерпретации данных эксперимента (измерений). Данная задача в диссертационнойработе ставится как задача снятия неопределенности в эксперименте по вектору U f , подкоторым понимаются параметры объекта, интересующие исследователя, U – линейныйоператор.
Приводится решение задачи интерпретации согласно [Пытьев, 2004], в которойкачество интерпретации охарактеризовано на основе величины h «среднеквадратичнойпогрешности» интерпретации [Пытьев, 2004].10В предположении, что в модели [A, Σ] существует неопределенность связанная снезнанием верен ли оператор A (является ли оператор A оператором истинной модели измерений), рассмотрена задача получения на основе неопределенной модели [A, Σ]новых знаний о процессе исследования объекта как задача проверки адекватности модели измерений [A, Σ].
При этом предполагается, что вектор шума ν имеет нормальноераспределение N(0, σ 2 I), где I – единичный оператор в RN . Величина σ 2 может являтьсякак известным, так и неизвестным параметром неопределенной модели измерений.Пусть параметр σ 2 является неизвестным для исследователя. Если рассматривать σ 2как «мешающий» параметр, то задачу проверки адекватности модели измерений [A, Σ]можно сформулировать как следующую задачу проверки гипотез:H1 :H2 :ξ ∼ N(a, Σ), a ∈ R(A) \ R(A0 ),ξ ∼ N(a, Σ), a ∈6 R(A),(3)где A0 : R1 → RN – оператор, элементы матрицы которого совпадают с координатамипроизвольного фиксированного вектора из R(A) (R(A) – пространство значений оператора A; выражение R(A) \ R(A0 ) обозначает теоретико-множественную разность).
Даннаязадача обладает определенным свойством симметрии, связанным с наличием инвариантности суждений в пользу гипотезы H 1 или H 2 относительно преобразований g ∈ G, гдеG – группа преобразований g пространства RN , действующих по формулеx → gx = wZx + z,Nw 6= 0 – число; {Z} – группа ортогональных преобразованийT ⊥в R , оставляющих непо⊥движными линейные подпространства RA (A0 ) ≡ R(A) R (A0 ) и R(A0 ); z – произвольный вектор из подпространства R⊥A (A0 ). Пусть Π, Π0 – ортогональные проекторы наR(A) и R(A0 ), соответственно.
На основе проведенных в диссерационной работе обзораи анализа методов решения задач проверки гипотез, в том числе методов, связанных сиспользованием принципа инвариантности [Рао, 1968]26 , [Вальд, 1960]27 , [Вальд, 1967]28 ,[Уилкс, 1967]29 , [Леман, 1979]30 , [Боровков, 1984], [Пытьев,2004], построено решение задачи (3) и доказано следующее утверждение.Утверждение 1. Функционал j(x) = ||(I−Π)x||2 ||Π0 x||−2 есть максимальный инвариантгруппы преобразований G. В классе инвариантных критериев существует равномернонаиболее мощный, который отклоняет гипотезу H 1 по наблюдению ξ всякий раз, когдаj(ξ) > jb (ε), где константа jb (ε) выбирается таким образом, чтобы уровень критерия былравен ε, ε ∈ [0, 1].В соответствии с данным утверждением, если выполняется j(ξ) > jb (ε), то модель измерений [A, Σ] признается неадекватной наблюдениям, в противном случае модель принимается как не противоречащая наблюдаемым измерениям.26Рао С.Р., Линейные статистические методы и их применения.
М.: Наука, 1968.Вальд А., Последовательный анализ. М.: Физматгиз, 1960.28Вальд А., Статистические решающие функции. Позиционные игры. М.: Наука, 1967.29Уилкс С., Математическая статистика. М.: Наука, 1967.30Леман Э., Проверка статистических гипотез. М.: Наука, 1979.2711По аналогии с методикой, изложенной в [Пытьев, 2004], на основе понятия надежности гипотезы H 1 при альтернативе H 2 введена следующая величина:2ασA (ξ)=Z∞j(ξ)prk⊥ , k0k⊥zk0k⊥dz,k0где prk⊥ , k0 (·) – плотность распределения Фишера с k⊥ = rank (I − Π), k0 = rank Π0 = 12степенями свободы.
Статистика ασA (ξ) названа надежностью модели [A, Σ] в случае неизвестного параметра σ 2 корреляционного оператора вида Σ = σ 2 I (в [Пытьев, 2004] введена величина αA (ξ), которая характеризует надежность модели измерений в случаеизвестного корреляционного оператора Σ). В диссертационной работе показано, что слу2чайная величина ασA (ξ) при истинной гипотезе H 1 чаще принимает значения, бо’льшие1/2 и близкие к единице, чем значения, меньшие 1/2 и близкие к нулю (на отрезке [0,1]),в отличие от ситуации, когда гипотеза H 1 неверна.
Таким образом, относительно боль2шое значение надежности ασA (ξ) свидетельствует в пользу непротиворечивости моделиизмерений, а относительно малое значение – в пользу неадекватности модели (ср. сосвойствами αA (ξ), отмеченными в [Пытьев, 2004]).Пусть оператор A является неизвестным элементом параметрического класса A.
Втаких условиях неопределенной модели измерений сопоставляется класс M = {[A, Σ],A ∈ A} моделей измерений, для неопределенной модели вводится соответствующее обозначение M (далее мы будем использовать обозначение класса M моделей измеренийдля обозначения соответствующей неопределенной модели измерений, отождествляя визвестной степени класс M и неопределенную модель) и ставится задача снятия неопределенности в модели M по параметру A как задача анализа и идентификации неопределенной модели M измерений, которая состоит из двух различных подзадач: задачипроверки адекватности в целом используемого класса M моделей по отношению наблюдаемому процессу измерений (задача анализа модели M) и задачи оценивания оператораA, A ∈ A, истинной модели измерений (задача идентификации модели M по параметруA; эта задача далее называется задачей синтеза модели измерений); указана связь этихподзадач: решение второй подзадачи может представлять интерес для исследователятолько в том случае, если при решении первой подзадачи класс M признан в известномсмысле адекватным.Задача проверки адекватности класса M ставится как задача проверки сложныхгипотез о параметре распределения вектора ξ = a + ν, ξ ∼ N(a, Σ); при этом осуществляются две различные постановки задачи в зависимости от того, является ли параметр σ 2известным или неизвестным:SS1 :1HAa∈R(A),HA,σa∈R(A) \ R(A0 ) ,2 :A∈AA∈ASS(a)(b)(4)2 :2HAa 6∈R(A),HA,σa 6∈R(A),2 :A∈AA∈Aздесь постановка (a) соответствует случаю известного параметра σ 2 , а постановка (b)– случаю неизвестного параметра σ 2 ; A0 : R1 → RN – оператор, элементы матрицыкоторого совпадают с координатами произвольного фиксированного вектора из R(A).Предложено решение на основе метода максимальной надежности выбора модели измерений [Пытьев, 2004].
Пусть критерий отклоняет класс M всякий раз, когда реализация12(вектор наблюдений) попадает в критическую область {x ∈ RN : α∗ (x) < αb (ε)}, гдеα∗ (x) обозначает максимальную надежность,e Σ] ∈ M},α∗ (ξ) = max{eαAe(ξ) | [A,(5)а значение αb (ε) выбирается таким образом, чтобы уровень критерия был равен заданной2исследователем величине ε ∈ [0, 1]. Здесь αeAe(ξ) – надежность αAe(ξ) или ασe (ξ) моделиAизмерений [A, Σ] в зависимости от того, какой рассматривается случай: случай известногоили неизвестного параметра σ 2 , соответственно.Для предложенного метода проверки адекватности класса M моделей вводится понятие качества проверки: характеристикой качества является величина β A (ε) мощностипредложенного критерия при фиксированном уровне критерия ε.Задача синтеза модели измерений поставлена как задача оценивания оператора A истинной модели измерений в предположении, что вектор ξ формируется по схеме ξ = a+ν,где a ∈ R(A), и A – неизвестный исследователю фиксированный оператор из класса A.Предложено решение данной задачи: в качестве результата синтеза принимается модельизмерений, доставляющая экстремум в оптимизационной задаче (5).









