Диссертация (1150844), страница 18
Текст из файла (страница 18)
Подтвердился ирезультат замечания 4.7.3: реальное сделанное алгоритмом число шагов достаточно точно описывается свойствами собственных чисел матрицы P(S0 ) из (4.30)(линии на рисунке 5.6 практически совпадают).Уменьшение параметра даёт сходимость и теоретической, и практической оценки к границе Рао-Крамера. Известно, что если кратно , то приотсутствии ограничения на число обусловленности матрицы R можно получитьL*R = I [23]. Уменьшением условие на вырожденность R в задаче (4.8) становится всё менее сильным, а в пределе при = 0 пропадает. Однако, платойза более высокую точность оценивания является увеличение времени работы,126что объясняется свойствами собственных чисел матрицы (4.30), см. замечание(4.7.3). Случай = 1 соответствует стандартному методу Кэдзоу с L = I ,R = I .Далее был рассмотрен сигнал S(1) и шум с 1 = 0.9, то есть случай красного шума, = 0.1, но рассмотрены два варианта выбора матрицы L: одинсоответствовал модели шума (L = Σ−1 ), а второй нет (L = I , как надо было бы сделать в случае белого шума).
Был применен метод Cadzow(quadratic).Результаты представлены на рисунках 5.7 и 5.8.●●●●●●●●0.0015●0.0015●●●●●●●●●●●●●●●●0.0014●●●●●●0.0014●SimulationTheoryCRB0.0016●●●MSEMSE of Cadzow signal estimate ~ alpha, b1 = 0.9 sigma= 0.10.0017SimulationTheoryCRBMSE0.00160.0017MSE of Cadzow signal estimate ~ alpha, b1 = 0.9 sigma= 0.1●●0.00130.0013●●●0.00120.0012●●●●●●●●●●●●●●0.00110.0011●0.01А0.020.050.10alpha0.200.501.00●0.01Б●●0.02●●0.050.100.200.501.00alphaРис.
5.7. Сравнение для оценки сигнала S(1) с помощью алгоритма Cadzow(quadratic)для красного шума при различных и (A) диагональной L (Б) трехдиагональной L.Прокомментируем результаты на рисунке 5.7. Заметим, что выбор неправильной матрицы L ведет к тому, что уменьшение не приводит к улучшениюоценки. Выбором матрицы L = Σ−1 мы добились того, что уменьшение ведёт ко всё более близкой к оценке Рао-Крамера ошибке оценивания сигнала,однако, в отличие от предыдущего случая белого шума, при таком выборе Lневозможно выбрать матрицу R так, чтобы получить нужную W0 = L * R,W0 = Σ−1 даже при отсутствии ограничения на её вырожденность! Тем неменее, полученная при малом ошибка близка к границе Рао-Крамера, что127Number of iterationsConverted eigenvalue●10Average speed of Cadzow algorithm, b1 = 0.9 sigma = 0.170Number of iterationsConverted eigenvalue●●1070Average speed of Cadzow algorithm, b1 = 0.9 sigma = 0.16064030●4●●●●●●А0.020.050.10alpha0.20●●●●●0.50●●1010●2●2●0.01−1/log(max non−unit eigenvalue)50●20●Mean number of iterations6430●−1/log(max non−unit eigenvalue)5040●20Mean number of iterations●8860●●1.000.010.02Б0.050.100.20●●●0.50●●1.00alphaРис.
5.8. Сравнение числа итераций алгоритма Cadzow(quadratic) для сигнала S1 для красного шума при различных и (A) диагональной L (Б) трёхдиагональной L.оправдывает сделанный нами выбор матрицы L в постановке задачи (4.7).Полученные теоретические результаты были проверены и для полиномиального сигнала S(2) при белом шуме 1 = 0 и = 1. Этот сигнал интересентем, что содержит кратные сигнальные корни, см. определение 1.1.4, и поэтомупрежде оценивание таких сигналов было затруднено.
Результаты представленына рисунке 5.9. Они аналогичны результатам для сигнала S(1) , представленнымна рисунках 5.5 и 5.6.В следующем численном эксперименте рассмотрим зависимость ошибкиоценки сигнала с помощью алгоритма Cadzow(quadratic) от числа шагов дляразных значений .
Мы промоделировали = 1000 реализаций, и изобразилиMSE оценки вместе с 95-процентными доверительными интервалами, полученные на первых 15 итерациях Cadzow(quadratic), при фиксированных . В качестве теоретической оценки («Theory») мы использовали результаты следствия4.7.2, в качестве теоретической оценки при большом числе итераций («Theorylimit») использовали результат замечания 4.7.4, а также изобразили границуРао-Крамера с помощью предложения 2.5.2 («CRB»).SimulationTheoryCRBAverage speed of Cadzow algorithm, b1 = 0 sigma = 1●●●Number of iterationsConverted eigenvalue●15MSE of Cadzow signal estimate ~ alpha, b1 = 0 sigma= 1800.14128●●●●●60●●●●50.11●100.12MSE●●40Mean number of iterations●●●−1/log(max non−unit eigenvalue)0.13●●0.10●●●●●●20●●●●●●●●●●0.01●●●0.02А●0.050.10alpha0.200.501.000.01Б0.020.050.100.20●●●0.50●●1.00alphaРис.
5.9. (A) Сравнение для оценки сигнала S2 с помощью алгоритма Cadzow(quadratic)для белого шума при различных , = 1 (Б) сравнение числа итераций алгоритма.Результат для сигнала S(1) , 1 = 0, = 1 при = 1 и = 0.1 представленна рисунке 5.10.Пример на рисунке 5.10 (A) примечателен тем, что первая итерация с = 1соответствует оценке, полученной методом SSA [8]. Мы видим, что при увеличении числа итераций полученная оценка по MSE не улучшается, что подтверждается как моделированием, так и следствием 4.7.2.
Отсюда, в частности, можносделать вывод, что нет особого смысла улучшать результат метода SSA с помощью последующих итераций. В то же время, использование = 0.1 позволяетуменьшить ошибку в пределе ценой повышения трудоёмкости, при этом ошибкана первой итерации существенно больше, чем при использовании SSA.5.2.2. Исследование оценок, полученных модифицированнымметодом Гаусса-Ньютона (MGN)В этом разделе на примере ряда S(1) из раздела 5.2.1 моделированием была исследована точность оценок сигнала S(1) с помощью модифицированногометода локального поиска Гаусса-Ньютона MGN, предложенного в разделе 3.3.129MSE of Cadzow signal est. ~ iteration, alpha = 0.10.200.20MSE of Cadzow signal est. ~ iteration, alpha = 1SimulationTheoryTheory limitCRB0.18●●●●●●●●●●●●●●●●●●●●●●●●●●MSE0.160.18●0.160.14●●0.14MSESimulationTheoryTheory limitCRB●●●0.120.12●●●●●●●●●●●●●●●●●●●●●●●●●●●0.100.10●2А468101214iteration246Б8101214iterationРис.
5.10. Сравнение для оценки сигнала S1 с помощью алгоритма Cadzow(quadratic)для белого шума и различном числе итераций (A) = 1 (Б) = 0.1.Для выбора начального значения использовался метод Cadzow(quadratic), описанный в разделе 4.6.1. Детали применения метода Кэдзоу для поиска начального значения описаны в подразделе 4.6.2. Был использован параметр = 0.1,остальные параметры и критерий остановки такие же, какие были использованы в разделе 5.2.1. Далее был применён метод MGN (см.
алгоритм 3.3.5),критерий остановки тот же, что использовался в разделе 5.1.2.Было сделано = 1000 моделирований ряда X = S(1) + (1 ), к каждойреализации был применён алгоритм MGN и получена оценка сигнала ̃︀(1,) =(1,)(˜1(1,), . . . , ˜ )T , = 1, . . . , . В качестве меры точности оценки взята поточечная (по элементам ряда) среднеквадратичная ошибка:1 ∑︁ (1)(1,)MSE =( − ˜ )2 .=1В качестве теоретической оценки MSE взят результат предложения 2.5.1, который даёт границу Рао-Крамера («Theory (CRB)») как асимптотическую оценкуMSE. Для оценки, полученной моделированием, изображён 95-процентный выборочный доверительный интервал.130Результат для сигнала S(1) и шума с 1 = 0 и двух значений = 4 и = 1представлены на рисунке 5.11, а для случая 1 = 0.9, = 3.3 и = 0.1 — нарисунке 5.12. Значения параметра выбраны для наглядности получившихсярезультатов.●SimulationTheory (CRB)● ●3.5MSE of MGN algorithm, AR = 0 sigma = 10.204.0MSE of MGN algorithm, AR = 0 sigma = 4●SimulationTheory (CRB)●●● ●●●●●●●●2.5● ●●●●●● ●●2.0●● ●●●●●● ● ●●● ●● ●●●● ●● ● ●●● ●● ●● ●●●● ●●●●● ● ●● ● ●●● ●● ● ●●● ●●●● ●●●●●20index●30●●● ●● ●●●● ●● ●● ●1.0●● ●●●●А●●● ●●●●10●●●●0.051.5●0●●●●● ● ●0.15●● ●●●0.10● ●Squared Error3.0●●Squared Error● ● ●●●40●●● ●●●●●●●010Б●●● ●●●●● ●●●● ●203040indexРис.
5.11. Сравнение для оценки сигнала S(1) методом MGN при белом шуме c (A) = 4 (Б) = 1.В обоих случаях рисунки 5.11 и 5.12 показывают, что при увеличениисоотношения сигнал/шум, то есть уменьшении , наблюдается сходимость результатов, полученных моделированием, к оценке, полученной в предложении2.5.1, что согласуется с результатом теоремы 2.5.1. Более того, данные примеры демонстрируют, что метод Кэдзоу даёт хорошее начальное приближениедля метода MGN при большом соотношении сигнал/шум: значение границыРао-Крамера попадает в доверительный интервал; при малом же соотношениисигнал/шум асимптотический результат не работает.Таким образом, при большом соотношении сигнал/шум ошибки полученных с помощью метода MGN оценок сигнала достигают границы Рао-Крамера,что является улучшением относительно оценивания сигнала с помощью методаКэдзоу.131●MSE of MGN algorithm, AR = 0.9 sigma = 0.10.0025MSE of MGN algorithm, AR = 0.9 sigma = 3.33.5SimulationTheory (CRB)SimulationTheory (CRB)● ●●●●0.0020●●● ●●●Squared Error2.5● ● ●●●●●●●2.0●●●●●●●●●1.5●●●●●●● ●●●●1.0●●●●●●●●●●●●●● ●●●●●●●●●●●●●●● ●010● ●2030indexА40●● ●●●●Б● ● ●●●●10●●●● ●● ●●●●●●●●● ● ●0●●●●● ●●●●●●●●●●●●●0.00050.5● ●●● ● ●●●●●●● ●●●●●● ●● ●●●●●●●●●●●0.0010Squared Error●0.00153.0●●●●●●●●203040indexРис.
5.12. Сравнение для оценки сигнала S(1) методом MGN при красном шуме, 1 = 0.9c (A) = 3.3 (Б) = 0.1.5.3. Применение модифицированного методаГаусса-Ньютона к данным экспрессии геновВ [62] построена модель экспрессии ряда генов, в которой можно выделитьпараметры, не зависящие от настроек микроскопа. Оценивание этих параметров позволяет описать динамику развития эмбриона в терминах активностирассматриваемых генов. Используемая модель сигнала соответствует ряду конечного ранга.
Поэтому в этом разделе мы применим методы из раздела 3.3 кданным экспрессии генов, чтобы оценить сигнал и параметры. Полученные вразделе 2.5 теоретические результаты позволяют предположить, что полученные оценки будут более точными.Исходные данные представляют из себя трёхмерные сканы эмбрионов дрозофилы (Drosophila), в каждой точке которых интенсивность свечения пропорциональна концентрации мРНК гена bicoid (bcd ). Измерения проводились втечение трёх стадий развития: Cleavage, nc10-13 и nc14, соответственно, данныеразбиты по этим трём группам. Трёхмерные координаты следующие: с головы132к хвосту эмбриона (AP), сверху вниз (DV) и изнутри к наружи (basal-apical,BA).
Для каждого скана из исходных трёхмерных данных с помощью проекции на равномерную решётку по оси AP и оставления точек от 10 % до 90 % отдлины эмбриона были получены два одномерных профиля — наружный (apical)и внутренний (basal). Подробное описание процесса сбора данных и построенияпрофилей не является целью этого раздела, см. [62], где данный вопрос подробно разобран.5.3.1. Модель данныхВ [62] рассматривается следующая модель зависимости концентрации мРНКbcd () в зависимости от AP координаты :() = anterior anterior + shallow shallow ,(5.2)таким образом, модель из себя представляет сумму двух экспонент. Две компоненты в модели — это anterior (головная компонента, соответствующая резкозатухающему паттерну в начале профиля), для которой anterior < 1, и shallow(пологая компонента), для которой может быть как shallow < 1 (затухание),так и shallow > 1 (рост).