Диссертация (1150844), страница 20
Текст из файла (страница 20)
Подзадача (3) решалась при помощи комбинации метода Cadzow(box) с = /2 и = 0.3, см.раздел 4.6.1 для выбора начальных значений для параметров сигнала, и предложенного модифицированного метода Гаусса-Ньютона MGN, см. раздел 3.3.5.Результат представлен на рисунке 5.17. Выбор параметров алгоритма Кэдзоуобъясняется тем, что при меньших или итерации алгоритма Кэдзоу (4.1)испытывали неустойчивость.Итоговые коэффициенты параметра авторегрессии: * = (1.06264930,140300020001000USUnemployment, MALE4000Signal estimateSeries0100200300400IndexРис. 5.17. Ряд US Unemployment, male и оценка его сигнала алгоритмом 5.4.1.0.02823641, −0.200730)T ; управляющая сигналом ОЛРФ(* ): * = (−0.009937,0.058891, −0.155361, 0.25028, −0.297177, 0.307467, −0.308517, 0.306784,−0.301952, 0.29789, −0.297655, 0.301633, −0.296959, 0.250715, −0.154484,0.0578269, −0.009613)T .Далее, у оценки сигнала были найдены сигнальные корни, было найденопредставление ряда вида (1) с точностью до коэффициентов полиномов (),а затем их коэффициенты найдены с помощью метода наименьших квадратов[8].
Сигнал представим в виде суммы сезонной компоненты (периодическойчасти, состоящей из слабо модулированных синусоид с периодами 3.996 ≈ 4,2.396 ≈ 2.4, 5.995 ≈ 6, 11.982 ≈ 12, 2.997 ≈ 3) и медленно меняющегося тренда(сумма двух растущих экспоненциальных сигналов и синусоид с большими периодами 51.695 и 182.413).
Соответственно, исходный ряд мы представим каксумму сезонной компоненты, тренда и шума (то есть разности ряда и оценкисигнала). Результат такого разложения представлен на рисунке 5.18.141Trend part1000200030004000Trend estimateSeries0100200300400300400300400Index−2000200400Periodic part0100200Index−50005001000Noise part0100200IndexРис.
5.18. Представление исходного ряда US Unemployment, male в виде суммы тренда, сезонной компоненты и шума.142Для того чтобы проверить корректность разложения, нужно удостовериться, что шум приближённо удовлетворяет модели гетероскедастичного процессаавторегрессии. Для этого был вычислен вектор остатков (то есть C(X − Y* ), гдеCT C = D−1 Σ−1 ( * , 1)D−1 = W — разложение Холецкого), который долженприближённо представлять из себя вектор белого шума. Для него была вычислена периодограмма и оценка автокорелляционной функции, результаты представлены на рисунке 5.19.
Отсутствие острых пиков и сильной закоррелированности подтверждают адекватность представленного разложения. Более того,вектор остатков был проверен с помощью теста на белый шум, предложенныйв [67] (метод whitenoise.test в пакете normwhn.test языка R). Полученноеp-value равно 0.3947.1430.0100.000spectrum0.020Series: residualsRaw Periodogram0.00.10.20.30.40.5frequencybandwidth = 0.0006680.4−0.20.00.2ACF0.60.81.0Series residuals0510152025LagРис. 5.19. Периодограмма и оценка автокорелляционной функции остатка.144ЗаключениеВ данной работе рассматривались два подхода к решению задачи Hankelstructured low-rank approximation (HSLRA) (3) — параметрический и непараметрический.
В рамках параметрического подхода была предложена модификацияметода Гаусса-Ньютона (MGN, алгоритм 3.3.5) для численного решения задачи(3). Было произведено сравнение с одним из лучших на данный момент алгоритмов локального поиска, основанном на принципе Variable projection (VPGN,алгоритм 3.3.4). Показано, что предложенный алгоритм MGN допускает болееустойчивую реализацию в случае сигналов, управляемых ОЛРФ с кратнымикорнями у характеристического многочлена (в частном случае, для полиномиальных сигналов), см. раздел 5.1.2 и замечание 3.3.2. Сравнение по вычислительной сложности в разделе 3.3.5 показывает, что для случая матрицы весовW = Σ−1 , соответствующей процессу авторегрессии, предложенный алгоритмMGN имеет существенно более низкую вычислительную сложность, чем VPGN,а в случае (2 + 1)-диагональной матрицы весов W−1 предложенный метод обладает лишь немного большей вычислительной сложностью.В рамках непараметрического подхода для решении задачи (4) был рассмотрен метод Кэдзоу, входящий в класс алгоритмов попеременных проекций(Alternating Projections).
Был рассмотрен вопрос соотношения задач (3) и (4)для (2 + 1)-диагональной матрицы весов W, соответствующей авторегрессионному шуму порядка . Были сформулированы задачи поиска необходимыхматриц весов L, R (4.7) и (4.8) для приближенного соответствия задач (3) и(4), доказана их эквивалентность в широком классе случаев (теорема 4.2.2) ипостроены численные методы их решения в разделах 4.3 и 4.4. В разделе 4.5известная быстрая реализация метода Кэдзоу расширена на случай ленточныхматриц весов L и R. Реализация алгоритма Кэдзоу и корректность формулировки задачи поиска весов (4.7) были проверены с помощью численного мо145делирования в разделе 5.2.1.
Было показано, что при помощи рассмотренныхметодов можно уменьшить среднеквадратичную ошибку оценивания сигналапо сравнению со стандартным методом Кэдзоу. Более того, было показано, чтометод Кэдзоу представляет хорошее начальное приближение для метода MGN.Полученные асимптотические по соотношению сигнал/шум ошибки первого порядка для оценок сигнала с помощью проекции на множество рядовранга (раздел 2.5) и с помощью линеаризованного алгоритма Кэдзоу (раздел4.7) подтверждены с помощью статистического моделирования, представленного в разделе 5.2.
Было показано, что при увеличении соотношения сигнал/шумполученные ошибки первого порядка становятся ближе к реально наблюдаемымошибкам оценок.Полученные алгоритмы были успешно применены к данным экспрессиигенов (раздел 5.3), где с помощью предложенного метода MGN была повышена точность оценивания, и к временному ряду с неизвестной ковариационнойматрицей шума (раздел 5.4), где удалось построить модель вида «сигнал плюсшум» для сигнала большого ранга и сильного шума сложной формы.Предложенная теория основывается на исследованных в работе свойствахмножества рядов ранга , в частности, на виде его касательного многообразия (теорема 2.2.3).
Благодаря этому стало возможным построение алгоритмоввычисления базисов Z() и Z(2 ) пространств рядов, управляемых ОЛРФ()(алгоритм 3.2.1) и ОЛРФ(2 ) (алгоритм 3.2.2), используемых в модифицированном методе Гаусса-Ньютона MGN.Таким образом, в диссертации были предложены новые методы для решения широко используемых на практике задач оценки сигнала и его параметровв классе сигналов конечного ранга. Получено теоретическое обоснование методов и их свойств, построены эффективные (быстрые и устойчивые) реализации.Это позволяет существенно расширить круг решаемых проблем и улучшить точность их решения.146Список литературы1. Cadzow J. A.
Signal enhancement: a composite property mapping algorithm //IEEE Trans. Acoust. 1988. Vol. 36, no. 1. P. 49–62.2. Markovsky I. Structured low-rank approximation and its applications //Automatica. 2008. apr. Vol. 44, no. 4. P. 891–909.3. Dendrinos M., Bakamidis S., Carayannis G.
Speech enhancement from noise:A regenerative approach // Speech Communication. 1991. feb. Vol. 10, no. 1.P. 45–57.4. Roy R., Kailath T. ESPRIT-estimation of signal parameters via rotationalinvariance techniques // IEEE Transactions on acoustics, speech, and signalprocessing.
1989. Vol. 37, no. 7. P. 984–995.5. Golyandina N., Zhigljavsky A. Singular Spectrum Analysis for time series.Springer Science & Business Media, 2013.6. Rouquette S., Najim M. Estimation of frequencies and damping factors by twodimensional ESPRIT type methods // IEEE Transactions on signal processing.2001. Vol. 49, no. 1.
P. 237–245.7. Wang Y., Chen J.-W., Liu Z. Comments on “estimation of frequenciesand damping factors by two-dimensional ESPRIT type methods” // IEEEtransactions on signal processing. 2005. Vol. 53, no. 8. P. 3348–3349.8. Golyandina N., Nekrutkin V., Zhigljavsky A. Analysis of Time Series Structure:SSA and Related Techniques. Chapman&Hall/CRC, 2001.9. Alexandrov T., Golyandina N. Automatic extraction and forecast of timeseries cyclic components within the framework of SSA // Proc. of the 5th St.Petersburg Workshop on Simulation. 2005.
P. 45–50.10. Некруткин В. Аппроксимирующие пространства и продолжения временныхрядов // Статистические модели с приложениями в эконометрике и смежных областях/Под ред. П. ред. СМ Ермакова и ЮН Каштанова. СПб.: изд147во НИИХ СПбГУ. 1999. С. 2–32.11. Некруткин В. Разложения временных рядов // Главные компоненты временных рядов: метод «Гусеница»/под ред. ДЛ Данилова, АА Жиглявского.СПб.: Пресском.
1997. С. 194–227.12. Tufts D., Shah A. Estimation of a signal waveform from noisy data usinglow-rank approximation to a data matrix // IEEE Transactions on SignalProcessing. 1993. apr. Vol. 41, no. 4. P. 1716–1721.13. Markovsky I. Low Rank Approximation: Algorithms, Implementation,Applications (Communications and Control Engineering). Springer, 2011.14. Exact and approximate modeling of linear systems: A behavioral approach /Ivan Markovsky, Jan C Willems, Sabine Van Huffel, Bart De Moor. SIAM,2006. Vol. 11.15. Ottaviani G., Spaenlehauer P.-J., Sturmfels B. Exact solutions in structuredlow-rank approximation // SIAM Journal on Matrix Analysis and Applications.2014.
Vol. 35, no. 4. P. 1521–1542.16. Usevich K., Markovsky I. Structured low-rank approximation as a rationalfunction minimization // IFAC Proceedings Volumes. 2012. Vol. 45, no. 16.P. 722–727.17. Usevich K., Markovsky I. Variable projection for affinely structured low-rankapproximation in weighted 2-norms // Journal of Computational and AppliedMathematics. 2014. Vol. 272. P. 430–448.18.
Allen G. I., Grosenick L., Taylor J. A generalized least-square matrixdecomposition // Journal of the American Statistical Association. 2014. Vol.109, no. 505. P. 145–159.19. Broomhead D., King G. Extracting qualitative dynamics from experimentaldata // Physica D.
1986. Vol. 20. P. 217–236.20. Vautard M., Ghil M. Singular spectrum analysis in nonlinear dynamics, withapplications to paleoclimatic time series // Physica D. 1989. Vol. 35. P. 395–424.14821. Elsner J. B., Tsonis A. A. Singular Spectrum Analysis: A New Tool in TimeSeries Analysis. Plenum, 1996.22. Gillard J., Zhigljavsky A. Stochastic methods for Hankel structured low rank approximation // Proceedings of 21th International Symposium on MathematicalTheory of Networks and Systems. 2014. P. 961–964.23.