Автореферат (1150842), страница 2
Текст из файла (страница 2)
Такое приближение может быть получено с помощью непараметрического метода.Все исследуемые в данной работе методы оптимизации являются детерминированными, однако, развитие детерминированных методов способноулучшить и качество методов случайного поиска. В частности, метод Кэдзоуиспользуется на одном из шагов в предложенном в статье [14] методе стохастической оптимизации.Цели и задачи диссертационной работы: Основными целями являются:1. Разработка и эффективная реализация модифицированного численного метода Гаусса-Ньютона решения задачи HSLRA (3), обладающегобольшей устойчивостью, чем метод Variable projection [13], сравнениеметодов по виду итерации, временной сложности и устойчивости.2.
Постановка задачи поиска матриц весов L и R для метода Кэдзоу длясоответствия задач HSLRA в векторном (3) и матричном (4) виде, теоретическое обоснование и разработка эффективных численных методовеё решения.3. Построение быстрой реализации метода Кэдзоу для случая недиаго7нальных матриц весов L и R.4. Исследование асимптотических по соотношению сигнал/шум ошибокпервого порядка для полученных методами оценок сигнала.Научная новизна.
Все результаты, выносимые на защиту, являютсяновыми.Теоретическая и практическая значимость. Результаты, полученные в данной работе, позволяют улучшить точность решения задачи HSLRAи расширить область применения методов к случаю недиагональной матрицы весов W. Полученные теоретические результаты могут послужить основой для дальнейшего исследования в области структурной аппроксимации.С помощью численных экспериментов было показано, что реализованные алгоритмы могут успешно применяться для решения задачи HSLRA.Методы исследования. В работе применяются методы линейной алгебры, теория гладких многообразий, теория численных методов оптимизации и решения систем линейных алгебраических уравнений (СЛАУ), теориявероятностей, математическая статистика и функциональный анализ.
Дляреализации алгоритмов использовались языки программирования R и C.Положения, выносимые на защиту:1. Для множества временных рядов ранга найдены гладкая параметризация и вид касательного подпространства, необходимые для построения методов локальной оптимизации.2. Разработан метод вычисления базисов подпространств временных рядов ранга , теоретически обоснована его корректность и устойчивость,создана устойчивая реализация.3.
На основе предложенной параметризации и алгоритма вычисления базисов разработан и эффективно реализован модифицированный методГаусса-Ньютона. Доказано, что алгоритм превосходит метод Variableprojection [13] по скорости в случае ленточной матрицы весов W и поточности на полиномиальных сигналах.4. Сформулирована задача поиска весов L, R для соответствия задач (3)и (4), теоретически обоснована её постановка, построен и реализован алгоритм решения с помощью метода квадратичного программирования.5.
Построена быстрая реализация метода Кэдзоу в случае недиагональныхматриц весов L и R.6. Найдены виды асимптотических ошибок первого порядка для оценоксигнала с помощью проекции на множество и с помощью линеаризованного алгоритма Кэдзоу, получен результат про соотношение сграницей Рао-Крамера.8Апробация результатов. Основные результаты обсуждались на семинарах кафедры статистического моделирования СПбГУ, семинаре кафедрыстатистики в School of Mathematics, Cardiff University (Великобритания, июнь2017) и на международной конференции «Идентификация систем и задачиуправления» SICPRO’15 (Москва, 26–29 января 2015 г.). Часть результатовдиссертации была получена в ходе работ по гранту РФФИ (проект РФФИ16-04-00821).Публикации. По теме диссертационной работы опубликована работа[1] в научном издании, включенном в Перечень рецензируемых научных изданий, рекомендуемых ВАК.
Работа [2] опубликована в научном издании,входящем в базы цитирования Web of Science и Scopus. Работа [1], в которой построена формулировка задачи поиска весов для задачи HSLRA, доказаны теоремы 1 и 2 об эквивалентных формулировках задач квадратичногопрограммирования, построен алгоритм быстрого поиска весов, полностью выполнена соискателем. В работах [2–4] постановка задачи, структура работыи введение принадлежат научному руководителю, основной текст написансовместно, а основные результаты получены соискателем.
В частности, в работе [2] соискателю принадлежат основные теоретические результаты, в томчисле теорема 1 о сходимости метода Кэдзоу по подпоследовательностям, атакже проведено численное моделирование оценки сигнала с помощью метода Кэдзоу. В [3] теоремы 2.1, 2.3 и 2.4 о параметризации множества рядовконечного ранга и вида его касательного подпространства, а также алгоритм5.5 модифицированного метода Гаусса-Ньютона принадлежат соискателю.Личный вклад автора. Все представленные в диссертации результатыполучены лично автором.Структура и объем диссертации. Диссертация состоит из введения,пяти глав, заключения и библиографии.
Общий объём диссертации составляет 151 страницу. В тексте содержится 4 таблицы и 21 рисунок. Библиографияработы состоит из 67 наименований.Содержание работыВ первой главе приведён обзор существующих методов и свойств решения задачи (3) аппроксимации временного ряда рядом конечного ранга.Описаны следующие понятия: принцип Variable projection [13], метод Activeset решения задачи квадратичного программирования, известные свойствамножества временных рядов ранга , устанавливающие независимостьопределения временного ряда ранга от длины окна.9Приведены понятия, использующиеся в дальнейшем.
Будем говорить,что временной ряд управляется обобщённой линейной рекуррентной формулой (ОЛРФ) порядка , если T +1 (S) = 0 для некоторого ∈ R+1 , ̸= 0.Ключевая разница между ОЛРФ и обычной линейной рекуррентной формулой вида∑︁ − , ̸= 0, = 1, . . . − ==1состоит в том, что последний коэффициент ОЛРФ не обязательно ненулевой.Идея использовать произвольный ненулевой вектор для задания линейногосоотношения, которому удовлетворяет временной ряд, используется в работах[12, 13].Для пространства временных рядов, управляемых ОЛРФ(), вводится обозначение () = (). Введён оператор Q, : R+1 → R ×( −) ,определённый как Q, () = [1 : .
. . : ], где = (1 , . . . , +1 )T ∈R+1 , 1 = (1 , . . . , +1 , 0, . . . , 0)T , 2 = (0, 1 , . . . , +1 , 0, . . . , 0)T , . . . , =(0, . . . , 0, 1 , . . . , +1 )T . Тогда () можно представить как () = {S :QT ()S = 0}, где Q = Q, . Под Z() будем понимать некоторую матрицу, столбцы которой составляют базис ().Указан вид итерации взвешенного метода Гаусса-Ньютона для задачивзвешенного метода наименьших квадратов вида arg min ‖ − ( )‖2W , где ∈ R — вектор параметров, : R → R — дифференцируемая по функция, W ∈ R × — симметричная положительно определённая матрицавесов.Одна итерация алгоритма Гаусса-Ньютона с шагом выглядит следующим образом:+1 = + (J ( ))+(5)W ( − ( )),T−1 Tгде J ( ) — матрица Якоби вектор-функции ( ), (F)+W = (F WF) F W— взвешенная псевдообратная матрица к F.
Указана возможность модифицировать алгоритм Гаусса-Ньютона путём замены точки ( ) на более близкую к .Приведен метод итераций Кэдзоу [5] — численный метод решения задачиHSLRA (3) в матричном виде (4):X0 = X,X+1 = Πℋ Πℳ X , ≥ 0,где Πℋ и Πℳ — проекторы на соответствующие множества по норме ‖ · ‖L,R .Указаны известные свойства метода Кэдзоу.Вторая глава посвящена свойствам задачи (3). Построена параметризация множества , необходимая для использования методов локальной оп10тимизации. Рассмотрим временной ряд S0 ∈ , управляемый минимальной(0)(0)ОЛРФ(0 ) порядка , заданной ненулевым вектором 0 = (1 , . .
. , +1 )T .(0)Рассмотрим индекс такой, что = −1. Если ОЛРФ(0 ) ненулевая, топеренормировкой вектора 0 такой индекс всегда можно найти.Вместо значений в начале временного ряда, которые рассматриваютсяв случае обычной ЛРФ, мы рассмотрим − 1 значений в начале, и + 1 − значений в конце ряда. Определим ℐ( ) = {1, . . . , }∖{, . . . , − −1+ } и( ) = {1, . . . , + 1} ∖ { } — два множества индексов размера . Множествоℐ( ) содержит индексы элементов временного ряда (назовём их краевымизначениями), которых достаточно для того, чтобы найти все элементы рядапри помощи ОЛРФ() (или, если точнее, с помощью элементов с индексамииз ( ), = (1 , .
. . , +1 )T ).Обозначим вектор, состоящий из элементов вектора с номерамииз .Теорема 1. Пусть S0 ∈ — временной ряд, управляемый ОЛРФ(0 ), где(0)0 ∈ R+1 , = −1. Между окрестностью точки ((S0 )ℐ( ) , (0 )( ) )T ∈ R2и пересечением окрестности точки S0 со множеством единственнымобразом определено взаимно-однозначное отображение S : R2 → , которое строит по вектору параметров (( ) , ( ) )T ряд S и удовлетворяет следующим условиям для S = S(( ) , ( ) ): (S)ℐ( ) = ( ) , S ∈ и управляетсяОЛРФ() такой, что ( ) = ( ) и = −1.Теорема 2. Пусть S0 ∈ — временной ряд, управляемый ОЛРФ(0 ), где(0) = −1.