Диссертация (1150919), страница 2
Текст из файла (страница 2)
В таких задачах отслеживания изменений параметров часто используют достаточно малый, но постоянный размер шага. Д. П.Деревицкий и А. Л. Фрадков в [15, 16] при анализе динамики алгоритмов адаптации, основанном на построении приближенных усредненныхмоделей, обосновали возможность использования алгоритмов стохастической аппроксимации с неубывающим до нуля размером шага. Позжеисследование оптимизации нестационарных функционалов рассматривалось в работах Н. О. Амелиной [39, 55], Н.
О. Граничина [7, 8, 55], Дж. С.Спалла (J. C. Spall) [114], В. С. Боркара (V. S. Borkar) [40].В ряде работ сокращение сложности трудоемких переборных задач,которой является оптимизации разделения наблюдателей на подгруппы,предложено построение субоптимального разреженного решения. Новыйматематический аппарат, связанный с так называемыми матричными линейными неравенствами (англ.
Linear Matrix Inequality, LMI), возник в60-е годы в теории управления и описывался в работах В. А. Якубовича [36, 37]. Позже оказалось, что линейные матричные неравенства7представляют собой очень общий метод анализа и синтеза линейныхсистем, детально описанный в работах С. Бойда (S. Boyd) с соавторами [45, 46]. Появление эффективных программ решения линейных матичных неравенств сделало этот аппарат весьма эффективным с вычислительной точки зрения.
Дальнейшее развитие теория анализа системна основе матричных линейных неравенств получила в работах Дж. Калафиоре (G. Calafiore) [49], Б. Т. Поляка [22, 27–31, 49, 85], П. С. Щербакова [27–31, 85], М. В. Хлебникова [22, 29–31, 85], Д. В. Баландина [4, 5],М. М. Когана [4, 5] и др.Обозначенные проблемы и тенденции подтверждают актуальностьтемы диссертационного исследования.Цель работы — разработка алгоритмов коллективного поведения группнаблюдателей при движении и распределении объектов слежения в условиях наличия неопределенностей внешней среды, получения измеренийс помехами и изменения состояния наблюдаемых объектов. Для достижения этой цели были поставлены и решены следующие задачи:1) исследовать возможность оптимизации распределения целей между наблюдателями на основе мультиагентного подхода;2) исследовать свойства оценок циклического алгоритма поисковойстохастической аппроксимации для отслеживания изменений неизвестных параметров системы;3) исследовать возможность применимости циклического алгоритмапоисковой стохастической аппроксимации для мультиагентного оценивания состояний движущихся объектов на основе измерений, получаемых группой наблюдателей.Методы исследования.
В диссертации используются методы теорий оценивания, оптимизации, управления, графов, вероятностей и математической статистики; применяются методы стохастической аппроксимации,8рандомизированные алгоритмы, линейные матричные неравенства, имитационное моделирование.Основные результаты. В ходе выполнения работы получены следующиенаучные результаты:1) предложен и обоснован метод оптимизации распределения объектов слежения между наблюдателями, основанный на решении системы линейных матричных неравенств и позволяющий использовать мультиагентный подход в процессе наблюдения;2) предложено обобщение метода циклической поисковой стохастической аппроксимации для отслеживания изменений неизвестных параметров системы на случай оптимизации нестационарного функционала, получена асимптотическая верхняя граница среднеквадратической невязки оценок предложенного метода;3) разработан метод управления группами наблюдателей с использованием мультиагентного оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастическойаппроксимации, получена асимптотическая верхняя граница среднеквадратической невязки оценок для распределенного циклического алгоритма.Научная новизна.
Все основные научные результаты диссертации являются новыми.Теоретическая ценность и практическая значимость. Теоретическаяценность результатов заключается в разработке и обосновании методаоптимизации распределения объектов слежения между наблюдателями,основанного на решении системы линейных матричных неравенств и позволяющего использовать мультиагентный подход в процессе наблюдения; в обобщении метода циклической поисковой стохастической аппроксимации для отслеживания изменений неизвестных параметров системына случай оптимизации нестационарного функционала среднего риска,9установлении условий его работоспособности.
Методы оптимизации распределения объектов слежения между наблюдателями и циклическойстохастической аппроксимации легли в основу предложенного методауправления группами наблюдателей с использованием мультиагентного оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастической аппроксимации, для которогопри определенных условиях получены среднеквадратические оценки качества.Предложенные методы и подходы могут использоваться при решения ряда практических задач.
В частности, для отслеживания перемещения объектов в космическом пространстве распределенной сетью малых спутников, исследования перемещений животных в заповедниках спомощью беспилотных летательных аппаратов, мониторинга окружающей обстановки при движении автономных беспилотных автомобилей спомощью группы установленных на них сенсоров и др.Апробация работы. Результаты диссертации докладывались на семинарах кафедр системного программирования и теоретической кибернетики математико-механического факультета СПбГУ, на конференции IFACConference on Modelling, Identification and Control of Nonlinear Systems(MICNON’15) (June 24–26, 2015, Saint Petersburg, Russia), на Восьмойтрадиционной всероссийской молодежной летней школе «Управление,информация и оптимизация» (пос.
Репино, г. Санкт-Петербург, Россия,14–19 июня, 2016), на конференциях Workshop on Quantum Informaticsand Applications in Economics and Finance (December, 22, InternationalResearch Laboratory (Fin Q Lab) University ITMO, St. Petersburg, Russia),Суперкомпьютерные дни в России (Москва, Россия, 26–27 сентября, 2016),International Symposium of New Techniques in Medical Diagnosis and Treatment (June 1–3, 2017, Wuhan, China), на конференции молодых ученых«Навигация и управление движением» (Санкт-Петербург, Россия, 14–17марта, 2017).Результаты диссертации были использованы в работах по грантам10ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы»6.56.1224.2014 «Разработка мультиагентной технологии управления распределенными гетерогенными вычислительными ресурсами для адаптивной балансировки загрузки устройств в реальном времени при решении комплексных вычислительных задач», РФФИ 16-07-00890 «Рандомизированные алгоритмы в автоматическом управлении и при извлечениизнаний», РФФИ 17-51-53053 «Разработка методов получения суперразрешения цифровых моделей поверхности на основе сверточных нейронныхсетей», РНФ 16-19-00057 «Адаптивное управление с прогнозирующимимоделями при переменной структуре пространства состояний с приложением к системам сетевого управления движением и автоматизации медицинского оборудования».
Проект «Разработка программно-аппаратногокомплекса для согласованного сетевого управления самоорганизующейся группой беспилотных летательных аппаратов», включающий результаты исследования, отмечен дипломом победителя молодежного научноинновационного конкурса (УМНИК-2016). Проект «Разработка адаптивного децентрализованного алгоритма планирования маршрута группойбеспилотных летательных аппаратов при выполнении задач мониторинга» в 2017 году отмечен дипломом победителя конкурса для студентов иаспирантов вузов, отраслевых академических институтов, расположенных на территории Санкт-Петербурга.Публикация результатов. Основные результаты исследований отражены в работах [3,17–21,38,52].
Соискателем опубликовано 8 научных работ,из которых одна опубликована в издании, индексируемом в базе данныхScopus, и одна в журнале, входящем в перечень рецензируемых научныхжурналов, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук.Работы [3, 17, 38, 52] написаны в соавторстве. В работе [17] В. А.Ерофеевой принадлежит доказательство теоремы и результаты имитационного моделирования, соавторам — общая постановка задачи, выборметодов решения.
В [38] В. А. Ерофеевой принадлежит модификация11протокола локального голосования для задачи управления движениемгруппы динамических объектов (роботов, агентов), соавторам — общаяпостановка задачи, выбор методов решения. В [52] В. А. Ерофеевой принадлежит описание подхода к управлению движением группы роботовв динамической среде, результаты имитационного моделирования, соавторам — общая постановка задачи, выбор методов решения.
В [3] В. А.Ерофеевой принадлежит общая постановка задачи, анализ методов машинного обучения, результаты экспериментов, соавторам – архитектурапрограммного обеспечения.Структура и объем диссертации. Диссертация состоит из введения,трех глав, заключения, списка литературы, включающего 115 источников. Текст занимает 86 страниц, содержит 8 рисунков и 2 таблицы.Краткое содержание работыВо введении обосновывается актуальность диссертационной работы,формулируется цель, ставятся задачи исследования и кратко излагаютсяосновные результаты.В первой главе приводится описание проблемы оценивания параметров движения объектов, сопровождаемое обзором литературы по теме исследования. В разделе 1.1 ставится задача оценивания параметров движения объектов по последовательности наблюдений и отмечается, что при увеличении общего количества наблюдателей и количестваподзадач проблема оптимизации подобного рода в общем виде переходитв класс трудоемких переборных задач.
Далее следуют три подраздела, вкоторых описываются методы из теории оценивания и управления, которые могут быть применены для решения поставленной задачи. В подразделе 1.1.1 описывается ставший уже классическим подход на основеприменения фильтра Калмана. Там же отмечается, что при увеличенииколичества наблюдателей и объектов отслеживания использование Калмановской фильтрации приводит к повышению требований к вычислительным ресурсам отслеживающей системы.