Диссертация (1150919), страница 3
Текст из файла (страница 3)
Кроме того, для полученияоптимальной оценки по фильтру Калмана требуется выполнение предпо12ложения о случайности шумов (помех в наблюдениях). В литературе приограниченных, а в остальном произвольных помехах активно исследуются методы поисковой стохастической аппроксимации и линейных матричных неравенств. Подраздел 1.1.2 посвящен описанию как существующихдостижений в области оценивания неизвестных параметров системы наоснове алгоритмов стохастической аппроксимации, так и текущих тенденций в развитии этих методов. В подразделе 1.1.3 приводятся основныепонятия и свойства техники линейных матричных неравенств, описывается задача фильтрации в дискретном случае и приводится теорема обоптимальном фильтре, далее вводится понятие аналитического централинейного матричного неравенства, на идее которого строится решениезадачи оптимизации распределения объектов между наблюдателями вовторой главе диссертации.
Подраздел заканчивается обсуждением возможностей применения l1 -оптимизации для получения субоптимальногоразреженного решения в сложных переборных задачах. В разделе 1.2описываются особенности построения систем на основе мультиагентногоподхода. В разделе 1.3 рассматривается пример практического приложения.Во второй главе уточняется постановка задачи оценивания параметров движения объектов группой наблюдетелей, формулируются идоказываются основные результаты диссертационного исследования. Вподразделе 2.1.1 вводится конкретная модель наблюдений (измерений),далее в подразделе 2.1.2 формулируется задача оптимизации нестационарного функционала среднего риска при линейных ограничениях, которая распространяется на случай распределенной оптимизации в подразделе 2.1.3.
Кроме того, в подраделе 2.1.3 приводятся ограничения нафункционирование сети наблюдателей, которые мотивированы с практической стороны. В подразделе 2.1.4 вводится понятие доверительногоэллипсоида и рассматриваются его свойства применительно к решаемойзадаче, формулируется функционал качества, учитывающий введенныеограничения на функционирование сети. Раздел 2.2 посвящен решениюзадачи оптимизации распределения объектов между наблюдателями с13применением техники линейных матричных неравенств, формулируетсяТеорема 2, обосновывающая получаемое решение.
В разделе 2.3 рассматривается модификация поискового алгоритма стохастической аппроксимации с постоянным размером шага и линейными ограничениями на основе циклического подхода, формулируются основные предположенияи доказывается Теорема 3, отражающая среднеквадратическое качествооценок, получаемых по предложенному алгоритму. В разделе 2.4 предлагается метод управления группами наблюдателей с использованиеммультиагентного оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастической аппроксимации,состоящий из двух этапов: сначала производится распределение объектов между наблюдателями с применением техники линейных матричных неравенств, далее предполагается, что полученное решение остаетсянеизменным на некотором временном интервале (не очень малом), т.
е.достаточно долго субоптимальная структура остается неизменной, привыполнении этого предположения второй этап заключается в применении алгоритма циклической стохастической аппроксимации, для которого формулируется и доказывается Теорема 4.В третьей главе приводятся результаты имитационного моделирования, иллюстрирующие работу предложенных методов и подходов. Вразделе 3.1 описываются используемые при имитационном моделировании модели движения объектов наблюдения. В разделе 3.2 приводятсярезультаты решения модельной задачи оптимизации распределения объектов между наблюдателями, на основе метода из раздела 2.2, а такжеобсуждается их возможное дальнейшее применение при решении задачиоценивания траекторий.
В разделе 3.3 демонстрируются результаты применения алгоритма циклической поисковой стохастической аппроксимации для оценивания траекторий движущихся объектов при различныхзначениях ограничений на функционирование сети наблюдателей.В заключении формулируются основные результаты диссертации.14Глава 1Оценивание параметровдвижения объектов наоснове мультиагентногоподходаЗадача оценивания параметров движения объектов встечается повсеместно: геоинформационные системы, видеоаналитика, беспилотныесистемы, мониторинг области интереса, управление воздушным движением и др. Использование групп наблюдателей в задаче отслеживанияобъектов обеспечивает больше преимуществ по сравнению с применением одного из них.
В частности, из-за воздействия окружающей средыи неточностей измерительных компонентов каждый наблюдатель получает зашумленные наблюдения (измерения). Благодаря использованиюнескольких наблюдателей можно получить более точную оценку измеренного значения посредством совместного учета полученных данных измерений. Другими словами, группы наблюдателей могут использоватьсядля уменьшения неопределенностей в наблюдениях за объектами.Группа наблюдателей фактически является сетью наблюдателей (сенсорной сетью), состоящей из устройств, способных реагировать на изменения во внешней среде, самостроятельно обрабатывать данные и коммуницировать с другими устройствами.
При этом сенсорные сети довольно15часто применяются в системах отслеживания [108]. В общем случае, сенсорные сети оценивают состояние некоторого динамического процессапосредством коммуникаций между узлами в сети.Существует три вида организационных схем сетей наблюдателей (сенсорных сетей): централизованная, распределенная и гибридная. Централизованные системы позволяют получить самую точную оценку, поскольку им доступны все или почти все получаемые сетевыми узлами измерения. Распределенные системы обладают такими свойствами, как лучшаяотказоустойчивость и масштабируемость, а также имеют меньшие требования к пропускной способности сети по сравнению с централизованными.
Гибридные системы обеспечивают компромисс между свойствами централизованных и распределенных систем. В таких системах можно комбинировать распределенную стратегию управления с локальнымицентрами совместной обработки информации.Далее будет рассмотрена проблема фильтрации, то есть оценки состояния неизвестных параметров системы по имеющимся измерениям(наблюдениям), получаемым узлами сенсорной сети (наблюдателями),когда измерения содержат помехи. В-общем случае, системы слеженияполагаются на фильтр Калмана, который является одним из наиболеераспространенных алгоритмов для решения задач фильтрации.
Тем неменее, когда система отслеживания должна сопровождать большое количество объектов, возникают значительные вычислительные и коммуникационные нагрузки. В диссертационной работе исследуются различныеподходы для решения этой проблемы. В следующем разделе приводитсяобщая постановка задачи, мотивирующая переход к решению проблемыоптимизации ресурсов каждого из наблюдателей, выполняющих задачу отслеживания траекторий движения группы объектов.
После этогорассматриваются подходы, основанные на фильтрации Калмана, поисковой стохастической аппроксимации и линейных матричных неравенствах. Далее описываются преимущества замены централизованного отслеживания на подход, основанный на мультиагентных технологиях. Завершает раздел пример практического приложения для задачи коллек16тивного поведения групп наблюдателей при их движении в неизвестнойвнешней среде.1.1Оценивание параметров движенияобъектов на основе последовательностинаблюденийРассмотрим общую постановку задачи и обозначим свойственные ейпроблемы. Будем считать, что в зоне видимости n сенсоров (наблюдателей) находятся m объектов (см. Рис. 1.1). Необходимо распределитьобъекты между сенсорами таким образом, чтобы можно было достаточно точно предсказать траектории движения объектов при условии одновременной минимизации загруженности каждого сенсора и затрат напередачу сообщений между сенсорами.Рис.
1.1: Наблюдение за движущимися объектами.Пусть M = {1, 2, . . . , m} — множество объектов (целей), {xit }t=0,1,2,... ,xit ∈ Rp , i ∈ M — траектория i-го объекта, которая подчиняется некоторому стационарному закону(1.1)ixit+1 = Ai xit + wt+1,17в котором {wti } — независимое центрированное одинаково распределенное возмущение с ограниченной дисперсией (ковариацией) типа белогошума : Ewti = 0, Ewti (wti )T = Riw 4 σw2 Ik .
Здесь и далее предполагаем,что задано вероятностное пространство {Ω, P, F}, а также вводятся следующие обозначения: E — символ математического ожидания, Ik — единичная матрица размерности k × k, у которой на диагонали единицы, аостальные элементы — нули, 4 — нестрогое неравенство для симметричных матриц, понимаемое в смысле квадратичных форм, верхние индексыявляются номерами, если они имеют отличное от числового значение.Множество N = {1, 2, .
. . , n} — набор наблюдателей (сенсоров), yti,j ∈Rd , i ∈ M, j ∈ N — доступные j-му сенсору в момент времени t наблюдения о i-ом объекте(1.2)yti,j = Bj xit + vti,jc помехами vti,j : Evti,j = 0, Evti,j (vti,j )T = Qi,jt . Сенсоры могут хранить усебя в памяти в том числе и предшествующие l наблюдений в моментывремени t − 1, t − 2, . . . , t − l.Обозначим Mti ⊂ N — подмножество сенсоров, которые в моментвремени t “следят” за объектом i ∈ M , mj ({Mti }) — количество групп Mti ,в которые входит сенсор j ∈ N , costs (mj ) — стоимость использованияодного сенсора в mj группах Mti .Будем считать, что для любого Mti определена некоторая функцияi,jϕ(Mti ), которая по набору наблюдений {yt−k}j∈Mti ,k=0,1,...,l строит оценкуxbit+1 точки xit+1 траектории i-го объекта:xbit+1 = ϕ(Mti ),при этом затраты на коммуникации между сенсорами равныcit = costc · l · |Mti |,18где costc > 0 — стоимость пересылки одного сообщения между сенсорами, l — “глубина” памяти, а |Mti | — мощность (число элементов) множества Mti .Требуется в каждый момент времени t минимизировать среднеквадратический функционал качества(1.3)Φt ({Mti })=Xjcosts (m({Mti }))+XEkxit+1 − xbit+1 k2 +i∈Mj∈N+costc · l · |Mti | → min.i{Mt }Наряду с задачей о прогнозе рассматриваются и собственно задачифильтрации(1.4)Φ̄t ({Mti }) =Xcosts (mj ({Mti })) +j∈NXEkxit − xbit k2 +i∈M+costc · l · |Mti | → min,i{Mt }в которых функция ϕ(Mti ) может быть легко переопределена соответствующим образом.При распределении объектов наблюдения между наблюдателями (сенсорами) задача оценивания в общем виде получается избыточной.
Длятого, чтобы при оценивании состояний объектов наблюдения участвовали не все сенсоры, а только те, которые дают наиболее значимый совместный эффект (из группы всегда можно исключить те сенсоры, которыедублируют информацию, например, расположены близко друг к другу)могут использоваться “разреженные стратегии” распределения объектовслежения между сенсорами, которые позволяют учитывать практические ограничения по количеству сенсоров в группе и по количеству информации, передаваемой между сенсорами в группе.191.1.1Калмановская фильтрацияЕсли считать, что с ростом времени “глубина” памяти у сенсоров становится неограниченной, то при сделанных предположениях для любойиз целей i ∈ N при заданном наборе сенсоров Mti ⊂ N оптимальнаяфункция ϕ(Mti ) задается фильтром Р. Э. Калмана [66].