Диссертация (1150919), страница 10
Текст из файла (страница 10)
.. Рассмотрим цикл с номером T . По аналогии сдоказательством Теоремы 1 из [8] в силу выполнения предположений 1–7, учитывая вид алгоритма (2.24), получаем при любых u = 1, 2, . . . , kследующее соотношение:b2kT +2u − θ 2kT +2u ))k2 ≤EF2kT +2u−2 kh(A2kT +2u (θb2kT − θ 2kT +2u−2 ))k2 +≤ (1 − αm)kh(A2kT +2u (θb2kT − θ 2kT +2u−2 ))k + α¯l.+2αbkh(A2kT +2u (θПросуммировав левые и правые части последнего соотношения поu ∈ {1, .
. . , k} и усреднив их по отношению к σ-алгебре F2kT , учитываявид матриц A2kT +2u , получаемb2kT − A(λ)θ 2k(T +1)−2 )k2 +EF2kT νT2 +1 ≤ EF2kT (1 − αm)kh(θ√b2kT − A(λ)θ 2k(T +1)−2 )k + kα¯l,+2αb kkh(θb2k(T +1) − A(λ)θ 2k(T +1) )k.где обозначено νT +1 = kh(θ60Из неравенства треугольника и предположения 4 имеем оценкиb2kT − A(λ)θ 2k(T +1)−2 )k2 ≤ ν 2 + k 2 δ 2EF2kT kh(θTθиb2kT − A(λ)θ 2k(T +1)−2 )k ≤ νT + k 2 δθ ,EF2kT kh(θи, учитывая их, выводимEF2kT νT2 +1≤ (1 −αm)νT2√1−αm2δθ .+ 2αb kνT + kα ¯l + 2bk kδθ +α√С учетом введенных обозначений применение к последнему неравенству Леммы 3 завершает доказательство Теоремы 3.Далее рассмотрим применение полученного циклического алгоритма(2.24) к задаче отслеживания траекторий движущихся объектов группойнаблюдателей.2.4Мультиагентный алгоритм отслеживанияизменений параметров с применениемциклического подходаОбозначим через Dj подмножества индексов из D, соответствующиеномерам ненулевых компонент вектора θ j в θ.
Пусть у каждого наблюдателя j, j ∈ N, формируются данные о состояниях объектов из некоторого множества Dj при выполнении условий на разбиения:j(2.26)k[Iju = Dj ,Iju0\Iju00 = ∅ при u0 6= u00 .u=1Обозначим через Ajt соответствующие матрицы, разрежающие векторы θbt . Для рассмотренной постановки задачи сформулируем следующий61распределенный алгоритм.А л г о р и т моценивания).1. (Распределенный циклический алгоритмДля каждого сенсора j, j ∈ N , необходимо выполнить следующийпорядок действий.1. Инициализация и выбор коэффициентов.
Установить счетчик T j =bj ∈ Rd и достаточно малые αj > 0 и0. Выбрать начальное приближение θ0β j > 0. Задать максимально допустимые значения количества “соседей”njmax и объектов слежения mjmax . Сформировать такую последовательность матриц {Ajt }, чтобы удовлетворялись условия (2.8)–(2.9), (2.26).2. Итерация T j → T j + 1.а.
В соответствии с распределением Бернулли сгенерировать случайный вектор ∆jT j ∈ Rd из независимых компонент, равных ±1 с вероятностью 12 .б. Итерирование по циклу наблюдений для u = 1, 2, . . . , k j :б-1) t := 2T j + 2u;б-2) сформировать точку наблюдения xjt−1 с l-ми компонентами, равj,lj,lj,lj j,lными θb2Tj − β ∆T j , если at−1 > 0, и равными 0, если at−1 = 0;jб-3) получить измерения zi,jt−1 , i ∈ Mt−1 ;j,−б-4) вычислить эмпирическое значение функционала качества yt−1=ftj (xjt−1 ) по (2.10);б-5) сформировать точку наблюдения xjt с l-ми компонентами, равj,lj,lj j,lными θb2T> 0, и равными 0, если aj,lj + β ∆T j , если att = 0;jб-6) получить измерения zi,jt , i ∈ Mt ;б-7) вычислить эмпирическое значение функционала качества ytj,+ =ftj (xjt ) по (2.10);б-8) вычислить псевдоградиентb jt∇=j,+j j ytAt ∆T jj,−− yt−1;2β j62б-9) получить новую оценку:bj = θb j − αj ∇b jt .θtt−13.
Перейти на шаг 2a.О свойствах оценок, доставляемых Алгоритмом 1, сформулируем следующую теорему.Т е о р е м а 4. Если дрейф ограничен: krit − rit−1 k ≤ σri , i ∈ M ,выполнены условия (2.1) для модели наблюдений, (2.8)–(2.9) для последовательностей матриц {Bt }, {Ct }, {Ajt }, j ∈ N иjесли (µj )2 > 2γ j ;(0; µγ j ),√√α∈µj − (µj )2 −2γ jµj + (µj )2 −2γ j µj 0;∪; γ j , иначе,2γ j2γ jjb j }∞ , построенные по Алготогда последовательности оценок {θ2k T T =0ритму 1, при разбиении временной оси по (2.26) дает асимптотическую верхнюю границу среднеквадратической невязки: ∀εj > 0 ∃ t̄j :∀t > t̄j√ pqjjj2jjkb + (b ) + m lj2bEkh(θ t − A(λ)θ t )k ≤+ εj ,jmгде µj =K,2n maxi,t (σti,j )2K, γj2n mini,t (σti,j )2√jjMj == 3d2 (M j )2 , mj = 2(µj − αγ j ),Pδθj = k j maxi,t i∈Mtj δri , b = 2βM d d(1 + 6αM j d) + δθj (M j + 2µj +√PM4M4αKj 2 2 ¯j6α(M ) d ), l = 6d β maxt 2n · i∈Mtj (σi,j )4 + (σi,j )4 − 2 +2δθj (4βM j d d+tt−1√ 2 ji,jTr[Ξ]jjjj 2 jj22 KtM δθ + 3µ (δθ ) ) + 6d 2n maxi,t (σi,j )2 + (M ) (δθ + 2β d) , l = ¯lj +t√ j 1−αmj j2j jj2b k k δθ + α (δθ ) .Доказательство.
Для доказательства Теоремы 4 при введенных обозначениях достаточно убедиться в выполнении Предположений 1–7 Теоремы 3 для функций Ftj (Ajt x) и ftj (Ajt x). Для этого сначала вычислим ком63поненты градиента функции Ftj (Ajt x):∂∂jj∇F(Ax)=E∇ftj (Ajt x) =Fttt−1i,li,l∂x∂x= EFt−1XKi,li,j 2j 2n(σt )i∈Mti,li,l(x + ξ − r ) · 1 =KXi,j 2j 2n(σt )i∈Mtxi,l − ri,l .Из последней формулы видно, чтоПредположение 1 выполняется с µj =K,2n maxi,t (σti,j )2Предположение 2 выполняется с M j =K,2n mini,t (σti,j )2i,jt ]maxi,t T(σr[Ξi,j 2 .t )PПредположение 4 о дрейфе выполняется при δθj = k j maxi,t i∈Mtj δri .Предположение 3 выполняется с c1 = 0 и cj2 =K2nПроверим, что Предположение5 выполняется при c3 = 0 и cj4 =PM4M4Kmaxt 2ni,j 4 − 2 .
Для соответствующей разности имеi∈Mtj (σti,j )4 + (σt−1)емKEFt−2 (f¯wj t (At θ t )−f¯wj t−1 (At θ t−1 ))2 =EF2n t−2K X≤2nji∈MtM4(σti,j )4+Xi∈MtjM4i,j 4(σt−1)ξ i,jk ti,j k2(σt )−ξ i,jk t−1k2i,j(σt−1 )!2≤!−2≤ cj4 .Так как в рассматриваемой задаче vt = 0, то cv = 0 в Предположении 6,а Предположение 7 выполняется в силу независимости помех в моделинаблюдений.64Глава 3ИмитационноемоделированиеВ этой главе описаны иммитационные эксперименты, проведенныедля проверки работоспособности предложенных методов и подходов путем проведения имитационного моделирования.
В разделе 3.1 приводится описание используемых моделей движения объектов, для которых вразделе 3.2 проводится оптимизация распределения объектов между наблюдателями на основе линейных матричных неравенств и далее в разделе 3.3 представлены результаты оценивания траекторий движения сиспользованием циклического поискового алгоритма стохастической аппроксимации.3.1Модели движения объектовРассмотрим две модели движения объектов: прямолинейное равномерное движение и модель движения “велосипед”, применяемую в качестве упрощенной модели движения беспилотного транспортного средствапри разработке методов искусственного интеллекта [69]. Пусть объектыдвижутся в двумерном пространстве.
Введем вектор состояния i-го объ-65екта rit в момент времени t:rit=hrti,1rti,2ṙti,1ṙti,2iT∈ R4 ,где rti,1 и rti,2 — местоположение объекта по соответсвующей оси координат, ṙti,1 и ṙti,2 — компоненты скорости объекта в момент времени t.Прямолинейное равномерное движение объекта i можно задать следующим уравнением(3.1)rit+1 = Di rit ,где матрица Di ∈ R4×4 для введенного вектора состояния10Di = 000 ∆t 01 0 ∆t.0 1 00 0 1Модель движения “велосипед” в отличие от прямолинейного равномерного движения позволяет моделировать движение с учетом углов поворота ϑ. Несмотря на простоту модели (3.1), в работе целесообразнорассматривать и ее ввиду необходимости проведения оценивания работоспособности предложенных методов и подходов при различном “поведении” движущихся объектов.Для модели движения “велосипед” рассмотрим два случая. Если уголповорота ϑi объекта i не изменяется со временем, т. е.
ϑ̇i = 0, то уравнения движения примут видi,1= rti,1 + ṙti,1 cos(ϑi )∆t,rt+1(3.2)i,2rt+1= rti,2 + ṙti,2 sin(ϑi )∆t,ϑit+1 = ϑit .66Если угол поворота ϑi объекта i изменяется со временем, т. е. ϑ̇i 6= 0,то уравнения движения примут видi,1rt+1(3.3)i,2rt+1=rti,1=rti,2++ṙti,1 hϑ̇iṙti,2 hsin(ϑit+cos(ϑit )ϑ̇i ∆t)−cos(ϑit−ϑ̇iϑit+1 = ϑit + ϑ̇i ∆t.i,i,sin(ϑit )+ϑ̇i ∆t)Рассмотрим также более сложную модель движения, учитывающуюособенности каждого взятого объекта (например, его габариты). Пустькомпоненты скорости одинаковы ṙti,1 = ṙti,2 = ṙti , тогда:i,1= rti,1 + ṙti cos(ζti )∆t,rt+1i,2rt+1= rti,2 + ṙti sin(ζti )∆t,(3.4)ṙtiδt ∆t,Lt= ṙti + at ∆t,iζt+1= ζti +iṙt+1где Lt — расстояние от центра масс объекта до его граничной части (отражает тот факт, что чем больше объект, тем медленне он поворачивается),at — коэффициент из интервала [−1; 1].Проиллюстрируем модели движения результатами симуляции (см.Рис. 3.1).
При моделировании прямолинейного равномерного движениявсе объекты были настроены на одинаковое поведение, т. е. параметрыдвижения идентичны. В этом случае проверка работоспособности методов будет состоять в оценке способности оценивания сразу несколькихобъектов. Для второй модели параметры движения задавались случайным образом.67а)б)Рис. 3.1: Модель прямолинейного равномерного движения (а) и модельдвижения “велосипед” с изменением угла поворота (б).3.2Исследование работы алгоритмаоптимизации распределения объектовмежду наблюдателями на основерешения системы линейных матричныхнеравенствНа Рис.