Диссертация (1150919), страница 7
Текст из файла (страница 7)
. . имеет зашумленную информацию о своем собственномнаправлении движения, усиленным (домноженным) на текущий потенциал своего маршрута:(1.18)yti,i = gti + ωti,i ,(1.19)gti = qti xit ,и, если Dti 6= 0, зашумленные наблюдения о направлениях движения39соседей, также домноженные на потенциалы маршрутов соседей:(1.20)ji,jiyti,j = gt−hi,j + ωt , j ∈ Dt ,tгде ωti,j , ωti,i — помехи (шум), а 0 ≤ hi,jt ≤ h – целочисленная задержка,h — максимально возможная задержка.
Положим ωti,j = 0 и hi,jt = 0 длявсех остальных пар (i, j), для которых они не были определены. Так каксистема начинает работу при t = 0, то неявное требование к множествусоседей: j ∈ Dti → t — hi,jt ≥ 0.Консенсусное мультиагентное управление, формируемое по “протоколу локального голосования” с неубывающим размером шага (см. детальное описание в [39]), задается следующим соотношением:(1.21)uit = αXi,ii,jbi,jt (yt − yt ),j∈Dtiгде α — величина размера шага протокола управления, Dti ⊂ Dti , bi,j > 0∀j ∈ Dti . Положим bi,jt = 0 для других пар (i, j).Динамика изменения направления движения объекта будет описываться разностным уравнением:(1.22)xit+1 = xit + f (uit , xit )с управлением uit ∈ R, воздействие которого на изменение направленияxit определяется некоторой функцией f (·, ·) : R3 × R3 → R3 , формирующей окончательное управление в соответствии с процедурой избежаниястолкновений.При движении роя, состоящего из большого числа устройств, представляется естественным возможность его кластеризации при необходимости достижения нескольких целей.
В этом случае возможно применитьметод оптимизации распределения объектов слежения (в рассматриваемом случае целей) между участниками роя.40Глава 2Оптимизацияраспределения объектовнаблюдения междунаблюдателями иоценивание параметровдвижения группыобъектов на основемультиагентного подходаВ этой главе представлены основные теорметические результаты диссертационного исследования. Сначала формулируется постановка задачи, мотивированная описанными в предыдущей главе проблемами.
Результаты приводятся для конкретно выбранной модели наблюдений. Длярешения проблемы оптимизации распределения объектов между наблюдателями предлагается подход на основе техники линейных матричныхнеравенств. В зависимости от результата процедуры оптимизации возможно дальнейшее применение процедуры поисковой стохастической аппроксимации, изученной соискателем в [20, 38], либо циклической поис41ковой стохастической аппроксимации, предложенной соискателем в [18]и детально описанной в текущей главе диссертации.2.1Постановка задачи распределенногоотслеживания траекторий движущихсяобъектовРассмотрим распределенную сеть из n наблюдателей (сенсоров), взоне видимости которых находятся m объектов, векторы состояний которых надо оценить.
Например, наблюдатели могут быть “привязаны” кроботам, серверам, обрабатывающим данные, и т.п.2.1.1Модель наблюденийПусть N = {1, 2, . . . , n} — множество наблюдателей (сенсоров), M ={1, 2, . . . , m} — множество объектов, sjt ∈ Rs — вектор текущего состояния сенсора j, j ∈ N , в момент времени t, rit ∈ Rν — состояние i-гообъекта, i ∈ M , в момент времени t. Состояния rit объектов доступнынаблюдателям посредством измерений, получаемых по модели наблюденийj ii,jzi,jt = ϕ(st , rt ) + εt ,qгде zi,jt ∈ R — доступные j-му сенсору в момент времени t зашумленныенаблюдения об i-м объекте, ϕ(·, ·) : Rs ×Rν → Rq – функция наблюдений,отражающая измерения объекта i сенсором j в соответствии с текущимисостояниями сенсора и объекта, {εi,jt } — независимые помехи в измереi,ji,j Ti,jниях с нулевым средним Eεt = 0 и ковариацией Eεi,jt (εt ) = Σt .Будем считать, что существует обратная функция по второму аргументу ϕ−1 (sjt , ·) : Rq → Rν такая, что для любых i ∈ M , j ∈ N и42i,jнезависимых центрированных εi,jt с ковариациями Σt(2.1)i,jiϕ−1 (sjt , ϕ(sjt , rit ) + εi,jt ) = rt + ξ t ,i,jгде ξ i,jt — независимые с нулевым средним Eξ t = 0, ограниченным четi,j i,j Ti,j4вертым моментом Ekξ i,jt k ≤ M4 и ковариацией Eξ t (ξ t ) = Ξt .
Крометого, будем предполагать известным, что с некоторой вероятностью pσсредние значения следов T r[Ξi,jt ] (сумм диагональных элементов матрицi,jΞt ) меньше некоторого порогового значения (σ̄min )2 > 0, а их средниезначения при условии превышения пороговых значений (σ̄min )2 равны(σ̄ti,j )2 ." #" #i,1rtsj,1jiПусть rt = i,2 расположение объектов и st = tj,2 расположениеrtstсенсоров на плоскости, при измерениях углов и дальностей до объектовможно рассматривать функции ϕ(·, ·) вида#j i),rψ(st t∈ R2 ,ϕ(sjt , rit ) =j iρ(st , rt )"гдеψ(sjt , rit )= arctgrti,1 − sj,1trti,2 − sj,2t— угол между направлением от сенсора на север и направлением на наблюдаемый объект, называемый также углом азимута или дирекционным углом,q2j ii,2j,2 2ρ(st , rt ) =rti,1 − sj,1+r−sttt— расстояние от местоположения сенсора до объекта.
Обратная функцияпо второму аргументу ϕ−1 (sjt , ·) имеет вид"#i,j,2i,j,1zsinzjttϕ−1 (sjt , zi,j,t ) = st +i,j,2zt cos zti,j,1где zti,j,1 и zti,j,2 — первая и вторая координаты вектора zi,jt . Если матрицы43"i,jковариации ошибок εi,jt равны Σt =σψ200(zti,j,2 σρ )2#, то для ошибокξ i,jt имеем"i,j,1Ξi,j)t = R(zt"(zti,j,2 σψ )200(zti,j,2 σρ )2#R(zti,j,1 )T ,#sin ψ − cos ψ— матрица поворота на угол ψ. Отметим,cos ψ sin ψi,j,2что след получившейся матрицы равен trace(Ξi,jσψ )2 +(zti,j,2 σρ )2 .t ) = (ztгде R(ψ) =2.1.2Оптимизация нестационарного функционаласреднего рискаРассмотрим постановку задачи, представленную в [8, 38]. Пусть задано вероятностное пространство (Ω, F, P) с множеством элементарныхсобытий Ω, σ-алгеброй событий F и вероятностной мерой P, W — некоторые множество (например, W = N или W ⊂ Rp ).
Рассмотрим семейство дифференцируемых функций {f¯w (θ)}w∈W , f¯w (θ) : Rd → R.Пусть x1 , x2 , . . . — последовательность точек наблюдения (измерения),выбираемая экспериментатором (план наблюдений), в которых в каждыймомент времени t = 1, 2, . . . доступны наблюдению значения y1 , y2 , . . .функций f¯w (·) с аддитивными внешними помехами vt(2.2)yt = f¯wt (xt ) + vt ,где {wt } — неконтролируемая последовательность, wt ∈ W.Обозначим Ft−1 σ-алгебру вероятностных событий, порожденных теми величинами из w0 , . . .
, wt−1 , x0 , . . . , xt−1 , v0 , . . . , vt−1 , которые случайные, EFt−1 — символ условного математического ожидания по отношениюк σ-алгебре Ft−1 . Предположим, что если wt является случайной величиной, то функция f¯wt (θ) как функция от wt измерима при каждом θ44относительно σ-алгебры Ft−1 .Нестационарная постановка задачи: найти “дрейфующую” точкуминимума θ t функции(2.3)F̄t (θ) = EFt−1 f¯wt (θ) → min .θпри линейных ограничениях(2.4)Hθ = qt−1с задаваемыми матрицей H размерности l × d и векторами qt−1 ∈ Rl ,0 ≤ l < d. (При l = 0 будем считать, что никаких дополнительныхлинейный ограничений не введено).Более точно: пусть функция F̄t (θ) имеет минимум, тогда, используянаблюдения y1 , . .
. , yt и входы x1 , . . . , xt , необходимо построить удовлеbt неизвестного вектора θ t , минимизитворяющую условию (2.4) оценку θрующего нестационарный (зависящий от времени) функционал среднегориска (2.3).Если матрица H полного ранга, а именно rankH = l, то существуетлинейное отображение h : Rd → Rd−l и обратные к нему функции gt :Rd−l → Rd такие, чтоx = gt (h(x)), ∀x ∈ Qt = {x : Hx = qt−1 }.Обозначим θ t = col(r1t , . . . , rmt ) общий вектор состояний всех объектов.
Пусть brit – оценка состояния объекта i в момент времени t, θbt =col(br1t , . . . , brmt ) — совокупный общий вектор оценок. В достаточно общемслучае задача об оценивании неизвестных состояний объектов можетбыть сформулирована как задача о минимизации функционала(2.5)1X ikrt − brit k2 → minF̄t (θbt ) =2θbti∈M45при наблюденияхK X X −1 j i,jkϕ (st , zt ) − brit k2 /(σti,j )2 ,yt =2n(2.6)j∈N i∈MPгде K = pσ (σ̄min )2 + (1 − pσ ) j∈N (σ̄ti,j )2 , (σti,j )2 = max{T r[Ξi,jt ]} и соответствующие слагаемые в сумме предполагаются равными нулю, если(σti,j )2 = ∞, k · k — евклидова норма вектора. Нормирование относительно величины (σti,j )2 в таких задачах достаточно естественно и позволяетранжировать наблюдения в соответствии с уровнем их надежности.Модель наблюдений (2.6) естественно “укладывается” в общую схеnqnpму (2.2), если выбрать W = ×mi=1 ×j=1 R ×j=1 R и обозначить wt =jbcol(.
. . , εi,jt , . . . , st , . . .), xt = θ t ,K X X −1 j i,j¯kϕ (st , zt ) − brit k2 /(σti,j )2 .fwt (xt ) =2nj∈N i∈MОбщая схема (2.2) также допускает возможность дополнительныхошибок в наблюдениях vt .При введенных обозначениях функционал (2.5) фактически являетсяфункционалом типа (2.3) среднего риска F̄t (xt ) = EFt−1 f¯wt (xt ), так как всилу независимости и центрированности ξ i,jt имеемEFt−1K X X −1 j i,jkϕ (st , zt ) − brit k2 /(σti,j )2 =2nj∈N i∈M= EFt−1K XX ikrt + ξ i,jrit k2 /(σti,j )2 =t −b2ni∈M j∈NX1X iT r[Ξi,jt ]i 2=krt − brt kpσ + (1 − pσ )E{T r[Ξi,j=2t ]>(σ̄min ) }2(σti,j )2i∈Mj∈N1X i=krt − brit k2 .2i∈M462.1.3Распределенная оптимизацияВ распределенной оптимизации предполагается, что при любом w ∈W функция f¯w (θ) разделима по отношению или к самой функции, илик разбиению вектора θ на n подвекторов, а именно:f¯w (θ) =nXfwj (θ j ),j=1jгде θ j ∈ Rd — копия вектора θ для каждого j = 1, .