Автореферат (Управление группами наблюдателей на основе мультиагентного подхода), страница 4
Описание файла
Файл "Автореферат" внутри архива находится в папке "Управление группами наблюдателей на основе мультиагентного подхода". PDF-файл из архива "Управление группами наблюдателей на основе мультиагентного подхода", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
. , d} разбивается на k непересекающихся подмножеств Iu , u = 1, . . . , k, выделяющих набор активных параметров вмоменты времени t = 2(T 1)k + 2u 1 и t = 2(T 1)k + 2u, u = 1, . . . , k, и удовлетворяющих условиямk[\Iu = D, Iu0Iu00 = ; при u0 6= u00 .(7)u=1При каждом t = 1, 2, . .
. определяются диагональные матрицы At , формирующие повектору xt разреженный вектор At xt с нулями на тех местах, индексы которых не принадлежат I(t mod (2k))÷2 , где mod � операция взятия остатка от деления, ÷ � операцияделения нацело. В разделе 2.3 изучаются свойства оценок следующего циклическогопоискового алгоритма стохастической аппроксимации:8>bt 1 )>x2((t 1)÷2)+1 = ⌧2((t 1)÷2)+1 (At (h(✓>>>>+<xbt÷2 )),2(t÷2) = ⌧2(t÷2) (At (h(✓ t 1 ) +>b2((t 1)÷2)+1 = ⌧2((t 1)÷2)+1 (h(✓b2((t 1)÷2) )),>✓>>>>:✓b2(t÷2) = ⌧2(t÷2) (h(✓b2((t 1)÷2)+1 ) ↵At T y2Tt÷2 )),(8)y2T1),где ↵ > 0 � постоянный размер шага, +0и0 такие, что = + +> 0,dd ld ldh:R !R� линейное отображение и ⌧t : R! R � обратные к нему функциипри количестве ограничений, равном l.Далее формулируются основные предположения о возмущениях и функциях f¯w (x),F̄t (x), а также доказывается теорема, отражающая среднеквадратическое качество оценок, получаемых по предложенному алгоритму (8).П р е д п о л о ж е н и е 1.
Для точек минимума ✓ t функций F̄t (·) и векторов13градиентов функций f˜(At x) = f¯wt (gt (At x)) с некоторой постоянной µ > 0 выполняют˜ся неравенства: 8x 2 Rd (x h(✓ t ))T ATµkAt (x h(✓ t ))k2 .t EFt 1 rfwt (At x)П р е д п о л о ж е н и е 2. 8w 2 W градиент rf˜wt (At x) удовлетворяет условиюЛипшица с константой M µ: 8x0 , x00 2 Rd krf˜wt (At x0 ) f˜wt (At x00 )k M kAt (x0 x00 )k.П р е д п о л о ж е н и е 3. Вектор-градиент rf˜wt (At x) равномерно ограниченв точках минимума ✓ t : E(rf¯wt (At h(✓ t )))T rf¯wt 1 (At h(✓ t 1 )) c2 , kErf¯wt (At h(✓ t ))k c1 , Ekrf¯wt (At h(✓ t ))k2 c2 (c1 = c2 = 0, если последовательность wt неслучайная,т.е.
f¯wt (x) = F̄t (x)).П р е д п о л о ж е н и е 4. Дрейф ограниченный: для ⌘ t = At (h(✓ t ✓ t 1 )) выполняется k⌘ t k ✓ < 1 или Ek⌘ t k2 ✓2 и Ek⌘ t kk⌘ t 1 k ✓2 , если последовательность{wt } случайная.П р е д п о л о ж е н и е 5. Скорость дрейфа ограничена таким образом, что8x 2 Rd : EFt 2 (f˜wt (At ✓ t ) f˜wt 1 (At ✓ t 1 ))2 c3 kAt (x h(✓ t 2 ))k + c4 .П р е д п о л о ж е н и е 6. Последовательные разности помех наблюденияограничены: |v2t v2t 1 | cv < 1 или E(v2t v2t 1 )2 c2v , если последовательность{vt } случайная.П р е д п о л о ж е н и е 7.
Для T = 0, 1, . . ., если vt случайные, тогда вектор T иразности помех v2kT +2 v2kT +1 , . . . , v2k(T +1) v2k(T +1) 1 независимые; если wt случайные,тогда вектор T и w2kT +1 , . . . , w2k(T +1) независимы.Т е о р е м а 2. Если выполнены Предположения 1–7 и8),< (0;✓ µ/ p2↵2: 0; µ 2µ2◆[✓µ+pµ2 22; µ/◆если µ2 > 2 ;, в противном случае,b2kT }1 , построенная по алгоритму (8), при разтогда последовательность оценок {✓T =0биении временнóй оси по (7) дает асимптотическую верхнюю границу среднеквадратической невязки: 8" > 0 9 t̄ : 8t > t̄ppqkb+b2 + mlbt A( )✓ t )k2 Ekh(✓+ ",(9)mpгде: = 3d(M 2 d + c3 ), m = 2(µ ↵ ), b = 2 M d d(1 + 6↵M d) + ✓ (M + 2µ + 6↵M 2 d2 ),⌘⇣pp¯l = 2↵d c2 + 3( c4 + d(c2 + M 2 ( ✓ + 2 d)2 )) + 2 ✓ (4 M d d + M ✓ + c1 + 3µ 2 ), l =v✓p¯l + 2bk k ✓ + 1 ↵m 2 .↵✓14В разделе 2.4 предлагается метод управления группами наблюдателей с использованием мультиагентного оценивания состояний движущихся объектов на основе циклического поискового алгоритма стохастической аппроксимации, состоящий из двух этапов:сначала производится распределение объектов между наблюдателями с применениемтехники линейных матричных неравенств, далее предполагается, что полученное решение остается неизменным на некотором временном интервале (достаточно большом),т.
е. достаточно долго субоптимальная структура остается неизменной, при выполнении этого предположения второй этап заключается в применении распределенного алгоритма циклической стохастической аппроксимации, предложенного в разделе 2.4диссертации, для которого формулируется и доказывается следующая теорема.Т е о р е м а 3. Если дрейф ограничен: krit rit 1 k ri , i 2 M , выполнены условия (1)для модели наблюдений, (2) для последовательностей матриц {Bt }, {Ct }, {Ajt }, j 2 N ,8j< (0; µj ),✓p j2j↵2(µ ): 0; µ2 j2j◆[✓µj +p(µj )2 22 jjj; µj◆если (µj )2 > 2 j ;, иначе,bj j }1 , построенные по распределенному алготогда последовательности оценок {✓2k T T =0ритму циклической стохастической аппроксимации, при разбиении временнóй оси по(7), для каждого j дает асимптотическую верхнюю границу среднеквадратическойневязки: 8"j > 0 9 t̄j : 8t > t̄j⌘p ⇣pqjjj2jjkb + (b ) + m lbj A( )✓ t )k2 Ekh(✓+ "j ,tmjгде µj = 2n maxK ( i,j )2 , M j = 2n minK ( i,j )2 , j = 3d2 (M j )2 , mj = 2(µj↵ j ), ✓j =i,t ti,t tpPKk j maxi,t i2M j ri , bj = 2 M j d d(1+6↵M j d)+ ✓j (M j +2µj +6↵(M j )2 d2 ), ¯lj = 6d ↵ maxt 2n·t✓◆pi,jPT r[⌅ ]M4K4+(M2 + 2 ✓j (4 M j d d + M j ✓j + 3µj ( ✓j )2 ) + 6d2 ( 2nmaxi,t ( i,jt)2 +i,j 4i2Mtj( ti,j )4)tp j 1 ↵mj jp t 21 jj 2 jjj j2j¯+(M ) ( ✓ + 2 d) ), l = l + 2b k k ✓ + ↵ ( ✓ ) .В третьей главе приводятся результаты имитационного моделирования, иллюстрирующие работу предложенных методов и подходов.
В разделе 3.1 описываются используемые при имитационном моделировании модели движения объектов наблюдения. Вразделе 3.2 приводятся результаты решения модельной задачи оптимизации распределения объектов между наблюдателями, на основе метода из раздела 2.2, а такжеобсуждается их возможное дальнейшее применение при решении задачи оцениваниятраекторий. В разделе 3.3 демонстрируются результаты применения алгоритма циклической поисковой стохастической аппроксимации для оценивания траекторий дви15жущихся объектов при различных значениях ограничений на функционирование сетинаблюдателей.В заключении формулируются основные результаты диссертации.Публикации автора по теме диссертацииСтатьи в периодических рецензируемых изданиях, индексируемых в наукометрической базе данных SCOPUS или включенных в перечень научныхжурналов, рекомендованных ВАК:[1] Amelina N., Erofeeva V., Granichin O., Malkovskii N.
Simultaneous Perturbation Stochastic Approximation in Decentralized Load Balancing Problem// IFAC-PapersOnLine. – 2015. – Vol. 48, No. 11. – P. 936–941.[2] Ерофеева В.А., Иванский Ю.В., Кияев В.И. Управление роем динамических объектов на базе мультиагентного подхода // Компьютерныеинструменты в образовании. – 2015.
– Вып. 6. – С. 34–42.Другие научные публикации:[3] Ерофеева В.А. Оптимизация распределения целей между наблюдателями и оценивание состояний с помощью циклического подхода // Стохастическая оптимизация в информатике. – 2018. – Т. 14. – № 1. – С. 3–30.[4] Ерофеева В.А. Мультиагентный подход в задаче оценивания траекторий движущихся объектов // Материалы XIX конференции молодых ученых “Навигация иуправление движением” с международным участием. – 2017.
– С. 70–72.[5] Erofeeva V., Granichin O., Kiyaev V. Multi-agent based adaptive swarm roboticscontrol in dynamically changing and noisy environments // In: Proc. of Russian Supercomputing Days. – 2016. – P. 808–813.[6] Ерофеева В.А. Поисковой алгоритм стохастической аппроксимации в задаче балансировки загрузки при неизвестных, но ограниченных возмущениях на входе// Материалы научной конференции по проблемам информатики СПИСОК-2014.– 2014. – С. 123–130.[7] Алимов Н.А., Ерофеева В.А., Шалымов Д.С.
Анализ возможностей методов классификации для автоматизации работы дефибриллятора // Стохастическая оптимизация в информатике. – 2017. – Т. 13. – № 1. – С. 3–30.[8] Ерофеева В.А. Обзор теории интеллектуального анализа данных на базе нейронных сетей // Стохастическая оптимизация в информатике. – 2015. – Т.
11. – № 3.– С. 3–17..