Диссертация (1145289), страница 38
Текст из файла (страница 38)
При этом, если Tp – горизонт прогнозав непрерывном времени, то имеем число тактов P = Tp / T .В соответствии со способами понижения размерности, описанными в главе3, выберем интервал постоянства управления Tu , кратный периоду T , то естьTu = sT , s > 1 . При этом размерность задачи оптимизации (6.2.5) понижается довеличины ν ⋅ m , где ν = ( P + 1) / s , если деление осуществляется без остатка иν = [( P + 1) / s ] + 1 , в противном случае.Будем считать, что векторы w[k + i ] ∈ E m , i = 0,...,ν − 1 задают управление наинтервалах постоянства и однозначно определяют соответствующее программноеуправление ν d [k ],..., ν d [k + P] на горизонте прогноза на k-ом шаге. Выберем период ∆tu пересчета управления равным периоду Tu . Тогда, в соответствии с идеологией управления с предсказанием, из найденной оптимальной последовательности w *[k ],..., w *[k + ν − 1] используется только первая компонента w *[k ] , а затемпроцесс оптимизации и прогноза повторяется заново.
При этом первая компонента w *[k ] реализуется в качестве управляющего сигнала на тактах k , …, k + s − 1функционирования реальной системы.Итак, алгоритм управления с прогнозом для задачи визуального динамиче-236ского позиционирования состоит из следующих действий.1) На текущем такте k функционирования замкнутой системы решается оптимизационная задача (6.2.5) о поиске оптимальной программной последовательk+Pности векторов ~ν d = {ν d [i ]}i = k на горизонте прогноза для прогнозирующей моде-ли (6.2.1) с учетом ограничений (6.2.3). При этом для уменьшения размерностизадачи (6.2.5) применяется период постоянства управления Tu .k+P2) Из найденной оптимальной последовательности ~ν d* = {ν *d [i ]}i = k исполь-зуются только первые ее s элементов ν *d [k ] , …, ν*d [k + s − 1] в качестве заданногозначения скорости на тактах k , …, k + s − 1 .3) Отработка заданного значения скорости ν *d [k ] ,…, ν*d [k + s − 1] осуществляется при помощи базового закона управления видаτ 0 = K d (ν[i ] − ν *d [i ]) +1M (ν *d [i + 1] − ν *d [i ]) .TПри этом управление для подвижного объекта определяется выражениемτ[k ] = C(ν[k ])ν[k ] + D(ν[k ])ν[k ] + g(η[k ]) + τ 0 .Рассмотрим теперь более общий случай, когда на подвижный и наблюдаемый объекты действуют внешние возмущения.
Будет представлять внешние возмущения в виде суммы двух слагаемых – постоянного (или медленно меняющегося) и возмущения, имеющего заданную спектральную характеристику, связанное, например, с воздействием морского волнения. Тогда имеемτ e [k ] = τ be [k ] + τ ew [k ] , d c [k ] = d bc [k ] + d cw [k ] ,(6.2.6)где τ be [k ] и d bc [k ] – постоянные составляющие возмущения, а τ ew [k ] и d cw [k ] – составляющие возмущения с заданной спектральной характеристикой для подвижного и наблюдаемого объектов соответственно.Рассмотрим следующую прогнозирующую модель237s[i + 1] = s[i ] + TL s (s[i ], Zc [i ])ν[i ] + T dcb [i ] + T dcw [i ],Zc [i + 1] = Z c [i ] + TL Z (s[i ], Z c [i ])ν[i ],Mν[i + 1] = Mν[i ] + Tτ[i ] + Tτ be [i ] + Tτ ew [i ],η[i + 1] = η[i ] + TJ ( η[i ])ν[i ],ev [i ] = ν[i ] − ν d [i ],(6.2.7)Mz v [i + 1] = Mz v [i ] + Tτ[i ] + TH v ( ev [i ] − z v [i ]),ξ = Fv (q )( ev [i ] − z v [i ]),τ[i ] = K d z v [i ] + ξ[i ],i = k ,..., k + P − 1.Здесь векторы ν , s , Zc , η , z v , ξ образуют общий вектор состояния прогнозирующей модели.
Эти векторы в момент времени i = k инициируются текущим состоянием реального объекта ν[k ] = ν[k ] , Zc [k ] = Z c [k ] , s[k ] = s[k ] , η[k ] = η[k ] инаблюдателя z v [k ] = z v [k ] , ξ[k ] = ξ[k ] .Дополним прогнозирующую модель (6.2.7) уравнениями, которые моделируют внешние возмущения на горизонте прогноза:dcb [i + 1] = dcb [i ], τ eb [i + 1] = τ be [i ],p d [i + 1] = α d p d [i ] + β d w d [i ],dcw [i ] = γ d p d [i ] + μ d w d [i ],(6.2.8)p e [i + 1] = α ep e [i ] + β e w e [i ],τ ew [i ] = γ ep e [i ] + μ e w e [i ],i = k ,..., k + P − 1.Здесь первые два уравнения формируют постоянные возмущения τ be [i ] и dcb [i ] науказанном горизонте.
При этом начальными условиями для этих векторов в момент времени i = k служат текущие оценки τˆ be [k ] и dˆ bc [i ] постоянных возмущений,полученныеспомощьюасимптотическогонаблюдателя,тоестьτ be [k ] = τˆ be [k ] , dcb [i ] = dˆ bc [i ] .Векторы p d [i ] и p e [i ] в уравнениях (6.2.8) определяют состояния формирующих фильтров внешних возмущений с заданными спектрами. Матрицы α d ,β d , γ d , μ d и α e , β e , γ e , μ e этих систем выбираются так, чтобы поступающие наих вход случайные «белые» шумы w d [i ] и w e [i ] преобразовывались на выходе в238случайные процессы с заданными спектральными характеристиками.Программным управлением на горизонте прогноза для модели (6.2.7),k+P(6.2.8) служит последовательность векторов {ν d [i ]}i = k , то есть командный сигналпо скорости подвижного объекта.
Для отработки заданной скорости в модели(6.2.7) используется закон управления с многоцелевой структурой (6.1.15). Такимобразом, прогнозирующая модель (6.2.7), (6.2.8) включает совместные уравнениязамкнутого контура для подвижного объекта с многоцелевым законом управления и динамику изменения положения точек на изображении.С учетом формул (6.1.11) и (6.1.15) введем ограничения на контролируемуюпеременную ~τ , определяемую уравнениями~τ[i ] = C( ν[i ])ν[i ] + D( ν[i ])ν[i ] + g( η[i ]) + τ[i ] + 1 M( ν [i + 1] − ν [i ]) .ddT(6.2.9)При этом ограничения, аналогично (6.2.3), имеют вид~τ min ≤ ~τ [i ] ≤ ~τ max , j = 1, m, i = k + 1,..., k + P ,jjj(6.2.10)где ~τ minи ~τ max– минимальное и максимальное возможные значения управляюjjщего сигнала для j -ой компоненты.На движениях прогнозирующей модели зададим функционал (6.2.4) и рассмотрим оптимизационную задачу (6.2.5) о поиске оптимального программногоk+Pуправления ~ν d = {ν d [i ]}i = k на горизонте прогноза.
При этом допустимое множе-ство Ω определяется ограничениями (6.2.10), то естьΩ = {~ν d ∈ E m ( P +1) | ~τ min≤ τ j [i ] ≤ ~τ max, j = 1, m, i = k + 1,..., k + P }.jj(6.2.11)Данная задача оптимизации имеет также размерность m( P + 1) и для ее понижения можно использовать период Tu постоянства управления, кратный периоду T , как описано выше.В результате сформируем алгоритм управления с прогнозом для задачи визуального динамического позиционирования при наличии внешних возмущений,который состоит из следующих действий.2391) На текущем такте k функционирования замкнутой системы решается оптимизационная задача вида (6.2.5) о поиске оптимальной программной последоk+Pвательности векторов ~ν d = {ν d [i ]}i = k на горизонте прогноза для прогнозирующеймодели (6.2.7), (6.2.8) на допустимом множестве (6.2.11). При этом для уменьшения размерности задачи (6.2.5) применяется период постоянства управления Tu .k +P2) Из найденной оптимальной последовательности ~ν d* = {ν *d [i ]}i = k использу-ются только первые ее s элементов ν *d [k ] , …, ν*d [k + s − 1] в качестве заданногозначения скорости на тактах k , …, k + s − 1 ..3) Отработка заданного значения скорости ν *d [k ] ,…, ν*d [k + s − 1] выполняется при помощи многоцелевого закона управления (6.1.15).
При этом управляющий сигнал, который фактически подается на подвижный объект, определяетсяуравнениямиe v [k ] = ν[k ] − ν*d [k ],Mz v [k + 1] = Mz v [k ] + Tτ[k ] + TH v (e v [k ] − z v [k ]),(6.2.12)ξ = Fv ( q )(e v [k ] − z v [k ]),τ[k ] = K d z v [k ] + ξ[k ],τ[k ] = C(ν[k ])ν[k ] + D(ν[k ])ν[k ] + g(η[k ]) +()1M ν *d [k + 1] − ν *d [k ] + τ[k ].TОтметим, что реализация данного алгоритма на борту подвижного объектатребует решения задачи нелинейного программирования на каждом такте функционирования замкнутой цифровой системы.6.3.
Цифровые законы управления для визуального динамическогопозиционирования морского судна и колесного роботаРассмотрим пример использования многоцелевого цифрового алгоритмауправления для динамического позиционирования морского судна. С учетомуравнений (3.4.19) и (6.1.1) разностные уравнения динамики морского суднапредставляются следующей системой уравнений240Mν[k + 1] = Mν[k ] − TDν[k ] + Tτ[k ] + Td[k ],(6.3.1)η[k + 1] = η[k ] + TR (η[k ])ν[k ],где k = 0,1,2,.. – номер такта дискретного времени.Будем рассматривать две точки объекта наблюдения, причем для второйточки будем использовать только одну из ее координат. Тогда в соответствии сформулами (5.2.1) – (5.2.3) и (6.1.3b) получаем разностные уравнения, описывающие динамику точек в плоскости изображенииs[k + 1] = s[k ] + TL s (s[k ], Z c [k ])ν[k ] + Td c [k ],(6.3.2)Z c [k + 1] = Z c [k ] + TL Z (s[k ], Z c [k ])ν[k ].ЗдесьZ c = (Z c(1)векторсостоянияимеетсоставляющиеs = ( x1y1x2 ) ,TZ c( 2 ) ) , а матрицы L s и L Z представляются в видеT x1[k ]1 (1)− (1)− (1 + x12 [k ])Z c [k ] Z c [k ] y1[k ] − 1 0 x1[k ]Z c(1) [k ] .L s = (1)− x1 ]k ] y1[k ] , L z = 0( 2)Z[k]−10[]xZk2 c cxk[]12 2 Z ( 2 ) [k ] − Z ( 2) [k ] − (1 + x2 [k ]) ccРассмотрим синтез цифрового многоцелевого закона управления (6.1.7),(6.1.8) для плоскости изображения.
Настраиваемые параметры структуры – матрицы K и H базового закона и асимптотического наблюдателя, и передаточнуюматрицу F (z ) корректора – будем выбирать с учетом требований устойчивости,астатизма и фильтрации. В соответствии с теоремой 6.1, данные параметрыдолжны быть такими, что:1) (E + TK ) , (E − TH ) и α – шуровские матрицы;2) F(1) = K − H ;3) F (e jωi ) = −P2−1 (e jωi )P1 (e jωi ), i = 1,3 , где ωi , i = 1,3 – три основные частотыспектра морского волнения.Примем шаг дискретности T = 0.1 с.
Учитывая связь между частотами непрерывного и дискретного сигналов, выберем следующие частоты настройки кор-241ректора: ω0 = 0.038 , ω1 = 0.0455 , ω2 = 0.053 рад/c. Зададим матрицы K и H базового закона и асимптотического наблюдателя:00 00 0.2 0.2K = − 0 0.230 , H = 0 0.25 0 . 0 000.25 00.3 Такой выбор матриц обеспечивает выполнение условия 1). Матрица F (z ) динамического корректора вычисляется с учетом условий 2) и 3) на основе алгоритма,аналогичного тому, который приведен в главе 2.Пусть вектор s d задан координатами: s d = (20 25 30 ) .