Диссертация (Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению), страница 8
Описание файла
Файл "Диссертация" внутри архива находится в папке "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению". PDF-файл из архива "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 8 страницы из PDF
Понятно также, что подобная ситуация возможна и в общем случаепри наличии нескольких решений, удовлетворяющих необходимым условиям оптимальности. Таким образом, при поиске оптимального управленияв рассматриваемых здесь задачах выбор начального приближения играетсущественную роль.Отметим также два частных случая постановки задачи для данного примера, когда c = 0 или q = 0. Последний случай приводит к тому,что решение M (t) ≡ 0, а, следовательно, в обеих указанных ситуацияхпри должном выборе оставшихся значений параметров, будет иметь местонеограниченность снизу функционала качества J, и как видно из равенства(2.20), оптимальное управление не существует, а разработанный градиентный метод от шага к шагу будет неограниченно уменьшать значение J.2.7.РезультатыОсновные результаты данной главы связаны с поиском оптимально-го программного управления квазилинейными стохастическими системамис нелинейными по управлению коэффициентами и состоят в следующем:1) построена процедура улучшения заданного процесса управления;2) показано, что неулучшаемость процесса управления в смысле данной процедуры является необходимым условием его оптимальности;3) сконструирован численный метод градиентного типа для поискаоптимального управления;4) условия и метод опробованы на модельном примере.Результаты главы опубликованы в работах [69, 76, 78].603.
Оптимизация квазилинейных систем при неполнойинформации о состоянииЗдесь рассматриваeтся задача синтеза оптимальной стратегии управления квазилинейными динамическими стохастическими системами с информационными ограничениями в классе линейных регуляторов. Показано, что результаты главы 2 можно непосредственным образом продолжитьна рассматриваемый класс задач.В § 3.1 формулируется постановка задачи оптимизации стратегииуправления квазилинейными динамическими стохастическими системамипри неполной информации о состоянии и вводится понятие стратегииуправления с информационными ограничениями (определение 2).Далее, в разделе 3.2 поставленная задача формулируется в виде частного случая рассматриваемой в главе 2 задачи оптимального программного управления квазилинейной системой с нелинейными по управлениюкоэффициентами.В результате этого необходимые условия оптимальности и численныйметод, сформулированные в разделах 2.4-2.5 удаётся в § 3.3 и § 3.4 конкретизировать для рассматриваемой здесь задачи.613.1.Постановка задачи оптимального управления квазилинейными динамическими стохастическими системами с информационными ограничениямиПроцесс управления описывается системой уравнений Итоdx(t) = [A(t)x(t) + B(t)u(t, x(t))] dt+ν PG(l) (t)x(t) + F (l) (t)u(t, x(t)) + C (l) (t) dwl (t),+(3.1)l=1x(t0 ) = x0 ,где t ∈ T = [t0 ; t1 ] – время; x ∈ Rn – вектор состояния системы; w(·) –ν-мерный стандартный винеровский процесс; u ∈ Rm – вектор управления;(t, x) → u(t, x) : T × Rn → Rm – стратегия управления.
Случайный векторx0 имеет плотность распределения p0 (x) с математическим ожиданием m0и ковариационной матрицей K0 > 0. Здесь и далее в главе размерности матриц и векторов, а также условия на функции соответствуют приведённымранее в главе 2.В обозначениях главы 1f (t, x, u) = A(t)x + B(t)u,gl (t, x, u) = G(l) (t)x + F (l) (t)u + C (l) (t, u),где столбцы gl (·) вновь составляют матрицу g(·) размеров n × ν.Рассматривается функция управления t → u∗ (t) = u(t, ·) : T → V ⊂B n,m , где V – множество, задающее информационные ограничения, которые состоят в том, что каждая компонента вектора стратегии u(·) зависитот своего априори назначаемого набора компонент вектора состояния x,B n,m – множество борелевских функций x → v(x) : Rn → Rm . Указанныеограничения отражают возможности получения информации о состоянии.62П р и м е р 1.Пусть управляемая динамическая система имеетвектор состояния x = (x1 , x2 , x3 , x4 , x5 )T и вектор управления u =(u1 , u2 , u3 , u4 )T .
Требуется синтезировать стратегию управления в видеu (t, , x2 , , x4 , ) 1 u2 (t, , , x3 , x4 , ) u(t, x) = u3 (t, x1 , , , x4 , ) u4 (t, x1 , x2 , , x4 , )Все компоненты вектора u зависят от координаты x4 , ни одна компонентане зависит от x5 и каждая по-своему зависит от x1 , x2 , x3 .Формально информационные ограничения можно задать следуя [1],αсформировав набор функций (t, x) → uα (t, x) : T × Rn → Rm , mα ≤ m,непрерывно дифференцируемых по xα , α = 1, n1 , n1 ≤ n.
Каждая функция uα состоит из компонент вектора стратегии управления u(·), не зависящих от компоненты xα вектора состояния x.О п р е д е л е н и е 2. Функцию u∗ (·) будем называть управлениемс информационными ограничениями, если для набора функций uα (·) выполнено∂ αu (t, x) = 0, (t, x) ∈ T × Rn , α = 1, n1 .∂xαЕсли все компоненты вектора стратегии управления u(·) зависятот всех компонент вектора x, то указанные функции не вводятся и стратегия управления заданной структуры совпадает с обычной стратегиейуправления с полной обратной связью.Здесь через D обозначим множество допустимых процессов управления z = (p∗ (·), u∗ (·)), удовлетворяющих условиям:63A.1) управление u∗ (·) является управлением с информационнымиограничениями;A.2)p∗ (t)=призаданномуправленииu∗ (·)функция→tT → Cp2 (Rn ) абсолютно непрерывна и такова,p(t, ·) :что плотность p является решением уравнения ФПК (1.2) с начальнымусловием (1.3).Для процесса z ∈ D определим функционал качества управленияz → J(z) =Rt1 R 1t0 R n1 TTTxD(t)x+uS(t)x+uE(t)up(t, x)dxdt+22(3.2)+RRn1 T2 x Qxp(t1 , x)dx:D→R ,1где квадратичные формы в подынтегральных выражениях неотрицательноопределены, и выполнено условие E(t) ≥ E0 > 0, t ∈ T .В обозначениях главы 111f c (t, x, u) = xT D(t)x + uT S(t)x + uT E(t)u,221F c (x) = xT Qx.2Цель управления состоит в минимизации критерия (3.2) на множестве D.3.2.Синтез линейного регулятораПри решении задачи синтеза оптимальной стратегии управления ква-зилинейной системой с информационными ограничениями вида (3.1), в отличие от линейной системы, приходится так или иначе постулировать линейность по состоянию искомой оптимальной стратегии.
В результате оптимальная стратегия управления ищется в виде линейного регулятора [4, 5]u(t, x) = −(P (t)x + L(t)).(3.3)64Нетрудно видеть, что в этом случае информационные ограниченияможно учесть, зафиксировав элементы Pij (t) ≡ 0, если компонента ui вектора стратегии управления не должна зависеть от компоненты xj векторасостояния.Принимая совокупность оставшихся ненулевых элементов матрицыP (·) и компонент вектора L(·) за функцию управления t → û(t) : T →Rp , p ≤ m · (n + 1), получим новую постановку задачи в видеhidx(t) = Â(t, û(t))x(t) + B̂(t, û(t)) dt+iν hP(l)(l)Ĝ (t, û(t))x(t) + Ĉ (t, û(t)) dwl (t),+(3.4)l=1x(t0 ) = x0 ,J(z) =iRt1 R h 1 TT=2 x D̂(t, û(t))x + Ŝ (t, û(t))x + Ê(t, û(t)) p(t, x)dxdt+t0 R nR+Rn(3.5)1 T2 x Qxp(t1 , x)dx,гдеÂ(t, û) = A(t) − B(t)P,B̂(t, û) = −B(t)L,Ĝ(l) (t, û) = G(l) (t) − F (l) (t)P,Ĉ (l) (t, û) = C (l) (t) − F (l) (t)L,(3.6)D̂(t, û) = D(t) − P T S(t) − S T (t)P + P T E(t)P,Ŝ T (t, û) = LT E(t)P − LT S(t),Ê(t, û) = 1/2 · LT E(t)L.Полученная задача (3.4)-(3.5) представляет собой частный случай задачи (2.1)-(2.2), и к ней могут быть применены предложенные в разделе 2.3процедуры улучшения процесса управления.
В частности, формула (2.16)65для вычисления значений ∂I/∂ ũr при переходе к новому управлению ũпримет вид∂I∂ ũr (t, m(t), K(t), û(t))== tr Pr0T (t) (E(t) + Θ(t)) P (t) − B T (t)M (t) − Π(t) − S(t) K(t) +(3.7)T T00(E(t) + Θ(t)) L(t) − B (t)λ(t) − Λ(t) ++ (Pr (t)m(t) + Lr (t))+ (E(t) + Θ(t)) P (t) − B T (t)M (t) − Π(t) − S(t) m(t) ,где Π =νPF(l)T(l)MG , Λ =l=1νPl=1F(l)T(l)MC , Θ =νPTF (l) M F (l) , а через (·)0rl=1обозначена производная по элементу матрицы P или вектора L, соответствующего компоненте ûr нового вектора управления û, r = 1, p. В справедливости этой формулы легко убедиться, выполнив подстановку выражений (3.6) вместо соответствующих функций в формулу (2.16).Из приведённых в данном разделе рассуждений непосредственно следует справедливость теорем 2 и 3 для квазилинейных стохастических систем с информационными ограничениями.
При этом формулировка и доказательство теоремы 2 повторяются с точностью до замены формулы (2.16)на формулу (3.7), в то время как теорему 3 удаётся существенным образом конкретизировать за счёт возможности частично разрешить равенствонулю правой части выражения (3.7) относительно коэффициентов регулятора P (t) и L(t). Соответствующий результат сформулирован в следующемразделе в виде теоремы 4.Следует отметить, что сконструированные таким образом необходимые условия оптимальности в точности совпадают с локальными условиями, которые получаются при поиске экстремальных процессов управленияв задачах оптимизации линейных и обыкновенных квазилинейных стохастических систем с информационными ограничениями [2, 4, 5] при непо-66средственном использовании метода функций Ляпунова–Лагранжа [1, 2],частично описанного в главе 1.3.3.Необходимые условия оптимальностиТ е о р е м а 4.