Обобщение метода характеристик Коши для построения численно-аналитических методов решения задач синтеза оптимального управления (1104177), страница 4
Текст из файла (страница 4)
Продемонстрировано, что при большем значенииa2(увеличение параметраa2влечет за собой увеличение негативного влияния химиотерапевтического агентана иммунную реакцию) время “активной” терапии (когдаПоскольку определенная равенством (48) функцияΦ,u = R)сокращается.будучи положительной,имеет очень большой разброс значений для взятых параметров, то для численного моделирования бралась целевая функцияln Φ,эквивалентнаяΦс точкизрения отношения порядка.Результаты Главы 2 опубликованы в работе [4].Глава 3 является продолжением Главы 1, в которой при определенныхпредположениях был изложен метод построения синтеза оптимального управления на основе исследования расположения характеристик задачи Коши дляуравнения ГЯБ (выяснения того, как расширенное фазовое пространство заполняется характеристиками).
Предлагается метод отыскания глобального решения задачи Коши для уравнения ГЯБ посредством задания граничных значенийна поверхности особых характеристик, соответствующих особым оптимальнымуправлениям. Как и в Главе 1, управление считается одномерным и линейновходящим в систему.В Разделе 3.1 дана постановка задачи.Рассматривается та же самая задача оптимального управления (1),(2), чтои в Главе 1. Все предположения и обозначения Главы 1, предшествующие формулировке указанного выше Предположения 3, считаются сохраняющими силу.Черезγsобозначим совокупность всех таких интегральных кривых системы (7), которые соответствуют допустимым особым управлениям, проходят черезγ0 ×{0} и рассматриваются до момента первого своего попадания на множество (16).
Основная идея предлагаемого метода заключается в задании граничного условия для искомой функции цены наγsс целью решения уравнений вчастных производных из (12) в областях, которые не заполнены интегральнымикривыми, составляющими множестваΩ1иΩ2 .28В первой половине Раздела 3.2 разобран ряд примеров, в числе которыхзадачаdm= q(m) − αmf (h),dt dh = −µh + u(t), α = const > 0,dt0 6 u(t) 6 R, R = const > 0, Φ(m(T )) := m(T ) −→ inf,µ = const > 0,(52)гдеq(m) := rm −илиq(m) :=r|m|1+βθrm (β − ln |m|) , m 6= 0,0,r ,β , θhf : [h, +∞) → Rнепрерывно— отрицательная константа,f (0) = 0,f 0 (h) > 0например,(54)m = 0,— положительные константы, функциядифференцируема,(53)f (h) > 0приh > 0,f 0 (h0 ) = 0,R0;f (h) < 0 при h > h0 , h0 = const ∈ 0,µµf (h) := ahe−bh с константами a > 0, b > .
Здесь h = h0Rприh 6 h < h0 ,наγ s,функция цены представляется аналитически и является гладкой. Это математическая модель терапии однородной твердой несосудистой опухоли с немонотонной функциейвремени t,f (h).При этомm(t)— количество опухолевых клеток в моментh(t) — концентрация лекарства в момент t, функция q(·) задает логистический закон (в случае (53)) либо закон Гомперца (в случае (54)) для ростаопухоли.Во второй половине Раздела 3.2 описана общая ситуация, имевшая местов последнем примере.29Рис.
5. Геометрическая картина оптимального синтеза в одном из примеров Раздела 3.2.Имеемdψ, f 2 (x) ψ(T ), f 2 (x(T )) (5) =dtt=T,Вторая производнаяd2 2ψ,f(x)dt2= 0приx(T ) ∈ γ0 .(55)(4),(5)с помощью соотношений (4) может бытьзаписана в формеd2 2ψ,f(x)= a1 (x, ψ) + a2 (x, ψ)u.dt2(4)С учетом представления (56) из условияu = ũs (x, ψ) := −Предположение 5.КеллиПусть такжеa1 (x, ψ)a2 (x, ψ)d2 2ψ,f(x)= 0dt2(56)получаем, что(x, ψ) ∈ G × Rn , a2 (x, ψ) 6= 0.при(57)Будем считать что на γ s выполнено усиленное условие,∂ d2 ∂H= a2 (x, ψ) > 0.∂u dt2 ∂uũs (x, ψ) ≡ us (x) ∈ (u1 , u2 )на(58)γ s.(59)30Если имеет место (59), то из равенстви соотношений (4),(5) сintPd ≡ 0ψ(t), f 2 (x(t)) dt(4)ψ(t), f 2 (x(t)) ≡и независимостьx0 ∈ γ0выводится, что включениеũs (x, ψ) ∈ (u1 , u2 ) =ũs (x, ψ) от ψ имеют место тождественно на особой поверхности.
В примерах Главы 3 таким образом получены аналитические выражениядляus (x).При этом в ряде дополнительных естественных предположенийявляется связной регулярной гиперповерхностью вRn+1 , делящей рассматриваемую область расширенного фазового пространства переменныхчасти, которых мы обозначим черезQ1иγs(x, τ )на двеQ2 .Известно, что локальный синтез экстремалей в некоторой окрестности особой поверхностиγ s строится посредством соединения особых интегральных траекторий с регулярными (соответствующими постоянным граничным управлениямu ≡ ui , i = 1, 2).Более того, части полученных при этом траекторий, лежащие в некоторой окрестностиγ s,удовлетворяют принципу максимума Понтрягина. В Разделе 3.2 введены еще два предположения, обеспечивающие глобальность такой геометрической картины оптимального синтеза и проверяемые впримерах. Тем самым особая поверхность единственна и переключение любого допустимого процесса, удовлетворяющего принципу максимума Понтрягина, может быть совершено только на ней, причем не более одного раза.
Отсюдавытекает алгоритм синтеза оптимального управления.Следующее предположение позволяет уточнить полученный результат.Предположим что какова бы ни была точка (x, τ ) ∈γ s , если n1γ (x, τ ) — какой-нибудь нормальный вектор к γ s в точке (x, τ )принадлежащий ради определенности нормальному конусу Кларка NQCl (x, τ ),то выполнены неравенства,Предположение 6.,,s()1n1γ s (x, τ ), (−f (x, u1 ), 1)n1γ s (x, τ ),(−f (x, u2 ), 1)< 0,(60)> 0.31ОбозначимQi∗ :=Qi \ Ωi ∪ γ s ∪ ω i ∩ (Rn × [0, T+ )) ,i = 1, 2(61)(см., например, Рисунок 5).В предположениях Главы существуют и единственны гладкиерешения задач Коши3Теорема 4. i ∂S∗ = ∇x S i , f 1 (x) + ∇x S i , f 2 (x) ui ,∗∗∂τ S i (x, τ ) = S s (x, τ ), (x, τ ) ∈ γ s ,γ∗(x, τ ) ∈ Qi∗ ,i = 1, 2,(62)функция цены имеет видS(x, τ ) =S i (x, τ ),(x, τ ) ∈ Ωi ,i = 1, 2,S∗i (x, τ ),(x, τ ) ∈ Qi∗ ,i = 1, 2,Sγ s (x, τ ),(x, τ ) ∈ γ s ,(63)и мы приходим к следующему представлению оптимального позиционногоуправления:uopt (x, T − τ ) =см.
Рисунки( ui ,(x, τ ) ∈ Qi , us (x),(x, τ ) ∈ γi = 1, 2,s(64).5,6)В Разделе 3.3 разработанный подход применен к задаче синтеза оптимального управления для математической модели терапии вирусных инфекцийdx1= λ1 − γ1 x1 − α1 x1 f1 (h),dtdx2= λ2 + α3 f3 (h) − γ2 x2 − α2 x2 f2 (h), dtdh= −γ3 h + u(t),dt0 6 u(t) 6 R, t ∈ [0, T ], Φ(x1 (T ), x2 (T )) := x2 (T ) + εx2 (T ) −→ inf,12где:(65)32• x1 (t)— численность основных вирусов в моментвирусов-мутантов в момент• λi > 0, i = 1, 2,t, h(t)t, x2 (t)— численность— концентрация лекарства в моментt;— скорости воспроизводства основных и мутировавшихвирусов;• γi > 0, i = 1, 2,— показатели смертности вирусов двух типов,γ3 > 0—коэффициент диссипации лекарства;• αi , i = 1, 2, 3, R, ε• fi (h) = f (h) :=— положительные константы;h, i = 1, 2, B = const > 0,B+h— функциитерапии, характеризующие интенсивность негативного влияния лекарствана клетки, зараженные основными и мутировавшими вирусами,f 0 (h) =B> 0 ∀h > −B;(B + h)2h2• f3 (h) :=, A = const > 0,A + h2(66)— функция, описывающая увеличениескорости воспроизводства вирусов-мутантов под воздействием лекарства,f30 (h) =• u(·)2Ah> 0 ∀h > 0;(A + h2 )2(67)— управляющая функция, которая задает количество лекарства, поступающего в организм пациента в единицу времени.Также приняты следующие предположения:•справедливы неравенстваR− h − 4Bh + 3 A − B h + 4ABh + AB > 0 ∀ h ∈ 0,,γ3 0 Rrα2α3 f3 γ3 < x1 ,x1 <ε·α1 2α2 f 0 Rγ3vu 2u0 R0u α f3 γR3α3 f 3 γ 3 3 − α1 x21 , + ux2 <t2α2 f 0 R2α2 f 0 Rεα2γ3γ343222(68)(69)33где0 < x1 = const <λ1γ1 + α1 fλ20 < x2 = const < ,Rγ3x1 = const >λ1,γ1 ,γ2 + α2 f γR3 λ2 + α3 f3 γR3x2 = const >;γ2•(70)выполнены требованияRh3 + 3Bh2 − 3Ah − AB < 0 ∀ h ∈ 0,,γ30 < us (x1 , x2 , h) < R ∀ (x1 , x2 , h) ∈R∈ G := x1 < x1 < x1 , x2 < x2 < x2 , 0 < h <,γ3(71)(72)гдеus (x1 , x2 , h) := γ3 h −α3−1f30 (h)f 00 (h)− f300 (h)·0f (h)000· λ1 x−11 (α3 f3 (h) − α2 x2 f (h)) − α3 f3 (h)(γ2 + α2 f (h)) +(73)+ α2 f 0 (h)(λ2 + α3 f3 (h)))есть особое позиционное управление.В сделанных допущениях к задаче (65) применим алгоритм синтеза оптимального управления, описанный в Разделе 3.2.
Чтобы можно было получитьпредставления (63),(64), необходимо проверить выполнение Предположения 4.Однако в этом примере не было получено аналитическое представление дляγ s , а потому вопрос установления справедливости Предположения 4 аналитическим путем остается нерешенным. Заметим, что в рассмотренной ранее задаче(52) с немонотонной функцией терапииf γsобладает тривиальным аналитическим представлением и выполнение Предположения 4 проверяется элементарно.
Вместе с тем, действуя неформально, можно проводить численную проверкусправедливости Предположения 4 для имеющихся конкретных значений параметров.34Рис. 6. Синтез оптимального управления в математической модели терапии вирусных инфекций.Раздел 3.4 посвящен теореме о гладкости функции цены вида (63). В этомслучае поверхностьγ s , во всех точках которой сохраняется гладкость функциицены, является универсальной согласно модифицированной А.














