Обобщение метода характеристик Коши для построения численно-аналитических методов решения задач синтеза оптимального управления (1104177), страница 3
Текст из файла (страница 3)
2. К условию (20).В Разделе 1.2.2 аналогично разбирается случай, при которомΩ2τ ⊇ Dτ2Ω1τ ⊆ Dτ1 \ γτ1 ∀τ ∈ (0, T ].и(21)В Разделе 1.2.3 получены результаты, описывающие ситуации, в которыхфазовые компоненты характеристик задачи (6) с разными начальными позициями приτ = 0 (т. е.приt = T)является гладкой всюду вне пересекаются друг с другом и функция ценыG × (0, T ) .Пусть выполнено условие (20); случай выполнения условия (21) разбирается аналогично.Предположим чтоγ 1 — связная регулярная гиперповерхность без краевых точек в Rn+1делящая G×(T−, T+) на две части D1 и Q2 := ((G×(T−, T+)) \ D1) ∪ γ 1,которые при удалении из них γ 1 становятся открытыми областями в,Предположение 4.:1),Rn+1 ;если (x, τ ) ∈ γ 1 и nγ (x, τ ) — какой-нибудь нормальный вектор кγ 1 в точке (x, τ ) принадлежащий ради определенности нормальному2)1,()18Рис.
3. К Предположению 4.конусу КларкаNQCl2 (x, τ ),то справедливы неравенстваhnγ 1 (x, τ ), (−f (x, ui ), 1)i < 0,i = 1, 2.(22)∀τ ∈ (T− , T+ ).(23)ОбозначимQ2τ :=ИмеемQ20 = D02 = Ω20 .x ∈ Rn : (x, τ ) ∈ Q2Из условия (22) приi=2следует, чтоΩ2τ ⊆ Q2τ \ γτ1 ∀τ ∈ (0, T+ ).(24)Q2 \ Ω2 ∪ γ 1 ∪ ω 2 ∩ (Rn × [0, T+ ))(25)Также положимQ2∗ :=(см. Рисунок 3).В сделанных предположениях при условии существует единственное гладкое решение S∗2 : Q̃2∗ × (T−, T+) → R задачи КошиТеорема 3. 2 ∂S∗ = ∇x S 2 , f 1 (x) + ∇x S 2 , f 2 (x) u2 ,∗∗∂τ S 2 (x, τ ) = S 1 (x, τ ), (x, τ ) ∈ γ 1 ,∗(20)(x, τ ) ∈ Q̃2∗ ,(26)19гдеQ̃2∗ :=x2 (τ ; τ 0 , x0 ), τ: (x0 , τ 0 ) ∈ γ 1 , τ ∈ T− , τ 0 + θ2 (x0 )(27)есть содержащая множество Q2∗ открытая область в Rn+1 и,S 1 (x, τ ), (x, τ ) ∈ D1 ∩ (Rn × [0, T ]),S(x, τ ) =S 2 (x, τ ), (x, τ ) ∈ Ω2 ∩ (Rn × [0, T ]),S∗2 (x, τ ), (x, τ ) ∈ Q2∗ ∩ (Rn × [0, T ]),uopt (x, T − τ ) =u1 , (x, τ ) ∈ D1 ∩ (Rn × [0, T ]),(28)(29)u2 , (x, τ ) ∈ Q2 ∩ (Rn × [0, T ]).В Разделе 1.3 рассматривается пример — математическая модель терапии лейкоза с подчиненной закону Гомперца динамикой численностей здоровыхи зараженных клеток, стандартным линейным фармакокинетическим уравнением и монотонно возрастающими функциями терапии.ПустьN (t)— численность здоровых клеток в момент временичисленность лейкозных клеток в моменттического агента в моментt.tиh(t)t, L(t)—— количество химиотерапевСледующая модель описывает динамику численностей клеток обоих типов:LadL= rl L ln− γl L − fl (h)L,dtLNadN=rNln− γn N − cN L − fn (h)N,nN dtdh= −γh h + u(t),dt0 6 u(t) 6 R, 0 6 t 6 T, Φ1 (L(T ), N (T )) −→ inf .(30)20Здесьfl (h) := λl f (h), fn (h) := λn f (h)f : (−κ, +∞) → R—функции терапии,— непрерывно дифференцируемая функция,hf 0 (h) > 0 ∀h > −κ, например, f (h) :=,κ+hL2 ,N > N̆ ,Φ1 (L, N ) :=2L2 + α N − N̆ , N 6 N̆ ,rl ,rn ,La ,Na ,γl ,γn ,γh ,c,λl ,λn ,κ,R,α,N̆ ,T(31)— положительные константы.С помощью замены переменныхl := lnLa,Ln := lnNaN(32)мы приходим к задачеdl= −rl l + γl + fl (h),dtdn= −rn n + γn + ca e−l + fn (h),dtdh= −γh h + u(t), dt0 6 u(t) 6 R, 0 6 t 6 T,Φ(l(T ), n(T )) −→ inf,L2 e−2l ,Na e−n > N̆ ,aΦ(l, n) :=2L2 e−2l + α Na e−n − N̆ , Na e−n 6 N̆ ,aгде(33)ca := cLa .ОбозначимS 0 := S 1 ,S R := S 2 ,D0 := D1 ,DR := D2 ,γ 0 := γ 1 ,γ R := γ 2 ,Ω0 := Ω1 ,ΩR := Ω2 ,ω 0 := ω 1 ,ω R := ω 2 .Выпишем первые интегралыΨR,0i , i = 1, 2, 3,(34)для расширенной системы21(33),dτ= −1dtсu≡Rиu ≡ 0:Ψ01 (h, τ ) = he−γh τ ,−γh τΨR+1 (h, τ ) = heR1 − e−γh τ ,γhZ10 (h, τ, s) = Ψ01 (h, τ )eγh s ,R γh s(e− 1) ,γhγl+1 − e−rl τ +rlZτR,0−rl s+ e fl Z1 (h, τ, s) ds,γh sZ1R (h, τ, s) = ΨR−1 (h, τ )e−rl τΨR,02 (l, h, τ ) = le0γl rl srl s(e − 1) −Z2R,0 (l, h, τ, s) = ΨR,0−2 (l, h, τ )erlZsR,0rl s−rl ξ− ee fl Z1 (h, τ, ξ) dξ,(35)0γn−rn τΨR,0+1 − e−rn τ +3 (l, n, h, τ ) = nernτZτZR,0+ e−rn s fn Z1R,0 (h, τ, s) ds + ca e−rn s − Z2 (l,h,τ,s) ds.00ТогдаR,0R,0L2a e−2Ψ2 (l,h,τ ) , Na e−Ψ3 (l,n,h,τ ) > N̆ ,2R,0R,0R,02−2Ψ(l,h,τ)−Ψ(l,n,h,τ)23S (l, n, h, τ ) =La e+ α Na e− N̆ ,R,0Na e−Ψ3 (l,n,h,τ ) 6 N̆ ,где(36)∂S R,0R,0>∇(l,n,h) S (l, n, h, τ ), (0, 0, 1)=(l, n, h, τ ) =∂hR,0R,02 −2ΨR,02 (l,h,τ ) ·Ψ(l, h, τ ), Na e−Ψ3 (l,n,h,τ ) > N̆ ,−2Lea2hR,0R,0R,02−2Ψ(l,h,τ)(37) − 2 La e 2(l, h, τ ) + αNa e−Ψ3 (l,n,h,τ ) ·· Ψ2h=R,0−ΨR,0(l,n,h,τ )3· Ψ3(l, n, h, τ ) · Na e− N̆ ,hR,0Na e−Ψ3 (l,n,h,τ ) 6 N̆ ,R,0R,0частные производныеΨ2(l, h, τ ), Ψ3(l, n, h, τ ) могут быть выhh22Рис.
4. Сечения множествременныхD0 ,γ 0 ,DR ,γ R , рассматриваемых в четырехмерном пространстве пе(L, N, h, τ ), плоскостью, заданной уравнениями N = N 0 , τ = τ 0 при фиксированныхN 0 ,τ 0 .числены с помощью соотношений (35). Представления множествDR,0 ,γ R,0получаются из определений (13),(34) с использованием (35),(37).Утверждение 1.rl − rnВ случаеλl< ca e−l ,λnγl + fl h,l = const >rlh = const >R,γh(38)справедливы Предположение и требованиет. е.
мы приходим к алгоритму оптимального синтеза из Разделадиссертации. В случае3(20),1.2.1rl − rn > ca e−lλl,λnl = const <γl + fl (h),rlh = const ∈ (−κ, 0),(39)справедливы Предположение и требованиет. е. мы приходим к алгоритму оптимального синтеза из Разделадиссертации.3(21),1.2.2Вопрос аналитической проверки условий, обеспечивающих применимостьрезультатов Раздела 1.2.3 диссертации к задаче (33), остается нерешенным. Однако, действуя неформально, можно проводить численную проверку для имеющихся конкретных значений параметров.Основные результаты Главы 1 опубликованы в работе [1].23В Главе 2 с помощью методологии, изложенной в Главе 1, исследуется задача оптимального управления в математической модели, которая описываетдинамику роста злокачественной опухоли вместе с соответствующей реакциейиммунной системы при воздействии химиотерапевтического агента и основанана модели Н.
В. Степановой. Учитывается негативное влияние химиотерапевтического агента как на опухолевые, так и на иммунокомпетентные клетки; приэтом, как и в математической модели терапии лейкоза из Главы 1, рассматриваются монотонно возрастающие функции терапии. Динамика самого химиотерапевтического агента задается стандартным линейным фармакокинетическимуравнением, в отличие от ряда работ У. Ледзевич и Х.
Шаттлера, где оно отсутствует. Задача состоит в отыскании стратегии лечения, оптимальной с точкизрения минимизации объема опухоли и в то же время поддержания иммуннойреакции не ниже фиксированного допустимого уровня настолько, насколько этовозможно.В Разделе 2.1 дана постановка указанной задачи оптимального управления. Пустьиhx— объем опухоли,y— плотность иммунокомпетентных клеток— концентрация химиотерапевтического агента.
Динамика роста злокачественной опухоли вместе с соответствующей реакцией иммунной системы привоздействии химиотерапевтического агента описывается системойЗдесьx∞dxx∞=µxln− ρ1 xy − f1 (h)x,1dtxdy= − (µ2 x(βx − 1) + ρ2 + f2 (h)) y + α,dt dh = −γh h + u(t), 0 6 t 6 T.dt— вместимость (потенциальная емкость) опухоли, µ1(40)иαопределяютскорости роста численностей опухолевых и иммунокомпетентных клеток соответственно,ρ1иρ2— показатели их смертности, выражениес положительными параметрамиµ 2 ,β−µ2 x(βx − 1)yописывает взаимодействие между двумятипами клеток, т. е. зависимость иммунной реакции от численности опухолевыхклеток.
Негативное влияние химиотерапевтического агента на опухолевые и им24мунокомпетентные клетки задается функциями терапиинем дифференциальном уравненииγhf1 (h),f2 (h).В последможно интерпретировать как параметрдиссипации химиотерапевтического агента, аu(·) ∈ L∞ ([0, T ], R)— управляющая функция, представляющая поступление препарата в организм пациента.Допустимые управления удовлетворяют ограничению0 6 u(t) 6 R ∀t ∈ [0, T ]с фиксированной положительной константой(41)R.Пустьf1 (h) := a1 f0 (h),f0 : [h, +∞) → Rf2 (h) := a2 f0 (h),(42)— непрерывно дифференцируемая функция,f00 (h) > 0 ∀h > h(т.
e. функции терапии строго возрастают приные константы,hbгдеa1 , a2— положитель— отрицательная константа. Например, можно положитьf0 (h) :=гдеh > h),h,b+h(43)— положительная константа.Оптимальное управление заключается в достижении точной нижней гранигладкой целевой функцииΦ1конечный момент времениΦ1 (x(T ), y(T )) :=от фазовых координат системы в фиксированныйT > 0:x2 (T ),y(T ) > y^,−→Здесь параметр−→x2 (T ) + A (y(T ) − y^)2 , y(T ) 6 y^y^ характеризуетinfu(·) ∈ L∞ ([0,T ],[0,R])(44).приемлемый уровень иммунной реакции,A—достаточно большая положительная константа.С помощью замены переменныхc := lnx∞x(45)25мы приходим к задачеdc= −µ1 c + ρ1 y + f1 (h), dtdy= − µy e−c (βy e−c − 1) + ρ2 + f2 (h) y + α,dt dh = −γh h + u(t), 0 6 t 6 T,dt(46)гдеµy := µ2 x∞ ,βy := βx∞ .(47)При этом целевая функция (44) преобразуется к видуΦ(c(T ), y(T )) :=x2 e−2c(T ) ,∞y(T ) > y^,−→x2 e−2c(T ) + A (y(T ) − y^)2 , y(T ) 6 y^∞−→infu(·) ∈ L∞ ([0,T ],[0,R])(48).Очевидно, что открытая областьG :=сильно(c, y, h) ∈ R3 : c > 0, y > 0, h < h < h ,Rh = const < 0, h = const >,γhинвариантнаотносительно(41).
В случае (43) будем считать, чтоуправляемой−b < h < 0.системы(49)(46),Далее рассматриваютсятолько допустимые фазовые траектории, проходящие вG.В Разделе 2.2 с помощью принципа максимума Понтрягина выведеныдостаточные условия для существования у оптимального управления не болееодного и не более двух переключений при отсутствии участков особых режимов.В Разделе 2.3 получены вспомогательные оценки для допустимых фазовых траекторий управляемой системы (46),(41).Раздел 2.4 посвящен синтезу оптимального управления в задаче (46),(41),(48). Аналитические представления для поверхностей в расширенном фазовомпространстве, на которых совершается последнее переключение, получены с26помощью первых интегралов−1сu≡RиΨR,0i , i = 1, 2, 3,расширенной системы (46),dτ=dtu ≡ 0:uR,0= he+1 − e−γh τ , uR := R, u0 := 0,γhuR,0 γh sR,0R,0γh sZ1 (h, τ, s) := Ψ1 (h, τ )e−(e − 1) ,γhR,0R,0−c−cg (c, h, τ, s) := −µy eβy e − 1 − ρ2 − f2 Z1 (h, τ, s) ,τZ g R,0 (c, h, τ, s)ds −ΨR,02 (c, y, h, τ ) = y expΨR,01 (h, τ )−γh τ(50)0sZτZ− α exp g R,0 (c, h, τ, ξ)dξ ds,00 µ1R,0 − γh−ΨR,0(c,y,h,τ)=cγh+uh3Zh−µ 1R,0 1− γh(ρ1 y + f1 (η)) γh η − udη.0Отсюда имеемS R,0 (c, y, h, τ ) =ρ12x∞ exp −2 ΨR,02 (c, y, h, τ ) −µ1 µρ1 − 2ΨR,0(c, y, h, τ ) ΨR,0(c, y, h, τ ) 1 ,31ΨR,0^,2 (c, y, h, τ ) > y=ρ1x2∞ exp −2 ΨR,02 (c, y, h, τ ) −µ1 µρ1 R,0R,0− 2Ψ3 (c, y, h, τ ) Ψ1 (c, y, h, τ ) 1 +2R,0^.+ A Ψ2 (c, y, h, τ ) − y^ , ΨR,02 (c, y, h, τ ) 6 yПредставления множествDR,0 ,γ R,0(51)выводятся с использованием соотношений(50),(51).В предположениях Раздела 2.3 сформулирован алгоритм синтеза оптимального управления (по аналогии с Разделами 1.2.1,1.2.2).27В Разделе 2.5 приведены результаты численного моделирования.















