Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 51
Текст из файла (страница 51)
Если имеется какое-либо отклонение, то к системе 8 прила- ") Проблема устойчивости регулируемых систем отнюдь не связана с рассмотрением только аийейных уравнений, (Прим. ред.) 81 задачи Регтлиговъния с овглтной связью гается корректирующий сигнал у=у(х,ш,7), стремящийся изменить х((), чтобы оп оказался более близким к гв(1). Аналитическое описание простой системы регулирования л'~Ф/ Рис. 77. с обратной связью этого типа таково. Вместо .исходного уравнения, описывающего систему — =д(х,7), х(0)=с, (8.3) мы имеем новое уравнение — = /г (х, Ау), х (О) = с, (8.4) где у должно быть выбрано (при наличии определенных ограничений) так, чтобы минимизировать некоторую функцию, которая оценивает как затраты из-за отклонений х(~) от вектора желаемого состояния ш(Е), так и затрааы на приложение вектора управлений у (7).
Следуя нашему обычному подходу к вариационным проблемам, мы будем рассматривать эти задачи (которые могут быть сформулированы как задачи, входящие в сферу применения вариационпого исчисления) как многошаговые процессы решения непрерывного типа.
Однако, как указывалось выше, для вычислительных целей и для обхода трудностей, связанных со строгим обоснованием, мы будем рассматривать только дискретные варианты. 820 пгопгссы явгглияовышя с овиатной связью [гл, шп 4, ВРЕМЕННОЕ ЗАПАЗДЫВАНИЕ Во многих случаях использование вспомогательного шага сравнения и факт приложения управляющих сил вводят в задачу времешгбе запаздывание. Это означает, что у(~) в действительности зависит не от х(1) и ш(г), а скорее от х(г — б) и ш(Ь вЂ” б), или чаще еще более сложным образом зависит от предыстории процесса. Это реалистичное соображение вносит некозорые очень интересные математические усложнения, которые, однако, мы не будем здесь рассматривать. Ссылки на мнопае статьи по этому вопросу могут быть нзйдены в конце главы, б. ФОРМУЛИРОВКА ВАРИАЦИОННЫХ ЗАДАЧ Предположим, что ш(Ь) есть вектор желаемого состояния и что й[х(1) — ш(1)]гь+о(п) есть мера отклонения ж от ш на интервале времени [Е «+ й[.
Функционал г ,/(у) = 1 Ь (х — ш) й принимается тогда за полную меру отклонений, Как и в большинстве наших исследований, мы вводим адаптивную функцию полезности. Теперь имеется два способа учета реальных ограничений. Во-первых, мы можем предположнаь, что для управления имеегся ограниченное количество ресурсов; это приводит к ограничению вида ~ д (х, у) аУ ( Ьь а (8.6) Во-вторых, мы можем наложить ряд ограничений на уровень прилагаемых управлений гг(х, у)(0, г=1, 2,..., Д (8. 7) Рассмотрим далее вариационную задачу минимизации функционала у(у) при ограничении, задаваемом дифференциальным уравнением (8.4). Задача сформулирована теперь в обычных терминах вариационного исчисления. 321 71 Лпскгетшяй вхгихит б.
АНАЛИТИЧЕСКИЕ АСПЕКТЫ 7. ДИСКРЕТНЫЙ ВАРИАНТ Посколы<у мы собираемся предложить общий метод, мы должны рассмотрегь задачу в общем виде. Прелположим, что пужпо минимизировать функционал т .У(у) = $д(х, у) пг', о (8.8) где х и у связаны уравнением -„-'; = /г (х, у), х (0) = с, (8.9) и ограничениями т (а) ~с1г(х,у)г(1=-Ьо 1=1, 2... г, (8.! 0) о (Ь) гг(х, у) =О, 1=1, 2, ..., з, 0<1(7'. Вместо этой непрерывной вариационной задачи мы рассмотрим следуюгцую дискретную залачу. Минимизировать л )(у) = Ха ь" (х уа) (8.11) о=о по всем уы удовлетворяющим соотношениям хьн — — х,+ й,(х„, уь), х,=с, 11 Р. вьолиан.
С. Поовфтс (8.12) Как было указано в главе 1г, задачи описанного выше типа весьма трудны. Теи ие менее упорство, изобретательность и определенная доля удачи позволяют нам решить некоторые из пих. К песчзстью, огромное большинство вопросов, которые возпикаюг даже при упрощенной постщшвке задач о регулировании с обратной связью, пе совпадают с малым количеством доступных для решения задач. После этих вступительных замечаний, мы апрель посвятим пзшу энергию нахождению алгоритмов, которые приводят к численному решению. Как мы увидим, для достижения этой цели потребуется ревшть много аналитических вопросов. 822 пгопяссы ивгтлииования с овглтной связью (гл, чш и ограничениям (а) ~!т;(х„, у„)о-Ьп 1=1, 2, ..., г, (8.1 3) а=о (Ь)г;(хы уо)о-.0, г=1, 2, ..., а, 0(1г(Аг.
Мы можем либо рассматривать вектор с и величины Ьг как переменные, либо использоваоь множители Лагранжа и минимизировать .ч и ,У,(У)= ~~8(хы У„) — ~)ч ~, У;(хы Уо) (8.14) а=о о=о или, как делалось ранее, рассматривать. различные комбинации ситуаций. Все это представляет собой повторение того, что мы описзли в глзве У. 8, ФУНКЦИОНАЛЬНЫЕ УРАВНЕНИЯ рассматривая, например, задачу минимизации функционала (8,14), мы получим рекуррентное соотношение вида огм(с)= ш!п (д(с, у) — ~~Х,.д,.(с, у)+ г,.!с, х) о + г м, (с -!- Л (с, у))~, (8.15) Как и ранее, вычислительная осуществимосоь решения па этом пути зависит от размерности с. В дальнейшем мы рассмотрим различные способы, в которых может быль использован метод последовательных приближений. 9. ЗАДАЧА О РЕЛЕЙНОМ УПРАВЛЕНИИ Имеется следующая интереснзя задача с неявной функцией критерия.
Мы хотим минимизировать время, требуемое для перевода системы из одного состояния в другое. Эта .задача возникает во многих различных областях в разных внешних оформлениях. Простой частный случай ее заключается в следующем. Задана линейная система — = Ах + у, х (О) = с, (8.!6) 323 9] злдлчл о Рвлпйпом тпела.«анни где на компоненты у изложены ограничения ]У! ] - ' то ! = 1, 2, ..., т'тг. (8.17) Мы хотим определи!ь у так, чгобы минимизировать время, требующееся для перевода х из начального положения с в заданное, скажем в х=0. Если предполагается*), что у; могут принимать только значения .+лап то эта задача именуется задачей о релейном управлении («Ьапй-Ьапдя соп1го1). Этой задаче посвящено большое число теоретических работ, использующих различные методы. Однако проблема получения простого вычислительного алгоритма еще не решена. Если мы заменим (8.16) нелинейным уравнением — = д(х, у), х (0) = с, (8.18) то ситуация с!апет совсем другой.
Обозначим через г (с) минимальное время, требуемое для перехода от с в О. '!'огда имеем уравнение т (с) = пцп ]3+у (с+ дд(с, и))]+ о(ц), (8.19) е которое в пределе приводит к нелинейному дифференциальному уравнению в чзсю!ых производных ш1п(д(с, у), 8тадт)= — 1, где у подчиняется ограничениям (8.17), илн условиям перескока (у; = -1- лт!). Мы пользуемся некоторыми вект.орными обознзчениямн: пгад 7' есгь вектор, бя компонента которого равна — ; (х, у) = ~Ч '„хсу!, где х; и у;(! = 1, 2,..., 11!')— ду' дс; ' т=! соответственно компоненты х и у. Из этого соотношения можно извлечь большую информацию, но его общее решение — дело довольно тонкое. Так как в обе части уравнения (8.19) входит одна и та же функция, го численное решение может быть проведено с помощью либо последовательных приближений, либо при- *) Из принципа максим«ма 79 С, Понтрягина непосредственно следует, что при ограничейиях типа (3.17) управления зй могут в оппд!альном решении принимать только значения .«-мь (77рим.
ред.) 11' 824 пвоцвссы гвгтлнговлнпя с огялтной связью (гл. шп г'(с, Т) = пип ( Т (с + д(с, у) б, Т вЂ” д)) + о (б), (8. 21) Т(с, О) =)с ~, где ! с,' = ( '5~~ с-'; ) (8.22) ю=! Первое значение Т, для которого Т(с, Т)=0, и есть введенная выше функция Т(с). 10. ВЫКЛЮЧЕНИЕ ЯДЕРНОГО РЕАКТОРА Когда выключается тепловой ядерный реактор, присутствие продукта деления, йода, который, распадаясь, дает ксенон-13о, может вызвать повышение коггцеггграции ксепона в течение многих часов.
Это крайне нежелательно, так как может отсрочить па несколько часов моменг времени, в который реактор может быгь вновь запущен, что в результате приводит к потере эффективности. Один из путей преодоления этого дефекта состоит в использовании количества ядерно~о горючего, во много раз большего, чем это требуечся для создания критического соогношення, Другой путь заключаешься в тщательном регулировании процедуры включения с целью минимизации отравления реактора. Это и есть задача регулирования, которую мы хотим рассмотреть. Используя упрощенную модель реального процесса, мы предположим, что состояние реактора в любой момент времени может быть задано с помощью (а) (Ь) (с) потока нейтронов, в, концентрации йода, 1, концентрации ксенона,х, (8.23) ближенпй в просзранстве политик.
Другой подход можег быть осуществлен с помощью ляпис~венной задачи. Вместо исходной задачи рассмотрим вопрос об определении управления у, которое минимизирует расетояние от начала координат в конце интервала времени Т. Обозначая это минимальное расстояние через Т(с, Т), мы получим функциональное уравнение 325 Выключвпие ядпгного Реактовл Предположим, ч~о мы можем регулировать поток ней~ранов чг.
Уравнения, определяющие ! и х, имеют вид с'! (!г = сиу сгы! т(0) = с„ (8.24) к(0) =сс. с!.г — пс,т+ и,с! — (лс+ л,т) х лс Требуешься, чгобы погок нейтронов был сведен до нуля за время Ь, причем процесс начинается при (=О. В момент Ь состояние реактора задаегся условиями р(Ь)=О, )(Ь) = са, х(Ь) =се () (ь) (с) (8.25) Величины с, и сс являются функционалами от сс. После момента времени Ь концентрация ксенона может возрастать в течение нескольких часов благодаря нарушению равновесия концентрации, вызванному остановкой.