Лекции по ОУ (1050564), страница 5
Текст из файла (страница 5)
Состояние на t + 1 -м шаге определяется конечно-разностным уравнениемx(t + 1) = f ( x(t ), u (t ), t ), t = 0,1, KT − 1,(2.3.1)где f = ( f1 , K, f n ) – заданная вектор-функция.В некоторых случаях бывает удобно записывать (2.3.1) в координатах:Tx1 (t + 1) = f1 ( x(t ), u (t ), t ),x2 (t + 1) = f 2 ( x(t ), u (t ), t ),Kxn (t + 1) = f n ( x(t ), u (t ), t ).Таким образом, (2.3.1) – это система конечно-разностных уравнений. Она называется линейной, если имеет видx(t + 1) = A(t )x(t ) + B(t )u (t ),где A(t ), B(t ) – матрицы размерности n × n и n × m соответственно.
Если этиматрицы не зависят от времени t , то мы будем иметь линейную стационарнуюдискретную систему.Последовательность u = {u (0 ), u (1),K , u (T − 1)} называется дискретнымуправлением.Дискретное управление называется допустимым, если оно удовлетворяетусловию(2.3.2)u (t ) ∈U ⊂ E m , t = 0,1,K, T − 1,где U – заданное множество в пространстве E m .21Предположим, что задано положение объекта в момент t = 0 , т.е. заданоначальное условиеx(0) = x0 .(2.3.3)В этом случае дискретное управление однозначно определяет соответствующую ему траекторию – решение системы (2.3.1).
Таким образом, дискретная траектория – это последовательность x = {x(0 ), x(1),K , x(T )}.Рассмотрим пару ( x, u ), где u – допустимое дискретное управление, x –соответствующая дискретная траектория. Такую пару будем называть допустимой. Пусть на множестве допустимых пар задан некоторый функционал J ( x, u ),который определяет качество процесса. Сформулируем задачу оптимальногоуправления. Требуется найти допустимое дискретное управление и соответствующую дискретную траекторию (т.е. решение задачи (2.3.1) – (2.3.3)), которыедоставляют минимум функционалу J ( x, u ) . Функционал J ( x, u ) называетсякритерием качества.
Решение сформулированной задачи называется оптимальным управлением и оптимальной траекторией. В краткой записи эта задача выглядит следующим образом:x(t + 1) = f ( x(t ), u (t ), t ), t = 0,1, K, T − 1 ,x(0 ) = x0 ,u (t ) ∈ U , t = 0,1, K , T − 1,J ( x, u ) → min .(2.3.4)(2.3.5)(2.3.6)(2.3.7)Здесь левый конец траектории закреплен, а правый свободен. Другие задачи, соответствующие различным режимам на концах траектории, определяются точно так же, как в непрерывном случае. Аналогично можно задать ограничения на управление, фазовые и смешанные ограничения.Наиболее часто встречающиеся в дискретных задачах критерии качествазадаются следующими функционалами:1) суммарныйJ ( x, u ) =T −1∑ F (x(t ), u (t ), t ) ,t =02) терминальныйJ ( x, u ) = Φ ( x(0), x(T )) ,3) смешанныйJ ( x, u ) =T −1∑ F (x(t ), u (t ), t ) + Φ( x(0), (x(T )) .t =0Дискретные задачи оптимального управления служат моделями для многих технических и экономических процессов управления.
Примеры таких моделей можно найти в [4], [5]. Однако дискретные задачи возникают не только какобъекты самостоятельного исследования. Очень часто к ним сводятся непрерывные задачи оптимального управления. Необходимость рассмотрения дис22кретных аналогов непрерывных систем возникает почти всегда при численномрешении непрерывных задач управления.Возможны различные, в смысле точности или простоты, переходы к дискретной аппроксимации. Приведем наиболее простой способ.
Пусть заданодифференциальное уравнениеdy= f ( y, v), τ ∈ [0, T ] ,dτ(2.3.8)где y = y (τ) – n-вектор состояния, v = v(τ) – вектор управления.Зафиксируем натуральное число N и положим h = T / N . Будем придавать аргументу τ лишь значения 0, h,2h,K Nh = T и введем дискретный аргумент поформулеt = τ/h .Таким образом, t будет принимать значения 0,1,2,…,N. Вместо переменных y, vвведем новые переменные x, u по формуламx(t ) = y (th) = y (τ),(2.3.9)u (t ) = v(th) = v(τ).(2.3.10)Дифференциальное уравнение (2.3.8)ным:заменим приближенным разност-y (τ ) − y (τ − h)= f ( y (τ − h), v(τ − h)) .h(2.3.11)Будем рассматривать это уравнение лишь для значений τ = h, 2h,..., Nh.Из (2.3.11) получим:y (τ) = y (τ − h) + hf ( y (τ − h), v(τ)),или, в силу (2.3.9), (2.3.10),x(t ) = x(t − 1) + hf ( x(t − 1), u (t − 1)) , t =1, 2, …, N.Это и есть дискретный аналог непрерывной системы.Если рассматривается непрерывная ЗОУ с критерием качестваTJ ( y, v) =∫ f 0 ( y(τ), v(τ))dτ + Φ( y(T )),0то при построении дискретного аналога он преобразуется в суммарный критерий:J ( x, u ) = hN −1∑ f 0 ( x(t ), u(t )) + Φ( x( N )).t =023Обратно, если мы имеем дискретную задачу оптимального управления, товсегда можно построить ее непрерывный аналог.
Пример такого построениясодержится в [4].2.4. Примеры задач оптимального управления экономическимисистемамиПример 1. Однопродуктовая модель оптимального развития экономики.Обозначим через X количество валового объема продукции, производимого в единицу времени (интенсивность выпуска валовой продукции), через C– интенсивность потребления. Однопродуктовая динамическая макроэкономическая модель Леонтьева представляет собой балансовое соотношениеX = aX + bdX+C.dt(2.4.1)Соотношение (2.4.1) показывает, как валовая продукция X распадаетсяна три составляющие. Первая составляющая, aX , – это производственные затраты, которые пропорциональны выпуску продукции X ( a – коэффициентdXпроизводственных материальных затрат).
Вторая составляющая, b, – приdtрост основных производственных фондов. В этой модели предполагается, чтоамортизационные отчисления отсутствуют, и все валовые капитальные вложения идут на ввод в действие новых основных производственных фондов. Приэтом считается, что капиталовложения пропорциональны приросту выпускапродукции в данном году (b – коэффициент приростной фондоемкости). Третьясоставляющая, C , – это непроизводственное потребление.Предположим, что рассматривается развитие экономики на отрезке времени от t0 до t1 (например, за t1 − t0 лет).
Согласно (2.4.1), при каждом значении t экономический процесс на макроуровне может быть описан уравнениемdX 1 − a1=X (t ) − C (t ) .dtbb(2.4.2)Это обыкновенное дифференциальное уравнение относительно X (t ) . Так какколичество производимой продукции определяется потреблением, то непроизводственное потребление можно считать движущей силой экономическогопроцесса. Перенося это на язык математики, можно сказать, что в уравнении(2.4.2) C (t ) – это управление, а X (t ) – состояние экономической системы.
Естественно предположить, что известно начальное состояние системы, то есть интенсивность валового выпуска в начальный момент времени. Переменные состояния X (t ) в этой системе, конечно же, неотрицательны, а величина потребления C (t ) может изменяться только в каких-то определенных границах. Такимобразом, имеем следующие ограничения для управляемого процесса (2.4.2):X (t 0 ) = X 0 ,24(2.4.3)X (t ) ≥ 0, t ∈ [t0 , t1 ],Cmin ≤ C (t ) ≤ Cmax , t ∈ [t0 , t1 ] .(2.4.4)(2.4.5)Рассматриваемый процесс управления должен быть организован так, чтобы потребление было как можно больше, и в то же время в конечный моментвремени должна быть высокой интенсивность выпуска продукции, что означаетнакопление производственного потенциала. Критерий качества процесса, предусматривающий эти требования, может быть выражен функционалом видаt1J ( X (t ), C (t )) = α e − δt C (t )dt + β X (t1 ) → max .∫(2.4.6)t0Здесь первое слагаемое – это суммарное взвешенное потребление на промежутке [t0 ,t1 ]; второе слагаемое – интенсивность выпуска в конечный момент времени, α, β – весовые коэффициенты.
Если предпочтение отдается потреблению,то α > β , а если предпочтение отдается накоплению производственного потенциала, то α < β . Подынтегральное выражение e − δt C (t ) – дисконтированное потребление, e − δt – взвешивающая функция, δ – коэффициент дисконтирования.Таким образом, мы рассмотрели экономическую задачу управления процессомраспределения валового продукта, моделью которой служит однопродуктоваядинамическая макроэкономическая модель Леонтьева.
Если при этом ставитсяцель роста потребления и наращивания экономического потенциала, то эта задача становится задачей оптимального управления. Полученная задача оптимального управления состоит в нахождении состояния X (t ) и управления C (t ) ,которые удовлетворяют уравнению (2.4.2), условиям (2.4.3) – (2.4.5) и доставляют максимум функционалу (2.4.6).Пример 2.
Оптимальное распределение капитальных вложений в отрасли. Обозначим через K (t ) величину основных производственных фондов в годуt . Если проследить их изменение за промежуток времени Δt , то величина ΔKприроста основных производственных фондов за этот промежуток будет равнаΔK = K (t + Δt ) − K (t ) .Рост основных производственных фондов происходит за счет капитальныхвложений. Однако за счет физического и морального износа количество ихуменьшается с течением времени. Обозначим через V (t ) интенсивность вводаосновных производственных фондов, т. е. количество вводимых фондов за единицу времени, например за год.
Будем считать, что величина выбытия фондов вгоду t пропорциональна K (t ) и равна μK (t ) , то есть величина μK (t ) – это интенсивность выбытия основных производственных фондов. Так как мы рассматриваем промежуток времени Δt , то за этот промежуток времени будет введено V (t )Δt единиц новых фондов, а количество выводимых из производствафондов составит μK (t )Δt единиц.25Таким образом, уравнение баланса основных производственных фондов будетиметь видK (t + Δt ) − K (t ) = V (t )Δt − μK (t )Δt .Поделим обе части этого равенства на Δt и устремим Δt к 0.