Лекции по ОУ (1050564), страница 6
Текст из файла (страница 6)
Получим:dK= −μK (t ) + V (t ) .dt(2.4.7)Обыкновенное дифференциальное уравнение (2.4.7) является модельюроста основных производственных фондов отрасли. Этот экономический процесс можно рассматривать как управляемый, если считать V (t ) управлением,K (t ) состоянием. На переменные состояния и управления следует наложить естественные ограничения:K (t0 ) = K 0 ,(2.4.8)K (t ) ≥ 0, t ∈ [t0 , t1 ],(2.4.9)Vmin ≤ V (t ) ≤ Vmax , t ∈ [t0 , t1 ] ,(2.4.10)где K 0 – заданное начальное значение основных фондов, Vmin ,Vmax – известныепостоянные, или зависящие от времени функции. Для оценки протекающегопроцесса введем в рассмотрение критерий качества:t1F (K (t ),V (t )) = α V (t )dt − βK (t1 ) .∫(2.4.11)t0Теперь можно сформулировать задачу оптимального управления: требуется найти пару (K (t ),V (t )), которая удовлетворяет уравнению (2.4.7), условиям(2.4.8) – (2.4.10) и доставляет минимум критерию качества (2.4.11).
Так какфункционал F состоит из двух слагаемых, то его минимизация означает, вопервых, экономию капиталовложений, а во-вторых, максимизацию K (t1 ) основных фондов в конце рассматриваемого отрезка времени (так как второе слагаемое входит со знаком минус). Числа α, β – это весовые коэффициенты,α > 0, β > 0 . Если α > β , то приоритет отдается первому требованию, если α < β– то второму.Пример 3. Оптимальное распределение капитальных вложений междуотраслями.Этот пример обобщает пример 2 на случай нескольких отраслей. Рассматривается процесс распределения основных производственных фондов между отраслями в течение некоторого промежутка времени.Пусть имеется n отраслей.
Обозначим через K j (t ) величину основныхфондов j -й отрасли в году t , μ j – коэффициент ежегодного выбытия фондов вj -й отрасли, V j (t ) – величину вводимых в действие в году t основных фондов26в j -й отрасли. Аналогично предыдущему примеру можно вывести уравнениебаланса основных фондов для каждой отрасли:dK j (t ) = −μ j K j (t ) + V j (t ), j = 1,K, n, t ∈ [t0 , t1 ].dt(2.4.12)В результате мы получим систему дифференциальных уравнений как модельизучаемого экономического процесса. В этой системеV (t ) = (V1 (t ), V2 (t ),K, Vn (t )) – вектор управления,TK (t ) = (K1 (t ), K 2 (t ), K, K n (t )) – вектор состояния.TДолжны быть известны основные фонды отраслей в начале исследуемогопромежутка времени:K i (t 0 ) = K i 0 ,i = 1,K, n .(2.4.13)Переменные управления и переменные состояния должны быть неотрицательны:Vi (t ) ≥ 0, K i (t ) ≥ 0, i = 1,K , n, t ∈ [t0 , t1 ] .(2.4.14)Суммарная величина вводимых в действие основных фондов должна быть ограничена:n∑V (t ) ≤ Vmax .j(2.4.15)j =1Критерий качества в данном случае будет иметь видF (K (t ),V (t )) =t1n∫∑t 0 i =1nα iVi (t ) dt − ∑ βi K i (t1 ) → min .(2.4.16)i =1Итак, задачу оптимального распределения капиталовложений между отраслями можно сформулировать как задачу оптимального управления для системы (2.4.12) при ограничениях (2.4.13) – (2.4.15) с критерием качества (2.4.16).Пример 4.
Оптимальное распределение капитальных вложений междупредприятиями.Пусть A – установленный фонд капитальных вложений, который нужнораспределить между n предприятиями. Будем считать, что показатель эффективности распределения определяется функциями ψ i ( yi ), а именно, если наi -м предприятии реализовались капитальные вложения в объеме yi , то значение ψ i ( yi ) отражает увеличение выпуска продукции на этом предприятии.Предполагается, что все функции ψ i ( yi ) возрастающие, т.е. ∀i = 1, n приdψ i0 ≤ yi ≤ A> 0 . Это означает, что эффективность реализации капитальныхdyiвложений увеличивается с увеличением объемов.
Очевидно, что оптимальное27распределение должно быть таким, чтобы общее увеличение продукции на всехпредприятиях было максимальным и чтобы заданный фонд капитальных вложений A был полностью израсходован. Поэтому будем иметь следующую математическую модель:n∑ ψ i ( yi ) → max ,(2.4.17)i =1n∑yi= A,(2.4.18)i =1yi ≥ 0, i = 1, n .(2.4.19)Модель (2.4.17) – (2.4.19) в общем случае представляет собой нелинейную задачу математического программирования, которая может быть сведена кдискретной задаче оптимального управления.
Введем обозначения:n = T , i = t + 1, yi = u (t ), ψ i ( yi ) = − f 0 (u (t ),t ) .Так как i = 1, K , n , то t = 0, K , T − 1 . Определим функцию x(t ) дискретной переменной t следующим образом:x(t + 1) = x(t ) + u (t ),x(0 ) = 0.Так как u (t ) = yi , то ограничение (2.4.18) преобразуется следующим образом:nT −1T −1t =0t =0∑ y = ∑ u(t ) = ∑ (x(t + 1) − x(t )) = x(T ) = A .ii =1Преобразуя (2.4.17), (2.4.19) согласно введенным обозначениям, придем к следующей задаче:x(t + 1) = x(t ) + u (t ), t = 0,K, T − 1,J=(2.4.20)x(0 ) = 0,(2.4.21)x(T ) = A,(2.4.22)u (t ) ≥ 0, t = 0,K, T − 1,(2.4.23)T −1∑ f (u(t ), t ) → min .0(2.4.24)t =0Это дискретная задача оптимального управления с суммарным критериемкачества для линейной системы с закрепленными концами.283.
ПРИНЦИП МАКСИМУМА ПОНТРЯГИНАЗадачи оптимального управления относятся к самым сложным экстремальным задачам. Наиболее эффективным методом исследования этих задачявляется принцип максимума Понтрягина [6], представляющий собой необходимое условие оптимальности. Это одно из крупных достижений современнойматематики, которое обобщает и развивает основные результаты классического вариационного исчисления.
Принцип максимума был сформулирован академиком Л.С. Понтрягиным в 1953 г. и в дальнейшем был доказан и развит имвместе с коллективом учеников и сотрудников.3.1. Доказательство принципа максимума для простейшей задачитерминального управленияПод простейшей задачей терминального управления понимают ЗОУ дляобыкновенной системы с закрепленным левым концом, с ограничением науправление и с терминальным критерием качества [7].
Рассмотрим наиболеепростой случай, когда задана линейная система. Запишем рассматриваемую задачу в компактной форме:dx= Ax(t ) + Bu (t ), t ∈ [t 0 , t1 ],dtx(t0 ) = x0 ,u (t ) ∈ U , t ∈ [t0 , t1 ],J ( x, u ) = ϕ( x(t1 )) → min .(3.1.1)(3.1.2)(3.1.3)(3.1.4)Здесь x(t ) ∈ E n , u (t ) ∈ E m (t ∈ [t 0 , t1 ] ) , A – матрица размерности n × n , B – матрица размерности n × m , U – ограниченное множество, x0 – заданныйn -вектор, ϕ( x ) – заданная непрерывно-дифференцируемая функция n переменных.Рассмотрим два допустимых управления u (t ) и u~ (t ) .
РазностьΔu (t ) = u~ (t ) − u (t ) называется приращением, или вариацией управления, управление u~ (t ) будем называть «возмущенным». Управлениям u (t ), u~ (t ) будут соответствовать траектории x(t ) и ~x (t ) , удовлетворяющие начальному условию29(3.1.2). Обозначим Δx(t ) = ~x (t ) − x(t ) . Эта разность называется приращениемтраектории. Очевидно, приращение траектории удовлетворяет дифференциальному уравнениюdΔx (t ) = AΔx (t ) + BΔu (t ) .dt(3.1.5)В самом деле, для траектории x(t ) имеем уравнение (3.1.1). Запишем уравнениепроцесса для ~x (t ) :d~x= A~x (t ) + Bu~ (t ) .(3.1.6)dtВычтем из равенства (3.1.6) равенство (3.1.1) и получим уравнение (3.1.5).
Такx (t0 ) = x(t0 ) = x0 , то приращение Δx(t ) удовлетворяет начальному условиюкак ~Δx(t0 ) = 0 .(3.1.7)Введем в рассмотрение следующую обыкновенную систему:dψ= − AT ψ(t ), t ∈ [t 0 , t1 ] ,dt(3.1.8)где ψ(t ) = (ψ1 (t ), ψ 2 (t ), K, ψ n (t )) – неизвестная вектор-функция.TОпределение 3.1.1. Система обыкновенных дифференциальных уравнений (3.1.8) называется сопряженной к (3.1.1), а ее решение ψ(t ), t ∈ [t0 , t1 ] – сопряженной траекторией. Компоненты вектора ψ (t ) называются сопряженными переменными.Будем рассматривать сопряженные переменные, которые удовлетворяютусловию∂ϕ ( x(t1 ))ψ (t1 ) = −,(3.1.9)∂x∂ϕгде– вектор-градиент функции ϕ :∂x∂ϕ ⎛ ∂ϕ( x ) ∂ϕ( x )∂ϕ( x ) ⎞⎟ .,,K,= ⎜⎜∂x ⎝ ∂x1∂x2∂xn ⎟⎠TЛемма 3.1.1.
Пусть Δx(t ) – приращение траектории системы (3.1.1) сначальным условием (3.1.2), соответствующее приращению управления Δu (t ) ,ψ(t ) – решение сопряженной системы (3.1.8) при начальном условии (3.1.9). Тогда имеет место равенство1d⎛ ∂ϕ( x(t1 ))⎞ 1 ⎛ dψ⎛⎞⎞, Δx (t1 )⎟ = ∫ ⎜, Δx (t )⎟ dt + ∫ ⎜ ψ(t ), Δx (t )⎟ dt ,−⎜dt⎠⎠⎝ ∂x⎠ t 0 ⎝ dtt0 ⎝ttгде (⋅, ⋅) означает скалярное произведение векторов.30(3.1.10)Доказательство.