rybalev optimal systems_(отсюда брал лекции) (842910), страница 10
Текст из файла (страница 10)
Этому допущению способствуетбольшое передаточное число редуктора.С учетом сделанных допущений описание объекта примет вид:ìx& 1 = k1x 2 ,íîx& 2 = k 2 u,(308)x 2 £ x 2 max ,(309)u £ u max ,(310)где x1 = j; x2 = w; u = I; k1 = 1 i ; k 2 = K e J ; x 2 max = 1,5wном ; u max = 3I ном .5.2. Оптимизация системы по быстродействиюРассмотрим задачу перевода системы (308) с учетом ограничений (309)и (310) из любого начального состояния в начало координат за минимальное69время. Необходимо найти такое управление, которое доставляло бы минимумфункционалуtкJ = t к = ò dt ,(311)0где tк - время переходного процесса.Поскольку постановка задачи содержит ограничения типа неравенств,для ее решения воспользуемся принципом максимума.По уравнениям объекта составим гамильтониан:H = -1 + y1k1x 2 + y 2 k 2 u.(312)Так как коэффициент k2 положителен, то при y2 ¹ 0 максимум гамильтониану доставляет управление:ìu = u maxíîu = -u maхприприy 2 > 0,(313)y 2 < 0,или то же самое в компактной формеu = u max sign (y 2 ) .(314)Сопряженные уравнения:¶Hy& 1 = = 0,¶x1¶Hy& 2 = = -k1y1 .¶x 2(315)(316)Из (315), (316) получаемy1 = C1 ,(317)y 2 = -k1C1t + C 2 ,(318)где С1, С2 - постоянные интегрирования, определяемые из начальных условий.При y2 = 0 управление не определено.
Рассмотрим, какие значения ономожет принимать в данном случае. Предположим, что функция y2(t) равна нулю на некотором интервале времени. В течение этого интервалаH = -1 + y 1 k 1 x 2 .(319)¶H= 0,¶x1(320)y1 = C3 =const.(321)y& 1 = -Поскольку функция y1(t) непрерывна, то С3 = С1, т.е. функция y1(t) постоянна в течение всего переходного процесса.
Согласно принципу максимумапри оптимальном управлении функция Н(t) максимальна и равна нулю. Поэтому из (319) следует, что на интервале, когда y2 = 0:701) x 2 = x 2 max = const ,2) y1 =(322)1, sign(y1 ) = sign(x 2 )k1x 2 max(323)и в силу второго уравнения системы (308)3) u = 0.(324)Кроме того, из постоянства y1(t) следует, согласно (318), что функцияy2(t) может обращаться в нуль не более чем на одном интервале (рис.16).Y2(t)Y2(t)tп tttпРис. 16. Возможные графики зависимости y2(t)Таким образом, установлено, что оптимальное управление может принимать три возможных значения: -umax, 0, umax, и число интервалов его постоянного уровня не превышает трех.
На последнем интервале управление должно принимать предельное значение, так как при u = 0, x 2 = x 2 max объект несможет достигнуть начала координат.Рассмотрим фазовые траектории объекта при всех возможных значениях управления.При u = umax из (308) получимx 2 = k 2 u max t + C 4 ,x1 =(325)k1k 2 u max 2t + k1C 4 t + C5 ,2(326)где С4, С5 - постоянные интегрирования, определяемые как начальные значения координат объекта на интервале.Из (325) получимt=x 2 - C4.k 2 u max(327)Подставим (327) в (326):71kk ux1 = 1 2 max2=2æ x 2 - C4 öx - C4çç÷÷ + k1C 4 2+ C5 =k 2 u maxè k 2 u max øk1C 24(328)k1k1x 22 + C5 =x 22 + C6 .2k 2 u max2k 2 u max2k 2 u maxЭто уравнение параболы с вершиной в точке x1 = C6.Аналогично можно показать, что при u = -umaxx1 = -k1x 22 + C7 .2k 2 u max(329)При u = 0 возможны два варианта движения системы:1) x 2 = x 2 max , x1 = k1x 2 max t + C8 ,(330)2) x 2 = - x 2 max , x1 = -k1x 2 max t + C9 .(331)На фазовой плоскости оба варианта представляются горизонтальнымипрямыми линиями, которые ограничивают область допустимых состоянийобъекта.На рис.
17 показаны фазовые траектории объекта, рассчитанные приследующих значениях постоянных: k1 = 1, k2 = 1, x2max = 1, umax = 1.Постоянные интегрирования выбраны равными:С6 = -2, -1, 0 при u = umax,C7 = 0, 1, 2 при u = - umax.При C6 = 0 и C7 = 0 фазовые траектории проходят через начало координат, т.е. через конечную точку процесса.
Обозначим через g+ участок фазовойтраектории при u = umax, C6 = 0 до точки {0,0}, а через g- - участок фазовойтраектории при u = -umax, C7 = 0 до точки {0,0} ( рис.17).Очевидно, что на заключительном этапе процесса движение объектадолжно происходить либо по линии g+, либо по линии g-, так как в противномслучае объект не попадет в начало координат.Выйти на линию g+ объект может только справа (с помощью отрицательного или нулевого управления), а на линию g- - только слева (с помощьюположительного или нулевого управления). Линия g = (g-,g+), «объединяющая»g- и g+, делит область допустимых состояний объекта на две зоны: слева находится зона, в которой управление должно быть положительным, справа - зона,в которой управление должно быть отрицательным.
На линиях x 2 = x 2 max иx 2 = - x 2 max управление должно быть нулевым.На рис. 17 также показана оптимальная траектория для начальных условий x1(0) = -2, x2(0) = 0 (кривая ABCO). Эта траектория включает участокположительного управления AB (разгон), участок нулевого управления BC(движение с постоянной скоростью) и участок отрицательного управления СО(торможение).72x22.52.522g-1.51.5CB110.50.500A¢AOu=-umaxu=umax-0.5-0.5D-1-1-1.5-1.5g-2-2-2.5-2.5-2.5-2.5-2-2-1.5-1.5-1-1-0.5-0.5000.50.5111.51.5+222.52.5x1Рис. 17. Фазовые траектории объектаОчевидно, что в общем случае число интервалов управления зависит отначального состояния объекта.
Например, если смещать точку А вправо по осиx1, длительность движения на участке нулевого управления будет уменьшаться. В предельном случае, когда процесс начинается с точки А¢, эта длительность равна нулю (траектория А¢СО). При дальнейшем смещении начальнойточки процесса к началу координат оптимальная траектория уже не будет содержать участка x 2 = x 2 max , а оптимальное управление - интервала u = 0.Наконец, в случае, когда начальная точка лежит на линии g, оптимальная траектория состоит всего из одного участка.Сформулируем полученные результаты, одновременно обобщив их длявсех состояний объекта (включая и недопустимые состояния x 2 > x 2 max ).Представление оптимального закона управления на фазовой плоскости показано на рис.
18. При его построении учитывалось, что управление должно«возвращать» объект в область допустимых состояний, если по каким-либопричинам последний его покинул.73x22.52.522u=01.51.5u = - umaxC11u = - umax0.50.5O00-0.5-0.5D-1-1-1.5-1.5u =umaxu =umaxu=0-2-2-2.5-2.5-2.5-2.5-2-2-1.5-1.5-1-1-0.5-0.5000.50.5111.51.5222.52.5x1Рис. 18. Представление закона управления на фазовойплоскостиСоставим алгоритм управления.
Для этого определим уравнение линииg и координаты точек С и D.Уравнение линии g найдем, объединяя уравнения (328) и (329) при С6 =0 и С7 = 0:ì k12xпри x 2 < 0,2ï 2k uï 2 maxx1 = ík1ïx 22 при x 2 > 0,ïî 2k 2 u max(332)илиx1 = -k1x2 x2 .2k 2 u max(333)k1x 22 max , x2 = x2max.2k 2 u maxk1Координаты точки D: x1 =x 22 max , x2 = -x2max.2k 2 u maxАлгоритм управления будет следующим.Координаты точки С: x1 = -74Если x1 < -k1x 22 max :2k 2 u maxìu max при x 2 < x 2 max ,ïu = í0при x 2 = x 2 max ,ï- uî max при x 2 > x 2 max .Если -(334)k1k1x 22 max £ x1 £x 22 max :2k 2 u max2k 2 u maxk1ìuприx+x 2 x 2 < 0,max1ï2k 2 u maxïk1ïx1 +x 2 x 2 = 0 и x 2 < 0 (γ + ),ï2k 2 u maxïu=ík1ï- u max при x1 +x 2 x 2 > 0,ï2k 2 u maxïk1ïx1 +x 2 x 2 = 0 и x 2 > 0 (γ - ).ïî2k 2 u maxЕсли x1 >(335)k1x 22 max :2k 2 u maxìu max при x 2 < - x 2 max ,ïu = í0при x 2 = x 2 max ,ï- uî max при x 2 > - x 2 max .(336)Для упрощения закона управления исключим из алгоритма условия,касающиеся движения по траекториям g-, g+ и x 2 = x 2 max , и сделаем кривую,изображенную на рис.
18 линией переключения управления с u = umax наu = -umax. Это оправдано по нескольким причинам. Во-первых, упрощается алгоритм управления. Во-вторых, технически невозможно точно реализоватьконтроль нахождения объекта на исключенных траекториях. В-третьих, «свободное» движение объекта при u = 0 на практике не будет проходить по линииx 2 = x 2 max вследствие действия на объект неучтенных возмущений. Применительно к рассматриваемой задаче оптимального управления электроприводом это означает следующее: при нулевом токе якоря момент, развиваемыйдвигателем, также равен нулю и не компенсирует приведенного момента нагрузки.
В результате привод получает некоторое ускорение. В зависимости отзнака приведенного момента изображающая точка вновь попадает либо в зонуu = umax, либо в зону u = -umax. Таким образом, реализовать вариант управленияu = 0 не имеет смысла.75Схема модели системы оптимального управления в Simulink показанана рис. 19.MATLABFunctionuk21sx2k11sx1MATLAB Fcnx1x2Рис.19. Модель оптимальной системы в SimulinkМодель содержит блок Matlab Fcn, вызывающий внешнюю функциюMatlab, которая в нашем случае реализует упрощенный алгоритм оптимального управления.Эта функция помещена в отдельный файл, имя которого заносится вблок Matlab Fcn, и содержит следующий код:function u = fun(x)global k1 k2 umax x2maxx1 = x(1);x2 = x(2);if x1 < -k1/(2*k2*umax)*x2max*x2maxif x2 < x2max, u = umax;else u = -umax;endelseif x1 <= k1/(2*k2*umax)*x2max*x2maxif x1+ k1/(2*k2*umax)*x2*abs(x2) <= 0, u = umax;else u=-umax;endelseif x2 < -x2max, u = umax;else u = -umax;endendДля простоты понимания код функции не оптимизирован.
Глобальныепеременные k1, k2, umax, x2max, содержащие значения соответствующих постоянных, могут быть определены как в командной строке Matlab, так и в отдельном script-файле.Графики переходного процесса и фазовая траектория при x1(0) = -2,x2(0) = 0, k1 = 1, k2 = 1, x2max = 1, umax = 1 приведены на рис. 20.76x1,x2x21.51.21x210.50.800.6-0.50.4x1-10.2-1.50-201234t-0.2-2.5-2-1.5-1-0.500.5x1Рис. 20. Переходный процесс в системеПодобно тому, как это сделано в примере 6, используем полученныерезультаты для построения оптимальной по быстродействию системы при задании конечной точки процесса вида x1(tк) = x1к ¹0, x2(tк) = 0.