Робототехника.Фу, Ли, Гонсалес (962794), страница 46
Текст из файла (страница 46)
фициенты передач обратных связей на двигатели в реальной системе. Алгоритм адаптации проводится на основе информации об ошибках между выходами заданной модели и выходами реальной системы. Общая блок-схема адаптивного управления системой по заданной модели приведена на рис.
5.13. Простое адаптивное управление по заданной модели для механических манипуляторов было предложено в работе 164). При анализе нагрузка принималась в рассмотрение в сочетании с конечным звеном и предполагалось, что размеры конечного звена малы по сравнению с длиной других звеньев. Таким образом, выбранная заданная модель обеспечивает эффективную и гибкую работу замкнутой управляемой системы по формиро. нацию желаемой траектории.
В качестве заданной модели для каждой степени свободы манипулятора робота выбирается линейное дифференциальное уравнение второго порядка, не зависящее от времени. Манипулятор управляется путем настройки 27П Рис, 5.13, Общая блок-схема адаптивного управления системой по заданной модели. 2Г и Ь,= — '. е>лг (5.8-2) а = —, г лг 27! них воздействий, таких, как величина нагрузки и др. Адаптивная схема, построенная по заданной модели, стабильно функционирует в широком диапазоне движений и нагрузок. После определения вектора у(1), описывающего динамику заданной модели, и вектора х(7), описывающего динамику манипулятора, 1-е сочленение заданной модели может быть описано следующим образом: а; у', (г) + Ь,у, (1) + у; (Г) = г, (1), (5.8-1) Коэффициенты а; и Ь, определяются из частоты собственных колебаний го,г и коэффициента демпфирования сг линейной системы второго порядка: В предположении, что при управлении манипулятором используются коэффициенты передачи обратной связи по положению и по скорости и что членами высоких порядков можно пренебречь, уравнение динамики манипулятора для г-го сочленения может быть записано в виде а; (!') х; (г) + 6, (г) х, (г) + х, (г) = г,.
(г), где аг(г) и [1,(!) — медленно изменяющиеся во времени параметры систелгы. Нас~райка коэффициентов обратной связи управляемой системы может быть произведена несколькими путями. Для минимизации квадратичной функции ошибки системы, определяемой различиями между динамикой реальной системы (уравнение (5.8-3)) и динамикой заданной модели (уравнение (5.8-1)), благодаря своей простоте используется метод градиентного спуска У,(е,)=1/2()ггег+)гг!е,+йоге,)е г=1, 2, ..., п, (5,8-4) этом находится на границе устойчивости.
Поскольку анализ устойчивости в данном методе затруднителен, в работе [64[ была исследована линеаризованная модель адаптивной системы, Однако возможность адаптации устройства управления прн больших силах взаимодействия между звеньями манипулятора для рассмотренного метода становится неоднозначной 5.8.2.
Адаптивное управление с авторегрессивной моделью В работе [!50[ предложено адаптивное самонастраивающееся устройство управления, использующее авгорегрессивную модель для установления соответствия между входными и выходными параметрами манипулятора. Алгоритм управления предполагает, что силы взаимодействия между сочленениями где е, = у; — х, и значения весовых коэффициентов )г! выбираются из условий получения стабильности работы системы Используя метод градиентного спуска, настройку параметров системы, минимизирующую ошибку системы, можно описать следующими выражениями.
а, (г) = [lгее! (7) + lг!е, (г) + )г',е, (!)1 [(г,,'й, (г) + (г,'и, (г) + (г'и,(г)~ (5,8-5) [3! (г) = [Маге! (г) + Ь',е, (г) + йоге,. (г)1 [)ге!У! (7) + й',гЬ,. (г) + )гоги. (г)1, (5.8-6) где иг(!) и иг(!), а также их производные описываются из решения следующих дифференциальных уравнений: а; й, (!) + Ь;й, (г) + и, (г) = — у, (г), (5.8-?) а, ву! (г) + Ь,гЬ! (г) + ге!(г) = — у, (7). (5.8-8) Величины уг(г) и у,(г) представляют собой две первые производные по времени из уравнения динамики заданной модели, В замкнутой адаптивной системе решение уравнений заданной модели используется для получения желаемого входа. Таким образом, для получения значений и,(!) и вг(!), а также их производных в уравнениях (5.8-5) и (5.8-6) решаются дифференциальные уравнения (5.8-?) и (5.8-8).
Наконец, решая дифференциальные уравнения (5.8-5) и (5.8-6), получаем значения аг(г) и [);(7). Одним из наиболее важных преимуществ такого метода управления является отсутствие сложной математической модели, однако стабильность замкнутой адаптивной системы при 272 Рис. 3.!4. Адаптивное управление с авторегрессивной моделью, ничтожно малы. Блок-схема системы управления приведена на рис, 5.14, Обозначим входной момент на Ьм сочленении через иь а выходное угловое положение манипулятора — через уь Пара входного и выходного параметров (иь у!) может быть описана авторегрессивной моделью, которая приводит эту пару как можно в более близкое соответствие: у, (гг) = х '(а, у, ()г — т) + Ь, и,.
()г — т)1+ а,. + е, ()г), (5,8-9) и!=1 где а'. — постоянная силы, ег(Ь) — ошибка моделирования, которая по предположению описывается белым шумом с гауссовским распределением и не зависит от и; и у,()г — т), т ) 1, Параметры а, и Ь," определяются таким образом, чтобы полу- 2?з чить наилучшее совпадение наименьших квадратов изме е й р нно пол ч р р . етров входа и выхода. Эти параметры могут бы ь олучены путем минимизации следующего критерия: т Ед (а,.) = — 1 ~~ е',.
(lг), (5.8-10) о-о где М вЂ” число измерений. Пусть со, является 1-м парамет ическим вектором Р г о а ф(Й вЂ” 1) — вектор пары входного и выходного воздействия ф;(й — 1) = (й и) и (й 1) и (й п))т (5 8 !2) Тогда рекурсивная оценка по наименьшим квадратам соо определяется выражением (5.8-11) а, (М) =а,. (М вЂ” 1)+ Р,.
(М) ф,(М вЂ” 1) [и,(М) — ат(М вЂ” 1) ф,(М вЂ” 1)[ (5.8-13) в котором 1 [ Рг(М вЂ” ЦЧЬ()У вЂ” Ц$; (Ж вЂ” Ц Р;(М вЂ” Ц и, Р,+~,(м — цР (м-ц4 (м — ц (5,8-1 4) г еб( «=1— эк д ( рч 1 — коэффициент «запоминания», обеспечиваю й споненциальное убывание предыдуших значений параметров во времени в алгоритме оценивания и возможность медленного изменения параметров, Р, — симметрическая ма постыл (2п+ 1) Х(2п+ 1), а /~ над ои обозначает оценку. Используя приведенные уравнения для вычисления оценок авторегрессивной модели, эту модель можно представить в виде д, (и) = й', ф, (й — 1) + е, (й), (5.8-1 5) Рабочий критерий для 1 го сочленения при определении опоных точек траектории имеет вид нии опор- 7~ (и) = Е ~ [д, (й + 2) — у',г(й + 2)]' + у,и', (й + 1) 1 ф,(й)), (5.8-1 6) 274 где [.] — вероятность выполнения процесса при наличии фо(п), а у; — неотрицательный весовой коэффициент, задаваемый пользователем.
Оптимальное управление, минимизирующее приведенный рабочий критерий, имеет вид — ь,'. (ь) и;(й + !) = ., ', 4 й,'(й) + й',(й) [йгф,(й)[ + [ь,'.(ь)[о + у, (. ' о о о-2 сг(чу, Я.~. 2 — ) -~- ~ ь,"о),о -о 2 — ) — д, (Ф.~-2)[, т 2 О$=-о (5.8-17) где аГ, Ьо и аà — оценка параметров из уравнений (5.8-13) и (5.8-14).
Таким образом, рассмотренное адаптивное управление использует авторегрессивную модель (уравнение (5.8-9)) для приведения в соответствие входных и выходных параметров манипулятора. Для выработки оптимального управления (уравнение (5.8-17)) сервомеханизмом манипулятора используется оценка параметров, которая производится с помощью рекурсивной схемы идентификации по наименьшим квадратам (уравнения (5.8-13) и (5.8-14)). 5.8.3. Адаптивное управление по возмущению В работах (159, 160) на основе теории возмушеяий был предложен метод адаптивного управления, который обеспечивает формирование траектории, максимально приближенной к заданной в каждый момент времени для широкого диапазона движений и нагрузок.
Адаптивное управление по возмущению отличается от предыдуших методов адаптивного управления тем, что в нем учитываются все силы взаимодействия между различными сочленениями. Рассматриваемое в этом разделе оптимальное управление базируется на линеаризованных уравнениях движения в окрестности номинальной траектории. Номинальная траектория определяется интерполированной траекторией сочленения, когда угловые положение, скорость и ускорение известны в каждый дискретный момент времени.
Нелинейные динамические уравнения высоких порядков линеаризуются относительно заданной траектории манипулятора с целью получения линеаризованной возмущенной системы. Управляемая система характеризуется наличием прямой и обратной связей, которые могут быть рассчитаны отдельно и одновременно. Прямая связь формирует номинальные моменты для компенсации всех сил взаимодействия между различными сочленениями при движении вдоль заданной траектории с помощью уравнений движения Ньютона — Эйлера, используемых в обратной задаче динамики манипулятора. Обратная связь формирует моменты по возмущениям, которые уменьшают ошибки манипулятора по 275 положению и по скорости до нуля вдоль заданной траектории.
Рекурсивная схема идентификации по наименьшим квадратам используется для эффективного определения параметров системы в реальном времени из уравнений возмущений. При управлении линеаризованной возмущенной системой вдоль заданной траектории используется одношаговый оптимальный закон управления. Для получения необходимого управляющего воздействия параметры и коэффициенты передачи обратной связи пересчитываются и настраиваются в каждый дискретный период времени. Таким образом, общий момент, управляющий двигателями сочленений, складывается из номинальных моментов, определяемых из уравнений движения Ньютона — Эйлера, и их моментов по возмущениям, вычисляемых по одношаговому опти.
мальному закону управления линеаризованной системой. Такой метод адаптивного управления позволяет свести задачу управления манипулятором от номинального управления к управлению линейной системой вдоль заданной траектории. Адаптивное управление основывается на линеаризованных уравнениях для возмущений относительно заданной траектории. Для построения устройства управления с обратной связью с целью вычисления моментов возмущения в сочленениях, уменьшающих ошибки по положению и по скорости вдоль заданной траектории, необходимо продифференцнровать соответствующие линеаризованные уравнения возмущений.
Уравнения движения Лагранжа — Эйлера п-звенного манипулятора могут быть выражены в пространстве состояний в виде уравнений (5,4-4). В такой постановке задача управления формулируется как нахождение закона управления по обратной связи п(1)= ц[х(1)], такого, что замкнутая система управления х(г)=1(х(г), п[х(1)]) асимптотически устойчива и описывает максимально приближенную к желаемой траекторию в широком диапазоне нагрузок в каждый момент времени, Предположим, что заданное состояние х,(1) системы (уравнение (5.4-4)) определено заданной траекторией, а соответствующие заданные моменты и.(1) получены из уравнений движения Ньютона — Эйлера.