Глава 7 (Учебник в электронном виде), страница 6
Описание файла
Файл "Глава 7" внутри архива находится в папке "Учебник". Документ из архива "Учебник в электронном виде", который расположен в категории "". Всё это находится в предмете "информационные устройства и системы" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "информационные устройства и системы" в общих файлах.
Онлайн просмотр документа "Глава 7"
Текст 6 страницы из документа "Глава 7"
Примером использования указанного подхода является стратегия управления роботом в такой недетерминированной задаче, как сопряжение цилиндрических объектов. Данная задача не решается с использованием обычных алгоритмов позиционного управления, поскольку невозможно составить точную геометрическую модель контактных поверхностей и их взаимного положения, да и сама траектория движения концевого эффектора не известна заранее, а формируется непосредственно в процессе движения. В то же время, при сопряжении цилиндрических объектов наблюдаются некоторые закономерности в распределении силовых факторов, которые могут быть использованы для определения характерных ситуаций. Экспериментальным путем установлено, что при сопряжении объектов в пространстве координат «сила-перемещение» возникают характерные распределения силовых факторов, не зависящие от размеров объектов.
Это соображение иллюстрируется на рис. 7.20. Здесь показаны графики изменения силовых факторов Fx, Fz и My в запястном СМД при осевой сборке по мере углубления вала в отверстие вдоль оси Z (подобная картина характерна и для других компонент векторов сил и моментов, измеряемых СМД). Численные значения переменных, вообще говоря, могут быть неизвестны, однако между ними существуют достаточно определенные соотношения. Анализ приведенных соотношений позволяет выделить ряд опорных точек, в окрестности которых происходит изменение контактной ситуации. Эти точки могут быть названы точками фазового перехода; они условно разделяют процесс сопряжения на ряд этапов - классов, для каждого из которых характерна определенная ситуация из числа возможных: свободный ход (0), фаска (I), одноточечный контакт (II), двухточечный контакт (III), заклинивание или завершение цикла (IV). Представление о фазовых переходах позволяет использовать логические принципы управления. В этом случае, создается система решающих правил, образующая базу знаний и содержащая описание конкретных состояний. Распознавание ситуации осуществляется на основании решающих правил, относящих ситуацию к тому или иному классу, что показано в таблицах на рис. 7.20. Обозначено: sign и | | - знак и величина действующей компоненты, , 0 и - направления ее изменения на данной фазе. Если в процессе сопряжения возникает распределение силовых факторов, соответствующее одному из перечисленных состояний, то оно идентифицируется в соответствии с имеющимся описанием в базе знаний. Стратегия управления роботом предполагает альтернативный выбор из нескольких типовых алгоритмов движения, определенных заранее для каждой из возможных ситуаций. Некоторая неопределенность в описании ситуаций может быть учтена с использованием аппарата нечетких множеств и операций нечеткой логики. Например, если в результате распознавания ситуация идентифицируется как двухточечный контакт, то движение манипулятора должно обеспечивать поворот захваченного объекта относительно отверстия в сторону уменьшения возникшего момента.
Отметим, что представленный подход позволяет «интеллектуализировать» сенсорную функцию, т.е. вынести задачу распознавания непосредственно на уровень СМД.
Недостатком данного подхода является необходимость априорного задания всех возможных ситуаций и соответствующих им правил - продукций, определяющих соответствующий алгоритм управления. Если же число возможных ситуаций велико, заранее составить такое описание весьма сложно. Особенно большие затруднения характерны для случаев, когда при выполнении задачи возникают ситуации, которые заранее не были описаны вовсе. В связи с этим в рамках ситуационного управления разрабатываются способы обучения, позволяющие роботу самостоятельно формировать как признаки ситуаций, в том числе и не заданных заранее экспериментатором, так и способы поведения в новых условиях.
Р ешение поставленной проблемы может быть найдено при использовании для реализации ССО нейронных структур - нейросетей. К их достоинствам относится возможность обучения на основе признаков различной сенсорной модальности и высокая надежность распознавания, особенно для случаев со значительным разбросом значений определяемых параметров. В рассмотренном примере при построении словаря (вектора) признаков (т.е. некоторых дискрипторов, необходимых для описания классов) можно использовать вариации значений силовых факторов (рис. 7.20). Тогда функционирование ССО должно заключаться в соотнесении полученного при работе вектора признаков тому или иному классу, характеризующему контактную ситуацию. Эта процедура основана на использовании сведений о знаке (sign(…)) и скорости изменения (, и ) абсолютных значений силовых факторов Fx, Fz и My. Обучение нейросети обычно предполагает использование учителя, который сначала формирует априорный словарь признаков и соответствующий ему априорный алфавит классов, которые в процессе обучения могут модифицироваться. В качестве такого алфавита используются типы контактных ситуаций. Системе предлагается некоторый набор признаков, а также задаваемый учителем класс контактной ситуации. На основе этой информации ССО составляет описание классов на языке признаков. При традиционном подходе эти описания хранятся в базе знаний, в случае же нейросети они представляют собой некоторые веса синапсов. Если характеристики работы такой системы оказываются неудовлетворительными (например, время распознавания ситуаций получается недопустимо высоким), то учителю необходимо выделить более существенные признаки и более существенные классы.
Н е вдаваясь в подробности построения нейросетей, рассмотрим только некоторые ключевые понятия. Основу нейросети составляют относительно простые, однотипные элементы (ячейки), имитирующие работу нейронов мозга (рис. 7.21). По аналогии с нервными клетками головного мозга каждый нейрон характеризуется своим текущим состоянием и может быть возбужденным или заторможенным. Он обладает группой однонаправленных входных связей - синапсов, соединенных с выходами других нейронов, а также имеет аксон, связывающий его с синапсами следующих нейронов. Каждый синапс характеризуется величиной синаптической связи или весом wi, который по физическому смыслу эквивалентен электрической проводимости.
Текущее состояние нейрона определяется, как взвешенная сумма его входов xi:
Выход нейрона есть функция его состояния: y = F(). Нелинейная функция F называется активационной и может иметь различный вид (рис. 7.22). Чаще всего используется нелинейная функция с насыщением, называемая логистической функцией или сигмоидом:
П ри уменьшении сигмоид становится более пологим, и в пределе при = 0 вырождается в горизонтальную линию на уровне 0,5. При увеличении сигмоид приближается по внешнему виду к функции единичного скачка с порогом T в точке x = 0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Простейшей нейросетью является перцептрон - сеть, нейроны которой имеют активационную функцию в виде единичного скачка. На рис. 7.23 показан однослойный трехнейронный перцептрон. На n входов поступают некие сигналы, проходящие по синапсам на 3 нейрона, образующие единственный слой этой нейросети и выдающие три выходных сигнала:
Все весовые коэффициенты синапсов одного слоя нейронов можно свести в матрицу W, в которой каждый элемент wij задает величину i-ой синаптической связи j-ого нейрона. Таким образом, процесс, происходящий в нейросети, может быть записан матричным уравнением вида: Y = F(XW), где X и Y - соответственно входной и выходной сигнальные векторы, F(V) - активационная функция, применяемая поэлементно к компонентам вектора V.
Итак, представим реализацию алгоритма распознавания контактной ситуации на базе нейросети. Рассмотрим тот же пример сопряжения цилиндрических объектов и ограничимся тремя компонентами: Fx, Fz и My. Тогда структуру блока распознавания получит вид, представленный на рис. 7.24. (Заметим, однако, что этот случай содержит все характерные признаки общей постановки задачи). Здесь используются 3 признака распознаваемых классов: приращения компонент Fx, Fz и My и 5 классов контактных ситуаций («свободный ход», «фаска», «одноточечный контакт», «двухточечный контакт», «заклинивание»). Таким образом, входной слой сети состоит из трех нейронов, выходной - из пяти. Включение данного блока распознавания в состав ССО позволяет распознать тактильную ситуацию, т.е. выдать на выход класс тактильной ситуации.
7.5. Организация управления роботом с силомоментным очувствлением
К ак уже отмечалось, характеристики ССО роботов должны выбираться исходя из параметров конкретного робота и особенностей технологической операции. Так, например, для большинства контактных задач свойственно временное замыкание и размыкание кинематической цепи. В этом случае, использование только позиционного или только силового управления недостаточно. Традиционным подходом является построение нескольких контуров регулирования. Если система управления является позиционной, то сигналами от СМД производится модификация номинальной траектории или скорости командами от СМД [ ]. Общая схема позиционно-силовой системы управления робота приведен на рис. 7.25.
Теперь рассмотрим влияние жесткости СМД С на динамику антропоморфного манипулятора с позиционно-силовой системой управления. Управление приводами в режиме замкнутой кинематической цепи производится по сигналам СМД, причем на каждом шаге движения выполняется решение прямой кинематической задачи - определение по обобщенным координатам q положения концевой точки манипулятора R. Если ССО построена в соответствии с концепцией «очувствленного запястья», то возникает необходимость проведения вычислений в трех координатных системах: системе координат СМД (здесь находится «центр измерений»), абсолютной системе координат робота OXYZ и системе обобщенных координат q. Запишем: R = J (q0) q. [ ], где матрица Якоби J(q0) размера (n6) определена для конфигурации манипулятора q0 и n - количество его степеней подвижности. Приведем вектор усилий F из центра измерений датчика в систему обобщенных координат. Сделаем допущение, что точка приложения вектора F приблизительно совпадает с центром измерений. Тогда, в соответствии с [ ] получим:
Fq(q0) = JТ (q0) F,
где Fq - вектор внешних сил, приведенный к обобщенным координатам исполнительного механизма. Принимая для простоты расчета, что жесткость собственно манипулятора См намного больше жесткости датчика C, т.е. уподобляя датчик некоторому упругому шестикомпонентному упору, получим:
Fq(q0) = Cq(q0) q,