Диссертация (1090784), страница 14
Текст из файла (страница 14)
Следуетотметить, что возможным решением задачи взаимного уклонения роботов вданной ситуации мог бы стать метод потенциальных полей [31], однако оннедостаточно эффективен в случае, когда препятствие на пути роботаподвижно.Рис. 4.4. Определение приоритета движения в зоне конфликта двухробототехнических агентов101Поэтоймобильнымипричинеалгоритмыробототехническимиразрешенияагентамиконфликтовдолжнымеждуопиратьсянаопределение очередности движения в зоне конфликта и соответствующейкорректировке скоростей их движения.Так, на рис.
4.4 изображена типовая ситуация конфликта в движенииробототехнических агентов. При сохранении направления и скоростейперемещенияроботовихтраекториипересекутсячерезнекоторыйпромежуток времени в точке E. При этом, сравнивая отрезки BE и DE, можнозаключить, что робот 2 пересечет линию движения первого робота скорее,чем робот 1 пересечет маршрут второго. Очевидно, что роботу, потенциальноспособному первым выйти из зоны конфликта, должен быть предоставленприоритет в движении.4.2.2 Модельный пример прогнозного управления робототехническимиагентамиОписанный подход к прогнозу местоположений робототехническихагентов совместно с критерием выбора очередности их проезда былпротестирован на виртуальной модели с использованием программногокомплекса «RoboCar» для моделирования интеллектуального мобильногоробота, предназначенного для отработки технологий самообучения ипрогноза.
Свидетельство о государственной регистрации программы дляЭВМ приведено в Приложении Б.В ходе диссертационного исследования функциональные возможностикомплекса «RoboCar» были расширены за счет программных библиотек,входящих в состав комплекса «MARS 3D», описанного в п. 3.4. За счетиспользования двухмерной графической подсистемы в данном комплексебыла достигнута возможность проведения модельных экспериментов по102групповой транспортировке объектов целевого интереса в ускоренномрежиме.Пример расположения робототехнических агентов и предметов врабочей зоне, а также местоположения терминальной зоны транспортировкиизображен на рис.
4.5.Рис. 4.5. Интерфейс программного комплекса «RoboCar»РезультатымоделированияМАРС,состоящейиз5агентов,представлены на рис. 4.6. Сравнивая траектории движения мобильныхроботов при ситуационном управлении (суммарная длина пройденного пути282 м.) и траектории, полученные в результате прогнозного управления(суммарная длина пройденного пути 275 м.), можно заметить, что последнийвариант обеспечивает меньшую суммарную длину пути, проходимогороботами, а следовательно, меньшие затраты энергетических ресурсов имашинного времени.
Так, в частности, в рамках представленного примерасокращение суммарного пути, проходимого робототехническими агентами входе решения задачи, составило около 3%.Повышениеэффективностиврежимепрогнозногоуправленияобусловлено устранением ситуаций, при которых робототехническимагентам приходилось осуществлять движение задним ходом в целяхуклонения от попавшего в зону действия бортовых датчиков препятствия.103а)б)Рис.
4.6. Фрагменты моделирования движения автономных роботов в составе МАРС:а) движение без прогноза конфликтов; б) движение с прогнозом конфликтов4.3 Выявление и анализ структурных элементов внешней обстановкиавтономного робототехнического агентаВыявление структурных элементов окружающей обстановки приформировании второго уровня модели внешней среды, в соответствии с п.4.1, является необходимым условием обеспечения высокой степениавтономности робототехнического агента. В частности, способность краспознаваниюфункциональнойобъектоввнешнейспособностьюсредыавтономныхявляетсяроботов,важнейшейвыполняющихскладские и инженерно-строительные операции [30]; передвигающихся вбеспилотном режиме по автодорогам [53]; проводящих картографированиеучастков открытой местности и полостей инженерных сооружений [19].Эффективное решение проблемы распознавания объектов внешнейсреды заключается в оснащении автономного робота системой техническогозрения (СТЗ), включающей как необходимое аппаратное обеспечение,представленное одной или несколькими видеокамерами, установленными на104бортуробота,такипрограммно-алгоритмическоеобеспечениедляинтеллектуальной обработки поступающей визуальной информации.4.3.1 Модель нейронной сети для анализа визуальных образовОбеспечение высокой эффективности распознавания визуальныхобразов предполагает возможность их многоэтапного анализа с цельювыявления признаков, характерных для различных масштабов рассмотрения,включая цветовые характеристики, а также контуры объекта и составляющихего элементов.
При этом одним из перспективных методов распознаванияобъектов целевого интереса на изображениях является подход, основанныйна использовании нейронных сетей с иерархической связностью (НСИС) [46,55].ФактическиНСИСможетрассматриватьсякакмногослойнаянейронная сеть прямого распространения (МНСПР) с модифицированнымиспособами соединения и расчета входящих в ее состав нейронов.Развиваемый подход позволяет детектировать во входном растровомизображении значимые признаки, сложность которых возрастает с каждымуровнем иерархии нейронной сети. Выявленные признаки не толькоповышают точность классификации входных изображений, но могут бытьтакже использованы для генерации визуальных образов по наборувысокоуровневых признаков, путем многоэтапного их декодирования (чтоважно в целях интерпретации знаний выявляемых НСИС).Принцип построения нейронной сети с иерархической связностью,способной выполнять задачу многоэтапного анализа изображения, показан нарис. 4.7.
НСИС представляет собой многослойную нейронную сеть сколичеством слоев, равным L. Количество нейронов в слоях сети задаетсяцелочисленнымвекторомN {n1, , nL } .определяется по формуле:105Выходкаждогонейрона NwY xi wi , i 0(4.5)где xi – входные значения нейрона; wi – весовой коэффициенты связейнейрона со входными значениями; Nw – количество входов нейрона; сигмоидальная функция.Выходные значения нейронов в каждомслое организованы в информационные образыразмерности M 2 . При этом каждое j-оезначение в образе i-го слоя однозначноидентифицируетсяпаройpi , j xi , j , yi , j 2иликоординатженормализованныхпаройкоординатp*i , j {xi , j / Ai , yi , j / Bi } 2 , где Ai max xi , j , аjBi max yi , j .jКаждый нейрон в слое с порядковымi 1номеромсоединенснекоторымподмножеством значений из информационногообраза, принадлежащего слою i 1 .
НейроныпервогослоясоединенысоРис. 4.7. Структура нейроннойсети с иерархическойсвязностьюзначениямивходного информационного образа.Подмножество X i , j входных значений j-го нейрона i-го слоя (локальноерецептивное поле) определяется как прямоугольная область нижележащегоинформационного образакоординатыкоторойXi1 с началом в точке, нормализованныесовпадаютснормализованнымикоординатамирассматриваемого нейрона в слое i . Размер рецептивного поля одинаков длявсех нейронов слоя и подбирается опытным путем. При этом локальныерецептивные поля соседних нейронов частично перекрываются, что создаетизбыточность числа нейронов над каждой точкой входного образа, и как106будетпоказанодалее,обеспечиваетконкурентнуюдиверсификациюнейронов по типу детектируемых признаков.Преобразование информационного образа при переходе от (i 1) -гослоя НСИС к i -му слою происходит на основе следующей формулы:X i f i X i 1 , Wi ,гдеi 1L ;fi-нелинейное(4.6)преобразование,определяемоетопологией соединения нейронов двух слоев и формулой (4.5); Wi множество весовых коэффициентов.Важно отметить, что в предлагаемой структуре нейронной сетиотсутствует полносвязность соединений между нейронами.
По сравнению сМНСПР такой подход уменьшает пространство поиска оптимального векторавесовых коэффициентов сети. Кроме того, использование локальныхрецептивныхполейнакаждомуровненейроннойсетипозволяеторганизовать поэтапную агрегацию информации от малых участков входногообраза к бόл ьшим. Каждый нейрон становится детектором признаков,выявляющим сочетания признаков в нижележащем слое. Так, например, прианализе изображений последовательные слои нейронов могут выполнятьследующие функции: выявление отрезков различного угла наклона; выявление типовых элементов распознаваемых объектов; выявление типовых сочетаний элементов и распознавание объектов; выявление сочетаний объектов и распознавание сложных сцен.ВажнымэтапомфункционированияНСИСявляетсялокальнаянормализация контраста выходного информационного образа для каждогослоя нейронов. Данный этап позволяет сократить количество активныхнейронов, оставив среди них лишь наиболее «уверенные» в правильностидетектированияпризнаков.Этопозволяет,во-первых,повыситьинтерпретируемость активационного состояния слоя, а, во-вторых, в режиме107обучения НСИС (описанном ниже) предотвратить формирование избыточнобольших групп нейронов, детектирующих схожие признаки.Решениеданнойзадачивозможносиспользованиемметодовфильтрации изображений или же при помощи ингибирующих соединений[43].
В рамках настоящей работы был использован последний способ. Дляего реализации множество весовых коэффициентов каждого нейрона Wi , jбыло дополнено множеством весов I i , j , соединяющих j -ый нейрон i -го слояотрицательнымисвязямисвыходаминейронов,расположенныхнанебольшом удалении в том же слое.4.3.2 Алгоритм обучения нейронной сети для анализа визуальныхобразовНаряду с задачей настройки топологии соединений в нейронной сетиважную роль играет поиск весовых коэффициентов или обучение сети.НаиболеераспространеннымметодомобученияМНСПРвзадачахраспознавания образов является метод обратного распространения ошибки[52].
Данный метод является супервизорным, т.е. требует наличия заранееподготовленного множества с обучающими примерами вида Si {Xi , ki } ,где Xi – входной информационный образ, ki – порядковый номер класса, ккоторому относится входной образ. В то же время составление такихобучающих множеств является достаточно сложной задачей. В гораздобольшем количестве доступны множества неклассифицированных образов,сбор которых может осуществляться в ходе штатного функционированиясистемы.В настоящей работе был использован алгоритм предварительногообучения НСИС без учителя, основанный на биологически оправданныхпринципах образования детекторной селективности нейронов.
Данныйалгоритм позволяет обеспечить выполнение двух основных требований:1081.частота активации каждого нейрона должна соответствоватьожидаемой частоте обнаружения того или иного признака детектируемогообъекта 0 ;2.нейроны слоя должны находиться либо полностью в активном(Yx , y 1) , либо в пассивном (Yx , y 0) состоянии в целях обеспечениямаксимальной степени диверсификации нейронов по типам выявляемыхпризнаков.Для описания алгоритма обучения введем несколько обозначений.Текущей временнόй частотой активации нейрона будем называть величинуTYi 0 t i T ,(4.7)где Yt – выходное значение нейрона на шаге обучения t ; T – периодусреднения, выбираемый с тем расчетом, чтобы за этот период с высокойвероятностьюнавходесетиоказалисьинформационныеобразы,относящиеся различным классам.Текущей степенью активации нейронов в точке {x, y} будем называтьвеличинуY{ x , y }D x , y |D| ,(4.8)где D – множество, состоящее из точек информационного образа слоя,расположенных на расстоянии соединения ингибиторными связями.Пространственным отклонением выходного значения нейрона будемназывать величинуd Yt ,(4.9)которая показывает насколько текущее значение нейрона превышаетсреднее значение нейронов из его ингибиторной зоны.