Диссертация (1090939), страница 10
Текст из файла (страница 10)
Близостьдескрипторов определяется с помощью некоторой метрики (норма, кросскорреляция и т.п.).Рис. 2.19. Набор соответствий между дескрипторами до примененияалгоритма RANSAC71Послесопоставлениядляотсеченияложныхсрабатыванийприменяется алгоритм RANSAC (RANdom SAmple Consensus [40, 9]).Рис. 2.20. Набор соответствий между дескрипторами после примененияалгоритма RANSACАлгоритм RANSAC представляет собой общий метод, которыйиспользуется для оценки параметров модели на основании случайныхвыборок.Присопоставлениимодельхарактеризуетсяматрицейпреобразования, или матрицей гомографии.
На рисунке 2.20 результатпроективного преобразования с помощью матрицы гомографии изображен ввиде белого четырехугольника. На входе алгоритма имеется два множествадескрипторов, полученных на предыдущем и текущем изображении. Схемаработы RANSAC состоит из многократного повторения следующих трехшагов:Выбор точек и построение параметров модели. Из входных множествдескрипторов выбираются случайным образом без повторений наборыфиксированного размера, на основании которых строится матрицапреобразования.Проверкапостроенноймодели.Длякаждогодескрипторапредыдущего кадра находится проекция на текущем кадре ивыполняется поиск наиболее близкого дескриптора из множествадескрипторов текущего кадра.
Дескриптор помечается как выброс, если72расстояние между проекцией и соответствующим дескрипторомтекущего изображения больше некоторого порога.Замещение модели. После проверки всех точек проверяется, являетсяли построенная модель лучшей среди набора предшествующихмоделей.В результате применения алгоритма RANSAC строится наилучшаяматрицагомографии.Вычисливперспективнуюпроекциюнаборадескрипторов предыдущего кадра, достаточно выполнить проход по всемсоответствиям, полученным в процессе перебора, и проверить, является лисоответствующий дескриптор текущего кадра достаточно близким кпроекции дескриптора предыдущего кадра.
Если не является, то параотбрасывается.В предыдущем разделе было отмечено, что для решения задачиодновременной локализации и картирования требуется такое количествоточек, которое позволяет всем рассмотренным детекторам функционироватьв режиме реального времени. Поэтому для сравнения ряда методовдетектирования и сопоставления особых точек необходимо оценить длярассматриваемых алгоритмов значения точности и полноты, как наиболееважных свойств в рассматриваемом контексте использования особых точек.В данном исследовании полнота определяется как отношениекорректно сопоставленных дескрипторов к общему количеству соответствийна изображениях:RПОЛН NM,NCгде NM определяет общее количество правильных сопоставлений послеприменения алгоритма RANSAC, а NC – количество всех особых точек наизображениях, которые видны на обоих кадрах после трансформации второгоизображения.
Точность, в свою очередь, представляет собой отношение73итогового количества корректно сопоставленных особых точек к числуособых точек на трансформированном изображении:RТОЧН гдеNPпредставляетсобойNM,NPколичествовсехособыхточекнатрансформированном изображении, которые должны иметь соответствия.Для сравнения значений полноты и точности рассматриваемых методовописания особых точек в условиях различных трансформаций изображенийбыли использованы тестовые наборы изображений, представляющих данныеискажения.
Рисунок 2.21 показывает результаты исследования этихзависимостей.Графическая интерпретация зависимости величины полноты отзначения точности является одним из наиболее популярных методовсравнения качеств дескрипторов особых точек. Расстояние между кривымипозволяет сделать выводы об относительной эффективности дескриптора вкаждой из областей. Оптимальная эффективность соответствует в данномслучае левому верхнему углу на графике полнота / 1-точность с единичнымизначениями полноты и точности.
Необходимо отметить, что говорить обэффективности дескриптора следует только в том случае, когда значениеточности составляет более 50%. В противном случае тех же результатовможно достичь при случайном сопоставлении особых точек.Одним из наиболее сложных для сопоставления точек случаем являетсяповорот изображения. Наихудший результат при этом демонстрируетдескриптор BRIEF, который не инвариантен повороту.
Однако, онпоказывает одни из лучших результатов для остальных рассматриваемыхтипов трансформации изображений. BRISK и SIFT при этом зачастуюдемонстрируют схожие результаты, уступающие во всех случаях алгоритмуSURF, который по совокупности результатов выигрывает в соотношенииполнота / точность.74(а)(б)(в)(г)(д)Рис. 2.21.
Графики отношения величин полноты и точности длярассматриваемых дескрипторов при различных трансформациях изображений:вращение изображения (а), изменение точки зрения (б), размытие (в), JPEGсжатие (г), изменение освещенности (д).75При проведении тестирования каждого из дескрипторов, использовалсяидентичный набор особых точек, полученных детектором SURF.
Однако,итоговые значения полноты при распознавании существенным образомзависят от их изначального количества. Абсолютная точность сопоставленияособых точек не имеет большого смысла, если их количество исчисляетсяединицами. При этом минимально необходимое в рамках конкретной задачизначение полноты может быть получено как отношение минимальногоколичествасопоставленныхточекксреднемучислувозможныхсопоставлений для конкретной пары детектор - дескриптор.По результатам проведенных исследований можно сделать вывод обольшом потенциале применения пары детектор ORB – дескриптор SURF,сочетающей в себе высокую скорость детектирования, присущую методуORB, и точность при сопоставлении дескрипторов SURF.
Большойпотенциал данного гибридного метода частично подтверждается и другимиисследованиями. Однако, в конечном итоге об эффективности выбранногоалгоритма можно говорить после проведения его тестирования уже в рамкахреализованной системы одновременной локализации и картирования.2.4.РеализацияалгоритмаодновременнойлокализацииикартированияВ первой главе данной работы было отмечено, что долгое времянаиболее распространенным походом к решеиню задачи одновременнойлокализации и построяния карты пространства являлся алгоритм на основерасширенного фильтра Калмана. Основоной проблемой данного методаявляется его вычислительная сложность, ограничивающая возможности егоприменения на картах, насчитывающих значительное число ориентиров.
Длярешения этой проблемы в 2002 году был разработан новый подход крешениюзадачиодновременнойлокализацииикартирования[50],получивший название FastSLAM. В основе данного похода лежит разделениезадачи на множество равнозначных подзадач, используя независимость76состояния отдельных элементов модели SLAM. В текущем параграфе работыприводится сравнение данных подходов по различным характеристикам сточки зрения их применимости в системе прикладного объемноготелевидения.2.4.1.
Особенности реализацииРассматриваемаяобластьпримененияалгоритмаодновременнойлокализации и картирования, а именно система прикладного объемноготелевидения, диктует особые требования к разрабатываемым методам. Такиесистемы,какправило,автономныинеобладаютзначительнымивычислительными ресурсами. Так, алгоритм одновременной локализации икартирования находит широкое применение в мобильной робототехнике, гдекомпактность робота существенно ограничивает его вычислительныевозможности.
Поэтому, наряду с этапом детектирования и обработки особыхточек на изображениях, эффективность реализации задач этапа локализациии картирования также оказывает существенное влияние на скорость работыалгоритма и его работоспособность в целом [13].Сложность алгоритма на основе расширенного фильтра Калмана (EKFSLAM) определяется размером матриц ковариации, обрабатываемых впроцессе локализации и построения карты. Размерность этих матриц внаибольшей степени определяется количеством особых точек изображений,отслеживаемых алгоритмом (рис. 2.22).Существует ряд подходов, позволяющих уменьшить вычислительнуюсложность.
Так, в работе [24, 36] предлагается метод оптимизации работыалгоритма за счет уменьшения числа особых точек на каждом шагеобновления состояния фильтра. Но в любом случае вычислительнаясложность данного метода будет прямо пропорциональна количествуобрабатываемых ориентиров, так как их положения и матрица ковариациидолжны обновляться на каждом шаге работы алгоритма, что приводит кквадратичной сложности O(N2).77Рис. 2.22. Схема работы алгоритма одновременной локализации икартирования на основе расширенного фильтра Калмана (EKF SLAM)В подходе, примененном в алгоритме FastSLAM, удалось уйти отзатратного пошагового вычисления матрицы ковариации с помощьюиспользованияфильтрачастициразделениязадачлокализацииикартирования (рис. 2.23).
Несмотря на то, что при этом в задаче наблюденияориентиров все еще используется набор расширенных фильтров Калмана,они значительно уступают в размерности фильтру, применяемому в подходеEKF SLAM, кроме того их размерность постоянна. Каждая частица содержитполныйнаборотслеживаемыхориентиров,поэтомувычислительнаясложность алгоритма FastSLAM составляет O(NK), где N определяет числоориентиров, а K – число частиц. Существует ряд решений, позволяющих ещеболее значительно уменьшить сложность алгоритма. Так, в работе [50]78предлагается оптимизация структуры данных, обрабатываемых алгоритмом,с использованием бинарных деревьев, что позволяет создавать решения наоснове FastSLAM со логарифмической сложностью O (N log K).Рис. 2.23. Схема работы алгоритма одновременной локализации икартирования на основе фильтра частиц (FastSLAM)79Таким образом, быстродействие обеих решений задачи одновременнойлокализации и картирования, как с применением расширенного фильтраКалмана, так и фильтра частиц, в значительной степени зависят отколичества отслеживаемых ориентиров.
Алгоритм на основе фильтра частицобладает лучшей масштабируемостью, так как позволяет работать с большимколичеством ориентиров, чем метод на основе расширенного фильтраКалмана. Однако точность решения FastSLAM определяется количествомчастиц, которыми оперирует фильтр.