Диссертация (1090939), страница 6
Текст из файла (страница 6)
Ее использование обеспечиваетинвариантность относительно поворота, но не инвариантность относительноизменения масштаба. Поэтому при ипользовании SURF для вычисленияГессиана применяются фильтры различного масштаба. Пусть исходноеизображениезадаетсяматрицейинтенсивностейI,текущийрассматриваемый пиксель равен X = ( x, y ) , а - масштаб фильтра. ТогдаГессиан имеет следующий вид: Lxx ( X , ) Lxy ( X , )H ( X , ) = ,L(X,)L(X,)yy xyгде Lxx ( X , ), Lxy ( X , ), L yy ( X , ) являются свертками апппроксимации второйпроизводной Гауссова ядра с исходным изображением I.
Детерминантматрицы Гессе достигает экстремума в точках максимального измененияградиента яркости. Поэтому SURF, применяя Гауссово ядро ко всемуизображению, позволяет найти точки, в которых достигается максимальноезначение детерминанта матрицы Гессе.Далее для каждой найденной особой точки вычисляется ориентациякак преобладающее направление перепада яркости. Понятие ориентацииблизко к понятию направления градиента, но для определения ориентацииособой точки применяется фильтр Хаара [91].
На основании имеющейсяинформации выполняется построение дескрипторов для каждой особойточки: Вокруг точки строится квадратная окрестность, размер которой в 20 разпревышает масштаб, для которого было получено максимальноезначение детерминанта матрицы Гессе. Данная окрестность разбивается на 4 4 региона. Для каждого блока вычисляется четырехкомпонентный вектор,включающий в себя суммарный градиент по квадранту и суммумодулей точечных градиентов.37 Дескрипторформируетсяврезультатесклеиваниявзвешенныхописаний градиента для 16 квадрантов вокруг особой точки. Элементыдескриптора характеризуются определенными весами на основекоэффициентовГауссоваядра,чтонеобходимодлябольшейустойчивости шумам в удаленных точках. Учитывается знак следа матрицы Гессе, чтобы различать светлые итемные участки изображения.Зачастую дескриптор SURF используется для поиска объектов, ноинформация об объектах в этом случае не используется.
SURF позволяетрассмотривать изображение как единое целое и выделять особенности всегоизображения. Это в итоге приводит к тому, что данные техники плохоприменимы для работы с объектами простой формы.Дескриптор GLOHДескриптор GLOH (Gradient location-orientation histogram) [59] являетсяодной из модификаций SIFT-дескриптора, и характеризуется полярнымспособом разбиения окрестности и высокой степенью надежности.Рис.
1.7 Полярная сетка разбиения окрестности особой точкиВ отличии от SIFT дескриптора, в данном методе используетсяполярная сетка разбиения окрестности на бины 7:3 радиальных блока срадиусами 6, 11 и 15 пикселей и 8 секторов. Результирующий вектор38содержит 272 компоненты и проецируется в пространство размерности 128посредством использования анализа главных компонент.Дескриптор BRIEFFОтличительной особенностью BRIEF дескриптора (Binary RobustIndependent Elementary Features) [30] является устойчивое распознаваниеодинаковых участков изображения, снятых с разных точек.
При созданииBRIEFF дескриптора при этом ставилась задача максимального уменьшенияколичества выполняемых вычислений. Алгоритм распознавания сводится кпостроению случайного леса (randomize classification trees) или такназываемогонаивногоБайесовскогообучающеммножествеизображенийучастковтестовыхизображений.классификатораипоследующейНебольшоенанекоторомклассификацииколичествооперацийобеспечивается за счет представления вектора признаков в виде бинарнойстроки, и как следствие, использования в качестве меры сходства расстоянияХэмминга.Схема построения векторов признаков является достаточно простой.Вначале изображение разбивается на отдельные перекрывающиеся областиP = S S , называемые патчами. Из патча некоторым образом выбираетсямножество пар пикселей ( X , Y ) , для которых строится набор бинарныхтестов: ( P, X , Y ) =1, I ( X ) < I (Y ),0, I ( X ) I (Y )где I ( X ) - интенсивность пикселя X . Для каждого патча выбираетсямножество, содержащее N пар точек, которые однозначно определяют наборбинарных тестов.
Далее на основании этих тестов строится бинарная строка:f N ( P) = 1i N (2i 1 ( P, X i ,Yi )).Авторыработы[30] приводят результаты сравнениякачествараспознавания при выборе пар точек для закона равномерного распределения39в патче, а также для закона нормального распределения с разнымизначениямиматематическогоожиданияисреднеквадратическогоотклонения. При равных условиях проведения, для некоторых видовизображений точность детектирования с помощью BRIEFF почти в полторараза превышает показатели SURF дескрипторов.Дескриптор ORBДескриптор ORB (Oriented FAST and Rotated BRIEF) впервые былпредставлен в 2011 в работе [78, 22]. В отличие от BRIEF дескриптора, методORBявляетсяинвариантнымкизменениюмасштабаиповоротуизображения, в то же время используя очень эффективную метрикурасстояния Хэмминга при сопоставлении точек, поэтому данное решениеболее предпочтительно в задачах реального времени. Подроное рассмотрениехарактеристик производительности ORB дескриптора приводится во второйглаве диссертации.1.4.Системы прикладного объемного телевиденияВ настоящее время сформировались два основных направленияразвития телевизионной техники.
Одно из них составляет вещательноетелевидение, второе получило название прикладного телевидения, подкоторым понимается использование телевизионных методов и средств вразличных практических и исследовательских задачах. Основное требованиек вещательным телевизионным системам заключается в воспроизведении наустройствах приема изображений, обеспечивающих необходимые условияхудожественного восприятия зрителем передаваемой сцены. В этом случаенапервыйизображения.планвыступаетТребования,проблемапредъявляемыекачестваквоспроизводимогосистемамприкладноготелевидения, основываются на их назначении, которое может быть, какдостаточно универсальным, так и узко специализированным [5].401.4.1. Классификация систем объемного телевиденияВ русскоязычной литературе большая часть понятий, относящихся кобластисистемхарактеризуетсяанглоязычныхобъемногоустоявшейсязарубежныхтелевидениястрогойнаданныймоментнетерминологией, в отличие отпубликаций.Так,зачастуювкачествеальтернативы термину "объемное телевидение" используются другиеварианты, такие как, например, стереотелевидение (от греч.
stereos –пространственный). В этом случае терминология определяется техникойсоздания, воспроизведения и передачи стереоскопических изображений стереопары [6].Рис. 1.8 Разновидности формируемых изображений в системах объемноготелевиденияДругой вариант использования - телевидение со свободной точкойнаблюдения (англ.
free viewpoint television). Это определение возникло всвязи с развитием методов воспроизведения плоских изображений смногоракурсным обзором и не указывает на объемность изображения.Другой термин, относящийся к более высокому уровню абстракции,41“виртуальная реальность” (от лат. virtus – потенциальный, возможный и лат.realis – действительный, существующий), в отношении к телевидениюопределяется характером воспроизведения модели сцены телевизором [2, 1].На рисунке 1.8 приведена схема классификации систем объемноготелевидения в зависимости от типа изображений.Системы прикладного объемного телевидения по назначению ипринципам построения делятся на две основные группы [10].К первойгруппе относятся наблюдательные системы визуального телевидения,предназначенныедлявидеонаблюдения,автоматическогопоиска,обнаружения и опознавания интересующих оператора объектов.
Ко второйгруппе относятся телевизионные измерительные системы, служащие дляконтроля и измерения отдельных параметров объектов. Автоматическийрежимфункционированиятелевизионныхизмерительныхсистемподразумевает предварительную задачу обнаружения и распознаванияобъекта с целью дальнейшего измерения его параметров.В последние годы на смену пассивным стереосопическим системамформирования объемного телевизионного сигнала приходят активные RGBD системы, позволяющие фиксировать как цветовую информацию онаболюдаемомпространстве,такирасстояниедовидимыхточекпространства. Таким образом, в системе прикладного телевидения на основеRGB-D датчиков, в отличие от систем, основанных на стереозрении,передается телевизионный сигнал с дальностной компонентой - парацветного изображения и карты глубины. Такой формат данных зачастуюупоминается как формат 2D + Z [15]. Как правило, для получениякомпоненты глубины в таких камерах используется метод искуственноготекстурированияповерхностиОпределеннымобразомспомощьюинфракрасногоструктурированныйшаблон,проектора.излучаемыйпроектором на объекты наблюдаемой сцены, фиксируется цифровойкамерой, работающей в инфракрасном диапазоне.