Диссертация (1144795), страница 15
Текст из файла (страница 15)
Автор рассмотрел изменениеяркости небольшого фрагмента вокруг интересующей точки при сдвигефрагмента на один пиксель в восьми направлениях (горизонтальном,вертикальном и диагональном). Сходство определяется путем принятиясуммы квадратов разностей между двумя участками. Меньшее числоуказывает на большее сходство.Пусть U фрагмент изображения I(x,y) – интенсивность изображения вточке (x,y), и его копии, сдвинутые на величину (u,v). Для каждой точки79фрагментаможновычислитьвзвешенныйквадратразностимеждусдвинутым и исходным фрагментом, и рассмотреть функцию:S ( x, y ) w(u, v) I ( x u, y v) I ( x, y ) .2(u ,v )U(1.39)Функция I(u+x,v+y) может быть разложена в ряд Тейлора в окрестностицентра (x,y), что позволяет перейти от (1.39) к выражению:S ( x, y ) (u ,v )U2w(u, v) I x ( x, y ) I y ( x, y ) ,(1.40)где: Ix и Iy – частные производные яркости в горизонтальном ивертикальном направлениях, w – окно, которое определяет областьизображения с коэффициентом единица.Один из недостатков метода связан с тем, что он не изотропен: еслиугол не направлен в сторону соседней, то он не будет обнаружен, какточечная особенность.
Харрис и Стивенс [252] улучшили детектор угловМоравека, рассматривая дифференциальную оценку угла по отношению кнаправлению непосредственно, вместо использования сдвинутых пятен. Этуоценку угла часто называют автокорреляционной. Однако с математическойточки зрения используется метод суммы квадратов разностей. Основная идеясостоит в том, что вычисляется градиент изображения в каждом пикселе,например, с помощью использования гауссовского сглаживания (в качествевесовой функции w(u,v) обычно используется функция Гаусса.). Далеевычисляется матрица Харриса, которая представлена ниже:A(u ,v )U2w(u , v) I x ( x, y ) I y ( x, y ) ,(1.41)Угол (или, в общем, точечная особенность) характеризуется большимизменением S во всех направлениях вектора (x,y). На основе анализасобственных значений А, эта характеристика может быть выраженаследующим образом: должно быть два «больших» собственных значения дляточечных особенностей [16].
На основании величины собственных значений,можно сделать следующие выводы на основе этих аргументов: 1) если λ1 ≈ 080и λ2 ≈ 0, то этот пиксель (x, y) не имеет особенности, представляющейинтерес; 2) если λ1 ≈ 0 и λ2 имеет некоторое большое положительноезначение, то обнаружен край; 3) если λ1 и λ2 большие положительныезначения, то угол найден.Большинство операторов детектирования углов основаны на свойствахматрицы А. В [340] для этого наименьшее собственное значение матрицы Асравнивается с порогом.
Харрис и Стивенс [252] отметили, что точноеопределение собственных значений вычислительно сложно, так как требуетвычисления квадратного корня, а вместо этого предложили следующиефункции с М, где k – является настраиваемым параметром чувствительности,должно быть эмпирически в диапазоне 0,04 - 0,15:M c 12 k 1 2 det( A) k trace 2 (A) ,где det(A) и trace(A) — определитель и след матрицы A.2(1.42)При отрицательном отклике точка классифицируется как попавшая накрай; при отклике, близком к нулю, точка считается попавшей в «плоскую»область.
При больших положительных значениях z(x,y) считается, что точкаявляется углом, так как в ней яркость сильно меняется во всех направлениях.Детектор Харриса [340] инвариантен к вращению и сдвигу изображения, атакже к сдвигу и равномерному линейному изменению яркости.Описанные детекторы, хотя и называются детекторами углов, находятне собственно углы, а любые участки изображения, в которых имеется большое изменение градиента во всех направлениях при заданном масштабе. Детекторы достаточно быстры, поскольку сводятся к дифференцированию яркости изображения, суммированию производных яркости в локальнойокрестности каждой точки и нахождению меры отклика угла. Помимо детектора Харриса существуют другие методы обнаружения углов [299], позволяющие находить углы в зависимости от масштаба изображения.
Наибольшуюпопулярность получили детекторы SIFT [286] (scale-invariant featuretransform–масштабно-независимое преобразование особенностей) и его81ускоренный вариант SURF [194] (speeded-up robust features ‒ ускоренныеустойчивые особенности). Детектор SIFT основан на идее поиска локальныхмаксимумов в так называемом пространстве переменного масштаба (scalespace). Для заданного изображения I(x,y) пространство переменного масштаба [285] представляет собой множество значений функционала:x2 y 22 e 2(1.43),L( x, y, ) G ( x, y, ) I ( x, y ), G ( x, y, )где: σ > 0 ‒ параметр сглаживания, символ «∗» означает свертку, аG(x,y;σ) – двумерная функция Гаусса. В качестве точек интереса предлагаются точки, соответствующие локальным экстремумам функции:D( x, y, ) L( x, y, k ) L( x, y, ) ,(1.44)Далее находятся локальные экстремумы функции D(x,y,σ).
Для этогозначение функции D(x,y,kσ) в каждой точке (x,y) сравнивается со значениямив восьми соседних пикселях при том же значении параметра масштаба, атакже в 18-ти соседних пикселях, принадлежащих предыдущему и последующему срезам пространства переменного масштаба. Локальные экстремумы,в которых значение | D(x,y,σ)| не превосходит некоторый заданный порог, отбрасываются. Затем строится матрица H вторых частных производных (Гессиан) функции D(x,y,σ).
Если величина trace(H)2/det(H) меньше некоторогопорога, то точка считается характерной.2 fx 22 fxy22 f 2 f 2 f H f ( x, y ) , det( H ) 2(1.45) ,x y 2 xy 2 f2 fxy y 2Метод SURF [194] использует ту же идею пространства переменногомасштаба, что и детектор SIFT, но функция Гаусса в выражении (5)приближается прямоугольным фильтром 9×9. На Рисунке 1.1 показаныфильтры для получения частных производных исходного изображения I(x,y)по yy и по xy; при этом слева приводятся (обрезанные) фильтры вторыхпроизводных Гауссиана, а справа – прямоугольные фильтры, вычисляющие82эти производные приближенно.
Белые области соответствуют значению +1,черные ‒ 2 (на третьем фильтре ‒1), серые – нулевые. Таким образом, вSURF, гессиан вычисляется так:2det( H ) Dxx D yy 0.9 Dxy ,(1.46)где Dxx, Dyy, Dxy – свертки по фильтрам. Коэффициент 0.9 имееттеоретическоеобоснование,икорректируетприближенныйхарактервычислений.Итак, для нахождения особых точек, SURF пробегается по пикселамизображения и ищет максимум гессиана. Способ нахождения локальногомаксимума гессиана мы рассмотрим позднее.
В методе задается пороговоезначение гессиана. Если вычисленное значение для пиксела выше порога –пиксел рассматривается как кандидат на ключевую точку.Поскольку гессиан является производной, и зависит только от перепадаяркости, но не от абсолютного ее уровня, то он инвариантен по отношению ксдвигу яркости изображения. Таким образом, изменение уровня освещенияобразца не влияет на обнаружение ключевых точек.Рисунок 1.1‒ Фильтры для нахождения второй производной яркости изображения по направлениям y и xy; а, б – фильтры Гаусса (SIFT); в, г – прямоугольные фильтры с целочисленными весами (SURF)Кроме того, свойства гессиана таковы, что он достигает максимума, какв точке белого пятна на черном фоне, так и черного пятна на белом фоне.Таким образом, метод обнаруживает и темные, и светлые особенностиизображения.Итак, для нахождения особых точек, SURF анализирует все пикселиизображения и ищет максимум гессиана.
Способ нахождения локального83максимума гессиана мы рассмотрим позднее. В методе задается пороговоезначение гессиана. Если вычисленное значение для пиксела выше порога –пиксел рассматривается как кандидат на локальную особую точку.К достоинствам можно отнести то, что фильтры, использованные длянахождения матрицы Гессе более устойчивы к вращению, и его можноэффективно вычислить с помощью интегральной матрицы.
К недостаткамметода можно отнести то, что SURF используется для поиска объектов наизображении, он сам работает не с объектами. Метод плохо работает дляобъектов простой формы и без ярко выраженной текстуры.В середине 2000-х годов, в связи с возросшим спросом на решение задач компьютерного зрения в реальном времени, появились эвристические алгоритмы быстрого поиска точек интереса. Наиболее ярким представителемданного класса алгоритмов является алгоритм FAST (features from acceleratedsegment test ‒ особенности, полученные из ускоренной проверки сегментов)[321]. Этот алгоритм не требует вычисления производных яркости. Яркостьпикселей, лежащих на окружности, сравнивается с яркостью центральнойточки и на основании ряда проверок принимается решение, является ли центральная точка характерной.