Пояснительная записка королёв (1206314), страница 3
Текст из файла (страница 3)
Начальным этапомобнаружения объектов на изображении с помощью дескрипторов являетсяопределение характерных точек. Характерными точками называются точки,обладающие высокой локальной информативностью параметры, которых неменяютсяприразличныхфотометрическихигеометрическихпреобразованиях изображения. Для найденного множества точек наизображении рассчитываются дескрипторы [3].Одним из наиболее популярных алгоритмов, включающих дескриптор идетектор характерных точек изображения, является SIFT (Scale InvariantFeature Transform), предложенный D.G. Lowe в 1999 году [141, 142]. Данныйалгоритмпредставляетсобойлокальнуюгистограммунаправленийградиентов изображения.
Принцип работы алгоритма SIFT заключается ввычислениисверткиизменяющемсяисходногопараметреизображениясглаживания.сядромПослеэтогоГауссаприпроисходитпреобразование изображений к одному размеру, и вычисляется их разность.Далее выполняется сравнение каждого пикселя на изображении с восемьюсоседними пикселями при тех же параметрах и масштабе, с девятьюсоседними пикселями в большем масштабе и с девятью в меньшем масштабе.Пиксели, в которых локальные экстремумы превосходят заданный порог,выбираются как характерные точки.
Для каждой выбранной точкивычисляется определенный локальный дескриптор, который характеризуетнаправление градиентов в данной окрестности пикселей. В 2005 годуисследователи N. Dalal и B. Triggs представили алгоритм HOG (Histogram ofOriented Gradients). Принцип работы данного алгоритма заключается в том,что изображение представляется в виде плотной сетки равномерно14распределенных ячеек. Для пикселей внутри каждой ячейки вычисляютсягистограммы направлений градиентов.
На основе полученных параметроввыполняется построение дескриптора. Для увеличения точности в данномалгоритмеприменяетсянормализацияперекрывающегосялокальногоконтраста гистограмм. Нормализованные дескрипторы обладают повышеннойустойчивостью к изменению интенсивности освещения.В 2006 году T. Tuytelaars, H. Bay, L. Van Gool представили алгоритм SURF(Speeded Up Robust Features), который включает в себя дескриптор и детекторхарактерных точек изображения. В данном алгоритме при вычислениихарактерных точек используются не гистограммы взвешенных градиентов, ацелочисленные прямоугольные фильтры разного масштаба.
Это обеспечиваетустойчивость к поворотам объекта и к изменению масштаба. Пиксели, вкоторых локальные экстремумы превосходят заданный порог, выбираются какхарактерные точки и в них вычисляются локальные дескрипторы. Вокругточки строится квадратная область и делится на несколько подобластей. Вкаждой подобласти вычисляются отклики на два типа вейвлетов –горизонтальноивертикальнонаправленные.Полученныеоткликивзвешиваются Гауссианом и суммируются. Перечисленные дескрипторышироко используются при детектировании различных объектов, в том числе иавтомобильных номерных знаков. Данные дескрипторы обеспечиваютвысокую степень инвариантности к геометрическим преобразованиям иизменению масштаба изображения.Недостатком применения дескрипторов является низкая устойчивостьработы при различных условиях освещения, при отражающих поверхностях, атакже при различных углах регистрации объектов [4].151.1.4 Методы использующие гистограммный анализ изображенияДанные методы основываются на предположении, что частотнаяхарактеристика области расположения объекта, содержащего символьныеобразы, отличается от остальных областей изображения и имеет болеевысокую интенсивность пикселей.Для усиления пространственных частот и подавления шумов на начальномэтапе данного подхода выполняется улучшение контраста, бинаризация иливыделение границ на изображении.
В результате этого, границы объектов наизображении становятся более контрастными, а фон затемняется. Обычно взадачах подобных распознаванию маркировок технических объектов иавтомобильных номерных знаков, искомый объект представляет собойсовокупность символов и линий темного цвета на более светлом фоне, или женаоборот. Таким образом, данная область изображения будет иметь высокийконтраст. Идея данных методов заключается в следующем: выполняетсясканирование изображения и при этом вычисляется среднее значение яркостипикселей в каждой строке изображения (иногда вычисляют по столбцам). Втом месте, где расположен искомый объект средняя интенсивность пикселейбудет значительно отличаться от остальных областей изображения.Максимальноезначениеполученнойпроекцииможетсовпастьсрасположением объектаДанные методы применялись многими исследователями с различнымимодификациями. В работах данный метод применялся с различными видамифильтраций изображения для подавления шумов и более яркого выделенияобласти расположения автомобильного номерного знака.
В работе длядетектирования автомобильного номерного знака данный метод применялсясовместно с преобразованием Хафа. Данные алгоритмы могут показыватьхорошие результаты работы в том случае, если размер изображенияавтомобиля или другого технического объекта сопоставим с размерами кадра.16Достоинство данных методов заключается в простой реализации ивысокой скорости работы.Недостаток данных методов заключается в чувствительности к любойобласти изображения, имеющей параметры интенсивности пикселей схожие сдорожным знаком.1.1.5 Метод главных компонентМетод главных компонент (Principаl Compоnent Anаlysis, PCA) былпредложен K. Pearson в 1901 году [153].
Данный метод применяется вразличныхобластях,такихкак:обработкаианализизображений,распознавание образов, сжатие данных и т.д. Метод PCA направлен науменьшение размерности данных, при наименьших потерях информации, чтобывает очень актуально в области анализа и обработки изображений. В данномметоде выполняется линейное ортогональное преобразование входноговектора Х, содержащего коррелированные компоненты, в вектор меньшегоразмераY,которыйсодержитнекоррелированныепеременные.Некоррелированные переменные называются главными компонентами.Вектор Х состоит из всех примеров обучающего набора изображений.Собственные вектора получаются при решении следующего уравнения (1.2):D= Ф Ф,(1.2)где D – диагональная матрица собственных чисел;K – матрица ковариации для вектора Х;Ф– матрица собственных векторов;ИзматрицысобственныхвектороввыбираютсяМ наибольшихсобственных чисел, из которых формируется подматрица .
Таким образом,получим выражение: = ФТм ̃где ̃ = − ̃ – нормализованный вектор с нулевым математическиможиданием. При выборе первых М компонент векторное пространстворазбивается на собственное пространство, содержащее главные компоненты.17Сначала вычисляются главные компоненты для обучающего набораизображений объектов. Выполняется фильтрация параметров объектов, гдеотбрасываются менее существенные из них и пространство параметровуменьшается. Таким образом, объекты на изображении могут бытьпредставленыввидеминимальногонабора параметров.Остальныекомпоненты являются второстепенными и характеризуют незначительныеразличия между объектами и шумом [5].При классификации объектов на изображении вычисляется Евклидоворасстояние между главными компонентами исследуемого изображения ивзвешенной комбинацией главных компонент обучающего набора. Еслиглавные компоненты изображения имеют наиболее близкое соответствие сглавными компонентами какого-либо объекта из обучающего набора, тосчитается, что на изображении содержится данный объект.Для эффективного применения данного метода изображения объектовдолжны быть получены при одинаковых условиях регистрации.Достоинство метода PCA заключается в обеспечении уменьшенияразмерности данных, что является важным фактором в работе с большимибазами изображений.1.1.6 Линейный дискриминантный анализЛинейный дискриминантный анализ (Linear Disсriminаnt Anаlysis, LDА)направлен на решение задачи классификации объектов по несколькимклассам.
В отличие от PCA в данном методе не ставится цель нахожденияпространствапризнаковнаименьшейразмерности,эффективноописывающего обучающий набор данных. Основной задачей данного методаявляется нахождение проекции признаков в пространство, в которомразличные классы объектов имеют максимальное отличие друг от друга. Длякаждого объекта изображения, принадлежащего определенному классу,находятся характерные признаки, которые имеют общее сходство с18признаками других объектов данного класса. Набор таких объектовформирует обучающую выборку, в которой известна принадлежность каждогообъекта к определенному классу.
Набор признаков определяется путемпроекции пространства признаков в подпространство меньшей размерности.Причем вектора признаков различных классов объектов должны иметьмаксимально отличные друг от друга параметры, чтобы свести к минимуму ихвнутриклассовое различие и увеличить межклассовое. Таким образом,формируются максимально компактные кластеры характерных признаковобъектов, соответствующие различным классам, которые имеют минимальновозможные пересечения друг с другом [6].Задача классификации сводится к тому, чтобы выделить характерныепризнаки входного изображения и провести их корреляцию с имеющимисяпризнаками, сформированными в результате обучения.
Таким образом,происходитопределениепринадлежностирассматриваемогообъектаизображения к какому-либо классу.1.1.7 Алгоритм AdaBoostАлгоритм AdaBoost (Adaptive boosting – адаптированное улучшение) былпредложен Y. Freund и R. Schapire в 1999 году.
Данный алгоритм являетсяалгоритмом машинного обучения и успешно применяется при решении задачклассификации объектов на изображениях и видеопоследовательностях.Алгоритм AdaBoost имеет адаптивный принцип работы и представляет собойкаскадную структуру из слабых классификаторов, каждый из которых учитсяна ошибках предыдущего. Каждый слабый классификатор ориентирован наопределенный набор характерных признаков и может выдавать два вариантаответов: «верно», либо «ложь».