Антиплагиат (1229293), страница 6
Текст из файла (страница 6)
она полностью использует возмож ности аппаратной архитектуры. Для работы программы будет необходимаоткрытая библиотека компьютерного зрения OpenCV. До начала разработки программы необходимо описать схему ее работы с помощ ьюблок-схемы, приведенной на рисунке 2.4.Рисунок 2.4 – Блок-схема программы обнаруж ения пешеходовПрограмма имеет консольный интерфейс, так как впоследствии она будет портирована на микрокомпьютер, где вычислительныемощ ности уступают настольному персональному компьютеру, и нет необходимости использовать графический интерфейс пользователя.2.4.2 Алгоритмы распознавания пешеходов в видеопотоке2.4.2.1 Каскадный алгоритм распознавания образов на основе признаков ХаараДля обнаруж ения пешеходов используют каскадный алгоритм Виолы - Дж онса, основанный на признаках Haar wavelet.
Подробноеописание э того метода приведено в работе [8].В алгоритме поиск пешеходов осущ ествляется сканированием изображ ения скользящ им окном (окном обнаруж ения), используя признакиHaar wavelet. Используются признаки различных типов, масштабов и полож ений. Внутри окна обнаруж ения генерируется более 100,000признаков. Каж дое окно обнаруж ения проходит через ц епочку уровней, отсекающ их большую долю негативных примеров. Наследующ ие уровни поступают окна, не отсечённые на предыдущ ем.
Критерии отсечения уровней задаются при обучении детектора.2.2.1Признаки ХаараПризнак[1]является отображ ениемf: X => f,(2)где f – множество допустимых значений признака.Если заданы признаки f1,…,[1]fn,[2]товектор признаков x=(f1x,…,[1]fn(x))[2]называетсяпризнаковым описанием объекта x ∈ X.Признаковые описания допустимо отождествлять с самими объектами. При этом множество X=f1∙…∙fn называют признаковымпространством [24].Признаки делятся на следующие типы в зависимости от множества f:– бинарный признак, f = {0,1};– номинальный признак: f – конечное множество;– порядковый признак: f – конечное упорядоченное множество;– количественный признак: f – множество действительных чисел.Есть прикладные задачи с разнотипными признаками для их решения подходят далеко не все методы.В стандартном методе Виолы-Джонса используются прямоугольные признаки, изображенные на рисунке 2.5 и[1]называемыепримитивами Хаара.Рисунок 2.5– Примитивы [15]ХаараВ расширенном методе Виолы-Джонса, использующемся в библиотеке OpenCV используются дополнительные признаки,изображенные на рисунке 2.6.[1]Рисунок2.6 –[15]ДополнительныепризнакиВычисляемым значением такого признака будетF=X-Y,(1)где X – сумма значений яркостей точек закрываемых светлой частью признака, а Y – сумма значений яркостей точекзакрываемых темной частью признака.
Для их вычисления используется понятие интегрального изображения.Признаки Хаара дают точечное значение перепада яркости по оси X и Y соответственно.2.4.2.2[1]Алгоритм [11]Виолы-Дж онсаДетектор обладает низкой вероятностью лож ного обнаруж ения.Ниж е приведеныосновные принципы, на которых основан метод [23]:– используются изображения в интегральном представлении, что позволяет быстро вычислять необходимые объекты;– используются признаки Хаара, с помощью которых происходит поиск нужного объекта;– используется бустинг (от англ.
boost – улучшение, усиление) для выбора наиболее подходящих признаков для искомогообъекта на данной части изображения;– все признаки поступают на вход классификатора, который даёт результат «верно» либо «ложь»;– используются каскады признаков для быстрого отбрасывания окон, где не[1]найден [15]пешеход.Задача обнаруж ения человека на ц ифровом изображ ении, как правило, формулируется следующ им образом:– имеется исходноеизображение, на котором есть искомые объекты, представлено двумерной матрицей пикселей размером w h,[1]где пиксели имеют значения от 0 до 255 (черно-белое), от 0 до 2553 (ц ветное RG) изображ ение;– в результате работы алгоритм долж ен определить пешехода и поставить метку;– поиск осущ ествляется в активной области изображ ения прямоугольными признаками, описывающ ими искомый объект прямоугольником.Рисунок 2.7 – Пример поиска сканирующ ем окномДаннаясистема обучения и выбора наиболее значимых признаков полностью автоматизирована,[1]следовательно, нет необходимости в участии человека в проц ессе обучения и поиска.Для того, чтобы начать работать и производить действия с данными, используется интегральное представление изображ ений [26].Такое представление используется часто и в других методах, на пример, в вейвлет-преобразованиях, SURF.[1]Интегральное представление предоставляет возмож ность быстро рассчитывать суммарную яркость произвольного прямоугольника наконкретном изображ ении, размер прямоугольника никак не влияет на время расчета.Интегральноепредставлениеизображенияизображения.
В [11] каждом ее элементе– этоматрица,[12]хранитсяразмерность которой совпадаетсразмерностьюисходногосумма интенсивностей всех пикселей, находящихся левее и выше данногоэлемента. Элементы матрицы рассчитываются по следующей формулеLx,у=i=0,j=0i≤x,j≤yI(i,j)(2)где I(i,j) – яркость пикселя исходного изображения.Lx,у=Ixi,yi-Lxi-1,yi-1.(3)Каждый элемент матрицы L[x,у] представляет собой сумму пикселей в прямоугольнике от (0,0) до (x,у), т.е. значение каждогопикселя (x,у) равно сумме значений всех пикселов левее и выше данного пикселя (x,у).
Расчет элементов матрицы занимаетлинейное время, пропорциональное числу пикселей в изображении, поэтому интегральное изображение просчитывается за одинпроход.C[1]помощ ью интегральной матриц ы есть возмож ностьбыстро вычислить сумму пикселей произвольного прямоугольника, произвольной площади.
Пусть в прямоугольникеАС естьинтересующий нас объект :[1]Рисунок 2.8 – ПрямоугольникИз рисунка видно,что сумму внутри прямоугольника можно выразить через суммы и разности смежных прямоугольников по следующей формуле[1]SAC=LA+LC-L-L()(4)Пример расчета интегрального представления показан на рисунке ниж е:Рисунок 2.9 – Расчёт интегрального отображ ения2.4.2.3 Алгоритм распознавания образов на основе гистограммы направленных градиентовАлгоритм распознавания объектов на основе гистограммынаправленных градиентов (Histogram of Oriented Gradients, HOG)[58]был предлож ен в 2005 году и успешно использован для обнаруж ения человека.
Но, к сож алению, э тот метод мож ет обрабатывать толькоизображ ения размера 320x240. Хотя авторы [21] использовали «объединенное изображ ение» для ускоренного проц есса обнаруж ения.Основная идея заключается в том, что форма и вид объектов на изображ ении могут описываться распределением относительных величинградиентов функц ии интенсивности, характеризующ их направление границ объектов.
В практическом применение э тот алгоритмреализуется следующ им образом. Изображ ение разбивается на маленькие «ячейки», каж дой из которых соответствует одномернаягистограмма направлений градиентов (ориентац ии рёбер). Пример представлен на рисунке 2.10.Рисунок 2.10 – Разбиение изображ ения на ячейки [25]Каж дый столбик гистограммы соответствует определённому диапазону направлений градиентов соответствующ его направления исодерж ит их суммарную (по пикселям ячейки) яркость. Совокупность всех гистограмм образует общ ее представление о рёбрах наизображ ении (рисунок 2.11).Рисунок 2.11 – Гистограммы HOG [25]При перепадах освещ ения производится нормировказначенийв полученных гистограммах относительнонекоторойобласти,содерж ащ ей рассматриваемую ячейку.
Соседние ячейки объединяются в «блоки», а значения в гистограммах всех ячеек внутри блоканормируются на суммарное значение магнитуды градиентов по рассматриваемому блоку.Нормализованные блоки называются HOG дескрипторами, а множ ество таких блоков, локализованных в компактной области изображ ения,образует «окно поиска». Итоговый вектор признаков образуется из конкатенац ии дескрипторов внутри окна поиска.Из исследований, проведенных в обзоре [15], HOG-алгоритм обладает самым высоким качеством обнаруж ения, значительно опереж аякаскадный алгоритм, основанный на признаках Haar wavelet.2.4.3 Наборы данных для обучения системы распознавания пешеходовДля обучения системы распознавания пешеходов требуются наборы данных, которые представляют собой серию изображ енийполож ительного и отриц ательного характера, т.е.
изображ ений, на которых имеется или отсутствует пешеход, а такж е координатыскользящ его окна, в котором есть объект. От данной информац ии зависит насколько точно будет работать система. Следовательно, в еераспоряж ении долж но иметься более 1000, как полож ительных, так и отриц ательных снимков.В литературе рекомендуют следующ ие крупные наборы данных: INRIA [26], ETH [27], TU-russels [28], aimler [29] (aimler stereo [30]),Caltech-USA [31], and KITTI [32]. Они обладают различными характеристиками среди которых выделяют: размер кадра, количество икачество изображ ений.INRIA является одним из первых опубликованных наборов данных и показывает высокие результаты в определении пешеходов вразличных местностях (город, пляж , горы, и т.д.).Наборы ЕТН и TU-russels используют средние размеры кадра видео (240x320), что позволяет ускорить проц есс обучения системы.С полным обзором работ по тематике «Обнаруж ение пешеходов» мож но ознакомиться в статьях [15] и [17].
В работе [15] приводитсясравнение качества и скорости работы описанных выше систем.2.4.4 Сравнительный анализ э ффективности алгоритмов распознавания пешеходовЗа последние десять лет алгоритмы распознавания пешеходов стремительно развивались, но мож но заметить, что большинствоалгоритмов основано на гистограммах направленных градиентов и признаках Хаара. Ниж е представлена сводная таблиц а методовраспознавания пешеходов.Рисунок 2.12 – Характеристики методов[47]Рассмотрим два графика обучения методов различными наборами данных, представленных на рисунке 2.13.Рисунок 2.13 – Характеристики методов [47]Как видно из графиков, что проц ент обнаруж ения уменьшается или увеличивается в зависимости от набора данных.Таблиц а 3 – Сравнение алгоритмов распознавания пешеходовМетодыКоличество обнаруж енийПроц ент обнаруж енияВремя обработкиОбщ ееЛож ныеHaar/addboost1634797,6%7,37HOG/libSVM144386,2%26,66Haar+HOG141484,4%8,97Обратим внимание, что HOG имеет наиболее низкий показатель ошибки обнаруж ения пешехода, но время использования сравнительновысоко, тогда как метод Haar имеет противополож ные показатели.
Использование совместно двух методов дает выигрыш в значениитаких показателей, как ошибка обнаруж ения и время обработки.2.5 Библиотека функц ий компьютерного зрения OpenCVOpenCV (англ. Ореп Source Computer Vision Library, библиотека компьютерного зрения с открытым исходным кодом) –[7]библиотека [10]алгоритмовс открытым кодом.другихязыков.компьютерного зрения, обработки изображений и численных алгоритмов общего назначения[7]РеализованаМожетсвободнона[10]языкахC/C++,использоватьсяв[27]также [10]разрабатываетсяакадемическихидля Python, Java, Ruby, Matlab, Lua икоммерческихцелях–распространяется[7]наусловиях лицензии S.[23]Ядро библиотеки cxcore содержит базовые структуры данных и алгоритмы:– базовые операции над многомерными числовыми массивами;– операции матричной алгебры, математические функции, генераторы псевдослучайных чисел;– запись/восстановление структур данных в/из XML;– базовые функции 2 графики.Cv модуль обработки изображений и компьютерного зрения включает следующие функции:– базовые операции над изображениями (фильтрация, геометрические преобразования, преобразование цветовых пространств ит.