Автореферат (1091152), страница 3
Текст из файла (страница 3)
Число грубых ошибок разработанного алгоритмапрактически не увеличивается при снижении качества изображения лица доPSNR = 25 дБ при искажении аддитивным белым гауссовским шумом иPSNR = 30 дБ в случае JPEG-сжатия.В третьей главе предлагается алгоритм распознавания лиц на основемодифицированных локальных бинарных шаблонов, рассматривается егоприменение совместно с фильтрами Габора.Описание точки на изображении через стандартный 8-битный локальныйбинарный шаблон на основе окрестности из 8 ближайших пикселей не являетсядостаточно точной характеристикой. Использование большей окрестности приводитк резкому увеличению числа возможных признаков.
Например, для окрестности из20 пикселей это число возрастает с 256 (28) до более миллиона (220). При этомбольшинство признаков не встретится на отдельно взятом изображении вообще, адругие могут появиться лишь однажды. В связи с этим сравнивать изображения,9описанные большим количеством признаков, практически невозможно. Разделимвсе множество возможных бинарных кодов на небольшое число групп – кластеров –с помощью алгоритма k-средних. Локальные бинарные шаблоны, подвергнутыекластеризации, назовем локальными квантованными шаблонами (ЛКШ). Составимсловарь, в котором для каждого возможного значения ЛКШ будут записаны номеракластеров Q̂i , к которым с наибольшей вероятностью относится данное значениеЛКШ, и вероятности отношения к этим кластерам p (Qˆ i ) . Пример такого словаряпредставлен в табл.
2.Таблица 2. Словарь для перевода 24-битного ЛКШ в вероятности принадлежности к кластерам24-битный локальный№№№p (Qˆ 3 )p (Qˆ1 )p (Qˆ 2 )квантованный шаблонQ̂1Q̂2Q̂30000 0000 0000 0000 0000 00000000 0000 0000 0000 0000 0001.... …. …. …. …. ….0110 0011 0100 1000 0110 00010110 0011 0100 1000 0110 0010.... …. …. …. …. ….1010 0001 0110 1011 0111 00111010 0001 0110 1011 0111 0100.... ….
…. …. …. ….1111 1111 1111 1111 1111 11115353…127…78100…910,920,75…0,570,45…0,510,62…0,8788…271…3169…140,070,21…0,210,33…0,390,23…0,119514…1610…10078…0,060,010,04…0,220,22…0,100,15…0,02Рассмотрим процедуру распознавания алгоритмом с предложенноймодификацией локальных бинарных шаблонов (рис. 5).
Для нормированногосогласно координатам глаз изображения лица I ( x, y ) , поступающего дляраспознавания, вычисляется свертка с 40 фильтрами Габора ψ µ ,v ( x, y ) вида:2k 2 ( x2 + y 2 )2σ 2kν − νψ µ ,v ( x, y ) = 2 e4πгдеφµ =kv =µπ8k max,fvk max =π2,f = 2, ikν ( x cos φµ + y sin φµ ) − 4π−e 2eν ∈ {0, 1, 2, 3, 4}2,определяют(10)масштаб,а, µ ∈ {0, 1, 2, 3, 4, 5, 6, 7} – ориентацию фильтров Габора.Каждое полученное габоровское изображение разбивается на несколькоподобластей, для каждой из которых ранее составлен словарь, на подобииприведенного в табл.
2. Каждой подобласти на габоровском изображении ставится всоответствие гистограмма с k столбцами-признаками с изначально нулевойвысотой L. Для каждого пикселя подобласти вычисляется значение ЛКШ.Найденному значению ЛКШ пикселя согласно словарю соответствуют кластеры,к которым с наибольшей вероятностью относится данный шаблон.Вероятности отношения к данным кластерам прибавляются к столбцам сномерами этих кластеров. Гистограммы для каждой подобласти всех габоровскихизображений соединяются, формируя итоговую гистограмму признаков10Рис.
5. Алгоритм распознавания лиц на основелокальных квантованных шаблонов и фильтров Габора11изображения. Затем для решения задачи идентификации лица общая гистограммапризнаков сравнивается с ранее составленными гистограммами признаковэталонных лиц, хранящихся в базе.В четвертой главе проводится анализ работы предложенного алгоритмараспознавания лиц на телевизионных изображениях в условиях искажений.Исследования проводились для двух модификаций разработанного алгоритма наоснове локальных квантованных шаблонов (с фильтрами Габора и без них).
Длясравнения взяты алгоритмы, входящие в открытую библиотеку OpenCV: алгоритмна основе линейного дискриминантного анализа (ЛДА), алгоритм на основе методаглавных компонент (МГК) и алгоритм на основе классических линейных бинарныхшаблонов (ЛБШ). На базе FERET проведены следующие стандартные тестыалгоритмов в условиях искажений: fb – изменение выражения лица, fc – сменаосвещения, dup-I и dup-II – возрастные изменения лица. Все алгоритмы обучалисьна наборе fa базы FERET, состоящем из 1196 классов (по одному изображению накласс). Результаты работы алгоритмов приведены в табл. 3.Таблица 3. Уровень верного распознавания алгоритмов распознавания на тестовой базе FERETАлгоритмТестовый наборfbfcdup-Idup-IIМГК73,06,734,115,4ЛБШ78,121,138,120,9ЛДА79,39,836,319,2ЛКШ (без фильтров Габора)97,645,461,650,4ЛКШ-Г (с фильтрами Габора)98,696,473,471,4Установлено, что предложенный алгоритм на основе локальных квантованныхшаблонов позволяет на 20% увеличить долю верного распознавания по сравнениюсо стандартным алгоритмом на основе ЛБШ на тесте fb.
Применение фильтровГабора совместно с алгоритмом распознавания на основе локальных квантованныхшаблонов увеличивает уровень распознавания на тесте fb базы FERET с 97,6%до 98,6%. При анализе возрастных изменений на тестах dup-I и dup-II использованиефильтров Габора повышает робастность на 12–21%. Уровень верного распознаванияна стандартном тесте fc базы FERET при использовании фильтров Габора возрастаетс 45,4% до 96,4%.Для проверки робастности алгоритмов распознавания к другим видамискажений обученные на наборе fa базы FERET алгоритмы тестировались наизображениях из набора fb, которые изменялись согласно стандартным моделямцифровых искажений.
Исследовалась робастность алгоритмов к размытиюизображения, наличию на изображении импульсного, аддитивного беловогогауссовского и мультипликативного шумов, сжатию изображения алгоритмамиJPEG и JPEG2000 c коэффициентами сжатия K 1 и K 2 соответственно (рис. 6).Искажение вида «размытие» моделировалось с помощью свертки изображенияI ( x, y ) с единичной квадратной маской размером (2 R + 1) × (2 R + 1) . Воздействиеимпульсного шума вида «соль и перец» моделировалось заменой с вероятностью pизначения яркости каждого пикселя изображения на 0 или 255. Искажениегауссовским шумом моделировалось путем добавления к сигналу нормально1210080806060P, %P, %1004020040МГКЛБШЛДАЛКШЛКШ-Г01МГКЛБШЛДАЛКШЛКШ-Г203240500.050.250.2pиа)б)1001008080МГКЛБШЛДАЛКШЛКШ-Г40МГКЛБШЛДАЛКШЛКШ-Г60P, %P, %60402000.150.1R2000.050.1σг20.150.200.2500.005в)0.01σc20.0150.020.025304050г)80806060P, %100P, %1004020040МГКЛБШЛДАЛКШЛКШ-Г010МГКЛБШЛДАЛКШЛКШ-Г2020304005001020K1K2д)е)Рис.
6. Графики зависимости уровня верного распознавания P от степени искажений:а) размытие; б) импульсный шум; в) гауссовский шум; г) мультипликативный шум;д) сжатие алгоритмом JPEG; е) сжатие алгоритмом JPEG200013распределенной шумовой составляющей η г ( x, y ) с дисперсией σ г . Искажениемультипликативным шумом моделировалось добавлением к полезному сигналуI ( x, y ) шумовой составляющей η с ( x, y ) ⋅ I ( x, y ) , где η с ( x, y ) является нормальнораспределенной случайной величиной с дисперсией σ с2 .Зависимости, приведенные на рис.
6, демонстрируют, что локальныебинарные и квантованные шаблоны без надлежащей предобработки не способныработать в условиях гауссовского, импульсного и мультипликативного шумов исерьезно страдают от помех, связанных со сжатием и размытием изображения.Использование фильтров Габора позволяет сохранить уровень верногораспознавания алгоритма на основе локальных квантованных шаблонов выше 90%при размытии с R ≤ 4 ; гауссовском шуме с σ г < 0,15 ; мультипликативном шумес σ c < 0,02 ; 20-кратном сжатии изображения алгоритмом JPEG и 30-кратном сжатииJPEG2000. Такой уровень распознавания не доступен робастным к большинствуискажений алгоритмам на базе ЛДА и МГК. Менее робастным алгоритм ЛКШ-Гоказывается к импульсному шуму, показывая уровень распознавания выше 80%только при pи < 0,05 .Проведенные исследования на базе Robotics показали, что уровень верногораспознавания алгоритма на основе локальных квантованных шаблонов и фильтровГабора при работе с 90 классами падает до значения 80% при угле поворота головыв 30°.
Таким образом, предложенный алгоритм оказывается не робастным кбольшим отклонениям лица от фронтального положения.Проведенные тесты на базе CMU Multi-PIE помогли сформировать требованияк равномерности освещения лица. Для получения уровня верного распознаваниявыше 90% на фронтальных лицах при использовании алгоритма на основелокальных квантованных шаблонов с фильтрами Габора и базы данных, состоящейиз около 300 классов, источник света должен находиться к объектам наблюденияпод углом, не большим 30°.ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ1. Разработан итерационный алгоритм локализации центров глаз на изображенияхлиц, использующий мультиблочные локальные бинарные шаблоны. Предложенныйалгоритм практически на порядок превосходит по скорости работы известныеалгоритмы локализации глаз (байесовский, градиентный), позволяя производитьпоиск положения глаз в видеопотоке в режиме реального времени.