Диссертация (Распознавание лица на телевизионных изображениях при наличии искажающих факторов), страница 12
Описание файла
Файл "Диссертация" внутри архива находится в папке "Распознавание лица на телевизионных изображениях при наличии искажающих факторов". PDF-файл из архива "Распознавание лица на телевизионных изображениях при наличии искажающих факторов", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
Этот набор отличает от fa изменение параметровосвещения и смена модели фотокамеры. Наборы dup-I и dup-II состоят из 722и 234 изображений соответственно. Они были сняты через некоторыйпромежуток времени после изображений из fa. Набор dup-II является болеесложным поднабором dup-I, в котором отобраны изображения, снятыеминимум через полтора года после снимков из fa. Таким образом, обученныйна fa алгоритм распознавания проверяется на робастность к изменениюфакторов съемки с помощью различных наборов: fb – проверяет робастностьпри изменении выражения лица, fc – при смене условий освещения, dup-I иdup-II – при возрастных изменениях лица (рис. 4.2).Исследованияпроводилисьдляпредложенногоалгоритмараспознавания на основе модифицированных локальных квантованныхшаблонов с использованием фильтров Габора и без них, а также трехоткрытых алгоритмов, входящих в библиотеку OpenCV [84, 85]: алгоритмомна основе линейного дискриминантного анализа,алгоритмом на основеметода главных компонент и алгоритмом на основе классических линейныхбинарных шаблонов.
Результаты сравнительного анализа алгоритмов натестовых наборах fb, fc, dup-I, dup-II приведены в табл. 4.1.85а)б)в)г)д)е)Рис. 4.2. Примеры изображений из базы FERET: а) fa – обучающее; б) fb – измененовыражение лица; в) fc – изменено освещение; г) fa – обучающее; д) fb – измененовыражение лица; е) dup-I – снято через некоторое время после обучающегоТаблица 4.1Уровень верного распознавания алгоритмов при тестах на базе FERETАлгоритмТестовый наборfbfcdup-Idup-IIСреднееМГК (OpenCV)73,06,734,115,432,3ЛДА (OpenCV)79,39,836,319,236,2ЛБШ (OpenCV)78,121,138,120,939,6ЛКШ (без фильтров Габора)97,645,461,650,463,8ЛКШ-Г98,696,473,471,485,0(сфильтрамиГабора)86Установлено, что предложенные алгоритмы на основе локальныхквантованных шаблонов позволяют на 20% увеличить процент правильногораспознавания по сравнению со стандартными алгоритмами на тесте fb.При этом удается получить высокий средний уровень распознавания – 85%(на хорошей выборке – до 98,6%) при обучении на 1196 классах.Использование фильтров Габора в предложенном алгоритме позволяетсущественно повысить робастность к изменениям условий освещения.При анализевозрастныхизмененийиспользованиефильтровГабораповышает робастность на 12–21%.
Стандартные алгоритмы на такой выборкене работают.4.3. Анализ работы алгоритмов распознавания лиц при наличииискажений, вызванных размытием, сжатием, шумомТелевизионныеизображения,частооказываютсяподвлияниемразличных помех, связанных с ошибками при передаче сигнала, сжатиемсигнала, расфокусировкой камеры и шумом при записи изображения.Робастность алгоритмов распознавания лиц к таким искажениям проверяласьна изображениях из набора fb базы FERET, которые изменялись согласностандартным моделям цифровых искажений. В качествеэталонныхизображений объектов наблюдения были взяты неискаженные изображенияиз набораfa.
Исследовалась робастность алгоритмов к размытиюизображения, наличию на изображении импульсного, гауссовского имультипликативного шумов, сжатию изображения алгоритмами JPEG иJPEG2000.4.3.1. Размытие изображенийИскажение вида «размытие» изображения I ( x, y ) моделировалось спомощью свертки изображения с единичной квадратной маской размером~(2 R + 1) × (2 R + 1) . Искаженное изображение I ( x, y ) в этом случае можноописать следующим выражением:87~I ( x, y ) =1(2 R + 1) 2RR∑ ∑ I ( x − i, y − j ).(4.1)i =− R j =− RПример размытого изображения из набора fb базы FERET представленна рис. 4.3.а)б)в)Рис.
4.3. Воздействие на изображение искажения вида «размытие»:а) исходное изображение; б) размытое изображение с R = 3 ;в) размытое изображение с R = 5Все 1195 изображений из набора fb подвергались размытию сR = {1,...,5} .Затемнакаждомискаженномизображенииалгоритмураспознавания требовалось идентифицировать человека, лицо которогонаходилось в кадре. Уровень верного распознавания P исследуемыхалгоритмов, полученный в результате экспериментов, показан на рис. 4.4.8810080P, %6040ЛКШ-ГЛКШЛДАМГКЛБШ200012345RРис. 4.4. Результаты работы алгоритмов распознавания на изображениях с размытиемУстановлено, что алгоритмы на основе МГК и ЛДА оказалисьробастными к размытию изображений. Это связано с использованием болеенизкого разрешения, к которому приводятся изображения перед процедуройпоиска собственных векторов.
Уровень распознавания алгоритмов на основеЛБШ и ЛКШ постепенно падает с увеличением радиуса размытия. Такоеповедение алгоритмов связано с их высокой чувствительностью к локальнымизменениям изображения. Уровень распознавания алгоритма ЛКШ-Г падаетна 10% при увеличении радиуса размытия изображений до R = 5 всравнении с уровнем распознавания на неразмытых изображениях.Использование фильтров Габора позволяет существенно повыситьробастность алгоритма на основе локальных квантованных шаблонов кискажению вида «размытие» и при высокой степени размытия R = 5повышает точность распознавания на базе FERET с 40% до 88%.89Предложенный алгоритм ЛКШ-Г показывает лучший результат среди всехисследуемых алгоритмов распознавания при всех рассмотренных степеняхразмытия.4.3.2.
Импульсный шумИмпульсный шум характеризуется заменой части пикселей наизображениизначениямификсированнойилислучайнойвеличины.Появление такого вида шума на изображениях может быть связано,например, с ошибками при передаче изображений. В исследованииалгоритмов распознавания использовалась модель импульсного шума «сольи перец». Значение яркости каждого пикселя на изображении с вероятностьюpи заменялось на 0 («перец») либо на 255 («соль»). С вероятностью 1 − pипиксель оставался неизменным [9]. Пример изображения из базы FERET,подверженного влиянию импульсного шума, представлен на рис. 4.5.Изображения из набора fb подвергались воздействию импульсногошума с pи = {0,05, ..., 0,25} .
Результаты работы алгоритмов распознавания назашумленных изображениях показаны на рис. 4.6.а)б)в)Рис. 4.5. Воздействие на изображение импульсного шума вида «соль-перец»:а) исходное изображение; б) искаженное импульсным шумом с p и = 0,1 ;в) искаженное импульсным шумом с p и = 0,29010080P, %6040ЛКШ-ГЛКШЛДАМГКЛБШ20000.050.10.150.20.25pиРис. 4.6. Результаты работы алгоритмов распознавания при наличии импульсного шумаУстановлено, что точность работы всех исследуемых алгоритмовраспознаваниялицсерьезнострадаетотналичиянаизображенииимпульсного шума. В наименьшей степени подвержен влиянию импульсногошума алгоритм на основе МГК.
Уровень верного распознавания этогоалгоритма падает с 73% при отсутствии шума до 56%, когда четвертьпикселейнаизображенииповреждены( pи = 0,25 ).Уровеньверногораспознавания алгоритмов на основе локальных бинарных и квантованныхшаблоновопускаетсядоблизкихкнулюзначенийприpи > 0,2 .Использование фильтров Габора увеличивает процент верного распознаванияпри pи = 0,2 до 55% и до 47% при pи = 0,25 .При повреждении импульсным шумом более 10% пикселей наизображении наилучшие результаты распознавания показывает алгоритм наоснове МГК.914.3.3.
Аддитивный белый гауссовский шумИскаженноеаддитивнымбелымгауссовскимшумом(АБГШ)изображение описывается согласно выражению [9]:~I ( x, y ) = I ( x, y ) + η г ( x, y ),(4.2)где η г ( x, y ) является нормально распределенной случайной величиной сматематическим ожиданием µг и дисперсией σ г2 .Для установления соответствия с дисперсией АБГШ σ г2 , используемойпри работе с изображениями в пакете MATLAB, интенсивность пикселейисходного изображения I ( x, y ) нормировалась так, что самый яркий пиксельстановился равным единице.
Для стандартного 8-битного изображения вградациях серого интенсивность самого яркого пикселя равна 255, поэтомудля нормировки такого изображения интенсивность каждого пикселя делитсяна255.Примерискажений,которыевноситгауссовскийшумснулевым математическим ожиданием µг и различными дисперсиями σ г2 наизображение лица, представлен на рис. 4.7.а)б)в)Рис.
4.7. Воздействие на изображение АБГШ: а) исходное изображение;б) искаженное АБГШ с σ г2 = 0,1 ; в) искаженное АБГШ с σ г2 = 0,25Изображения из набора fb подвергались воздействию АБГШ с нулевым2математическим ожиданием µ г = 0 и дисперсиями σ г = {0,05,..., 0,25} .Результатыработыалгоритмовраспознаванияизображениях приведены на рис. 4.8.92назашумленных10080ЛКШ-ГЛКШЛДАМГКЛБШP, %604020000.050.150.10.20.25σг2Рис.
4.8. Результаты работы алгоритмов распознавания при наличии АБГШУстановлено, что алгоритмы на базе локальных квантованных ибинарных шаблонов чувствительны даже к небольшому изменению значенийяркости пикселей, поэтому они оказываются неробастными к воздействиюгауссовского шума. Уровень верного распознавания алгоритма на базе МГКпрактически не меняется даже при высокой степени шума на изображении.Алгоритм на основе ЛДА также оказывается довольно устойчивым квоздействию АБГШ, позволяя проводить распознавание при дисперсииσ г2 = 0,25 с точностью около 70%. Использование фильтров Габорапозволяет сохранить уровень верного распознавания алгоритма на основелокальных квантованных шаблонов выше 90% при гауссовском шуме сσ г2 < 0,15 .
Алгоритм ЛКШ-Г сохраняет лидерство среди всех рассмотренныхалгоритмов распознавания при всех исследуемых степенях шума.934.3.4. Мультипликативный шумМультипликативная модель шума применяется, когда можно считать,что полезный сигнал умножается на случайный сигнал. Одной из наиболеераспространенных среди существующих моделей мультипликативного шумаявляется модель спекл-шума. Действие спекл-шума на изображениеописывается следующим выражением~I ( x, y ) = I ( x, y ) + η с ( x, y ) ⋅ I ( x, y ),(4.3)где η с ( x, y ) является нормально распределенной случайной величиной сдисперсией σ с2 .Интенсивность пикселей исходного изображения I ( x, y ) нормироваласьаналогичным образом, как и при экспериментах с АБГШ.Изображения из набора fb подвергались воздействию спекл-шума сдисперсиямиσ c2 = {0,005, ..., 0,025} .Примеризображениялица,подверженного влиянию спекл-шума, представлен на рис. 4.9.