Диссертация (1172947), страница 7
Текст из файла (страница 7)
Метод гистограмм локальных бинарных шаблонов Габора (МГЛБШГ).Данный метод подразумевает нестатистический подход к распознаваниюлиц, сочетающий вейвлеты Габора и локальные бинарные шаблоны (ЛБШ), чтоповышает репрезентативность пространственной гистограммы. Представлениелица с использованием вейвлетов Габора продемонстрировало устойчивость ктаким вариациям, как изменение освещения, масштаба, смещение и вращениераспознаваемого объекта.
В МГЛБШГ используются вейвлеты Габора и ЛБШ дляпреобразования изображения лица в последовательность гистограмм. Методзаключается в трех шагах.На первом шаге для получения изображения, называемого «представлениевейвлетом Габора» (ПВГ), необходимо выполнить свертку оригинальногоизображения с фильтром Габора [136]. ПВГ можно получить следующимобразом:Gμ,v= f(z) ∗ φμ,v(z),(1.17)где: f( )изображение; ∗ оператор свертки; φ фильтр Габора с частотой и ориентацией.На втором шаге применяется оператор ЛБШ к ПВГ для получениялокальных габоровских бинарных шаблонов (ЛГБШ) изображения. ЛБШ – этооператор, который для извлечения структурных характеристик, перемещает окноразмером 3x3 по изображению.
Известно, что полученные характеристикиустойчивы к изменению освещенности и другим шумам, вызванными различнымивариациями [99]. ЛБШ описан ниже.36̅(1.18)где:это двоичная строка, отображающая структурную особенность вокрестности X;операция конкатенации; Wокно размером 3x3; ̅среднее значение интенсивности пикселей в W; пиксель в окне W;( ̅значения интенсивности пикселя p; )сл{̅функция сравнения.нТипичный пример оператора ЛБШ представлен на рисунке ниже.
Несмотряна простоту оператора ЛБШ, при его использовании для обнаружения ираспознания лица демонстрируются хорошие показатели.122635212̅=400011100000010001=1717Рисунок 1.10 Пример оператора ЛБШ.На третьем этапе ЛГБШ изображения разбивается на подобласти 15x15пикселей. После чего строятся гистограммы подобластей.Для определения степени схожести двух изображений лиц необходимосравнить гистограммы, полученные после вышеописаннойПГЛГБШ.Сходствоизображенийможетмеждугистограммамиизмерятьсяэталонногопосредствомирасстоянияпроцедуры–проверяемогоБхаттачариа(Bhattacharyya), представленного ниже.√где:гистограммы;∑ √∗̅̅̅̅̅̅̅̅√,(1.19)37 общее число интервалов гистограммы; ̅определяется следующим образом:̅∑ .(1.20)Значение расстояния Бхаттачариа равно 0, если гистограммы в точностиодинаковы, и оно стремится к 1 по мере того, как увеличивается уровень различиямежду гистограммами.
Таким образом, за успешно распознанное изображениелица, в соответствии с процедурой МГЛБШГ, можно выбрать проверяемоеизображение с наименьшим значением расстояния Бхаттачариа.1.3.1.3 Гибридные методыГибридные методы, включающие как холистические, так и локальныеметоды, используются для повышения эффективности распознавания. Этодостигается благодаря сохранению сильных сторон каждого из них инивелированиюнедостатков.Вхолистическихпризнакахсодержитсястатистическая сводка о пространственных свойствах макета, описывающаяглобальные контуры и текстуру изображения.
С другой стороны, локальныепризнаки могут представлять подробные частные свойства.Пентленд и другие авторы [124] применили принцип «собственных лиц» кнекоторым частям лица, таким как глаз, нос и рот, что позволило ввести понятие«собственные глаза», «собственный нос» и «собственный рот». В работе Ланитасаи др.[114] рассматривается гибкая модель внешнего вида распознавания лица,которая использует статистическую информацию о форме лица, а именноактивную модель формы (АМФ) и информацию о градации серого; в обоихслучаях используется МГК.В таблице 1.2 приведен сравнительный анализ методов распознавания лица.1.3.1.4 ВыводТаким образом, анализ методов идентификации человека на основеуникальности биометрии лица показал, что используемые в настоящее времяметоды обладают рядом недостатков, связанных, прежде всего, с вычислительной38трудоемкостью и рядом неточностей при распознавании человеческого лица.Использование данных методов в подсистеме технического зрения ИАСсопряжено со сложностями принятия решений оператором как из-за неточностираспознавания, так и из-за того, что при увеличении на порядок числараспознаваемых людей система может перестать работать в режиме «реальноговремени».
Кроме того, использование современных методов в существующихсистемах не позволяет оператору анализировать места пребывания физическоголица в прошлом по полученным видеоданным, вести поиск лиц в видеопотоке пофотографиям и решать аналитические задачи.Основываясьначеловеческомзрении,котороеиспользуетдляраспознавания как холистические, так и локальные особенности [128], ипостроенных математических моделях во 2-ой главе, в 3-ей главе данной работыпредлагается вычислительно-эффективный гибридный метод распознавания лиц.39Таблица 1.2 – Сравнительный анализ методов распознаванияМетодСравненияэталоновЛинейногодискриминантногоанализаМГЛБШГГлавных компонентЭластичного графаАнтропометрическиххарактеристик лица-+--++-+--++++/----+пол, наличие очков,наличие бородыпол, наличие очков,наличие бороды----Метод сравненияглавные компонентыфункция подобияджетовметрикапопиксельноглавные компонентыгистограммыподобластейКомпактный наборхарактеристик дляхранения в БДглавные компонентыграф, джетыметрикафрагментыизображенияглавные компонентывейвлеты Габорахранение и поискизображения вбольших БДспособностьнаходить подобныеточкипростота идеипростейшийалгоритм сравненияхранение и поискизображения вбольших БДвысокая точностьвычислительнаятрудоемкостьсложность выборасовокупности точек,наилучшим образомописывающихчеловеческое лицо, инадежного нахождениятаких точек.вычислительнаятрудоемкостьвычислительнаятрудоемкостьвычислительнаятрудоемкостьХарактеристикаУстойчивость кяркости и контрастуУстойчивость кнезначительномуизменениювнешности (борода,очки и т.д.)Устойчивость кизменению ракурсаВозможностьопределенияхарактеристикчеловекаПреимуществаНедостаткинеточность приработе с объемнымибазами данных401.3.2 Алгоритмы определения соответствия заданному образуДалее рассмотрим, как можно автоматически сравнивать между собой такиеобъекты, как изображения.
Внимательно также посмотрим на характер храненияданных об изображениях.Согласно [44]: «для оценки при помощи ЭВМ сходства или различияобъектов, необходимо ввести формальную меру сходства (различия), в терминахкоторой ЭВМ и будет сравнивать объекты между собой. Взадачахраспознавания объектов, описываемых наборами ключевых точек, исходнаяинформацияпредставляетсяввидеконечногомножествавекторов(дескрипторов) с действительными компонентами» (с.12-13).Воспользуемся этим источником для того, чтобы уточнить формулы дляопределения дистанции между объектами распознавания.
Будем считать, чтовходной объект имеет обозначениеx ϵ X = {x1, x2, …, xr},(1.21)где x1, x2, …, xr – характеристики (признаки) входного объекта x, а r – числопризнаков хранения (и сравнения).Для хранимых данных выберем обозначение y, при этомy ϵ Y = {Y1, Y2, …, Ym} ,(1.22)Yi = {y1i, y2i, …, yri},(1.23)где Y1, Y2, …, Ym – множество из m хранимых объектов;m – общее число объектов в БД или их кластеров, представленных однимили несколькими типовыми (средними) объектами хранения;y1i, y2i, …, yri – характеристики (признаки) хранимого объекта y;r – число признаков хранения (и сравнения).Тогда метрику пространства распознавания, которое строится алгоритмамиИАС при проведении распознавания, будем обозначать как g(x, y).41Наиболее простой и естественный способ задания пространства значенийдля g(x, y) предположение о его евклидовом характере.
Тогда расстояние в нѐмизмеряется как корень квадратный из суммы квадратов разниц значений x и y._________g(x, y) = √ ∑ (xi – yji)2 .(1.24)rПри этом, разумеется, проводить вычисление расстояния g(x, y) необходимоm раз по числу объектов в БД или их кластеров, представленных одним илинесколькими объектами хранения.Часто для определения расстояний в пространстве изображений приходитсяиспользовать более простую метрику. Это связано с сокращением общегоколичества операций при проведении сравнения.
В этом случае расстояние можетопределятьсякаксуммамодулейразностеймеждусоответствующимипризнакамиg(x, y) =∑ |xi – yji|.(1.25)rИногда необходимо выполнять операцию, обратную операции определенияпринадлежности входного изображения к данному кластеру (образу). В этомслучае расстояние может измеряться по следующей формулеg(x, y) =∑ (xi – yji)2 .(1.26)rКвадраты разности значений характеристик используются как раз для того,чтобымаксимизироватьобщеезначениерасстояниязасчѐтнаиболее«удалѐнных» друг от друга признаков.Для получения более точных данных о соответствии сравниваемыхизображений друг другу уместно вводить в расчѐт расстояния весовыекоэффициенты для каждого из признаков. Тогда формула для его расчѐта имеетследующий вид___________g(x, y) = √ ∑ γi (xi – yji)2r.(1.27)42При этом вычисление коэффициентов γi обычно связано с получениемоценок экспертов.
Поэтому зачастую γi имеют вид оценокγi ϵ ϔ = {ϔ1, ϔ2, …, ϔK},(1.28)γi = 1/K ( ∑ ϔi ).(1.29)иKЗадание весовых коэффициентов расстояний между объектами требуетаприорной информации о них. А оценки экспертов или не всегда дают нужнуюточность, или невозможны в принципе. Поэтому целесообразно измерятьзначения в расстояниях между объектами по таким формулам, в которыхвозможно выравнивание весов в слагаемых от различных признаков объектов.Это особенно актуально, если веса или их оценки имеют значительный разброс позначениям. Для этого, например, можно использовать расстояние по Камберу.Принимая уже введѐнные ранее обозначения, формула для расчѐта расстоянияпринимает следующий видg(x, y) = ∑ |xi – yji| / |xi + yji| .r(1.30)Формулу уместно применять в случае необходимости масштабныхизменений (резкого увеличения или резкого уменьшения) изображения, в которомбудут сохранены основные отличительные признаки идентификации (например,главные компоненты).Если предположить, что значения получены как значения функцийx ϵ X = { v1(x), v2(x), …, vr(x) },(1.31)y ϵ Y = { z1(y), z2(y), …, zr(y) },(1.32)где vi(x), zi(y) – значения некоторых функций (например, показаниядатчиков), и при этомvi(x) = {Rn → R1} ,(1.33)zi(y) = {Rn → R1} ,(1.34)то расстояние между объектами X и Y можно рассчитать по формулеЧебышева43g(v(x), z(y)) = max | vi(x) – zi(y) |.i(1.35)Аналогом евклидовой метрики является метрика «городских кварталов» илиманхэттенская метрика, определяемая как разность модулей «координат»(значений признаков в многомерном пространстве) сравниваемых объектов.Характерной еѐ чертой является то, что для неѐ сглаживаются большие отличия взначениях признаков.