Диссертация (1172947), страница 6
Текст из файла (страница 6)
Каждый собственный вектор выбирается таким образом,чтобы максимизировать соответствующее собственное число : ̅∑(1.3).Векторы принято называть «собственными лицами». Для ихвычисления строится ковариационная матрица: ̅∑3. ковариационная матрица ̅̅ ̅ .(1.4)имеет размерность ×, а также собственных чисел и соответствующих им собственных векторов.Отсортировав собственные числа по убыванию, можно выбрать первых собственных векторов, образующих базис нового пространствапризнаков.Таким образом, главные компоненты представляют собой m×n размерныесобственные векторы uk.
Обычно используется до 200 главных компонент.Остальные компоненты кодируют мелкие различия между лицами и шум.Кроме того «собственные лица», соответствующие вектору, имеетлицеподобный вид.Рисунок 1.5 «Собственные лица» [126]29Полученный на основе обучающей выборки набор собственных векторовиспользуетсядляпредставленияостальныхизображений(рисунок1.6).Распознавание заключается в сравнении главных компонент неизвестногоизображения с компонентами всех остальных изображений.Рисунок 1.6 Портрет, представленный в базисе главных компонент [126]Считается, что МГК является относительно быстрым, простым ипрактичным методом, однако он чувствителен к освещенности и изменениюракурса лица на изображении [106]. Таким образом, при его использовании сбольшими базами данных могут появиться проблемы с точностью.
В 3ей главепредложена попытка решения данной проблемы.2. Линейный дискриминантный анализ Фишера.В ЛДА используется информация о классах признаков для вычислениянабора векторов характеристик лица с минимальным внутрикластернымрасстоянием и максимальным межкластерным расстоянием [101].Далее рассмотрим данный метод [87]. Пусть задано k классов признаков W1,W2, … Wk, вычисленных на наборе изображений различных людей, причем Wi ={xi1, … ,ximi }, где xij – вектор признаков длины n, вычисленный для i-ой личностина j-ом изображении, и признаковобладают∑ .
В рамках ЛДА считается, что векторынормальнымраспределением,тогдаматематическоеожидание для i-го класса выражается следующим образом:∑ ,(1.5),(1.6)математическое ожидание всех классов:∑матрица внутриклассовой вариативности:∑ ∑матрица межклассовой вариативности:,(1.7)30(1.8)∑Матрица V для проецирования пространства изображения на пространствопризнаков выбирается из следующего условия:||.||Оператор(1.9)является решением уравнения на собственные числа:,(1.10)где l ϵ 1…n. Проекция вектора на подпространство ЛДА осуществляетсяследующим образом:где V- матрица векторов длины n.,(1.11)Может существовать до k-1 векторов, составляющих базис пространствапризнаков. С помощью этих векторов пространство изображений переводится впространство признаков.
По аналогии с методом «собственных лиц» векторыматрицы V называются «лицами Фишера».Метод ЛДА является достаточно устойчивым к различным условиямосвещенности и выражениям лица, но обладает большей трудоемкостью посравнению с МГК.1.3.1.2 Локальные методыДо холистических методов, которые появились лишь в последнеедесятилетие XX века, активно использовались локальные методы, т.е. алгоритмывыделения отдельных частей лица (глаза, нос и т.д.) [128].
В последнее времялокальные методы снова оказались в центре внимания, отчасти из-за ихустойчивости к окклюзии и вариациям лица. Окклюзия – это ситуация, в которойдва объекта расположены приблизительно на одной линии и один объект,расположенный ближе к камере, частично или полностью закрывает видимостьдругого объекта. Вариация – изменение объекта распознавания, связанное сизменением ракурса или освещения. У локальных методов существует двапреимущества перед глобальными методами [127]. Во-первых, изображение лица31может быть представлено в виде набора векторов отдельных частей лица, чтопозволяет получить вектора малой размерности.
Таким образом, удастся избежатьтак называемого проклятия размерности1. Во-вторых, методы извлеченияотдельных частей лица могут быть полезны, когда та или иная часть не видна.Традиционно выделяют следующие основные локальные методы идентификациичеловека.1. Сопоставление с эталоном.Метод заключается в выделении неких эталонных областей лица наизображении и в последующем – сравнение этих областей для двух различныхизображений [102].2. Анализ антропометрических характеристик лица.Метод основан на выделении и сравнении некоторых антропометрическиххарактеристик лица, таких как толщина бровей над центрами зрачков, шириналица, расстояние между центром сетчатки правого глаза и точкой кончика носа, ит.д. [84].Рисунок 1.7 Антропометрические характеристики лица3.
Методы с использованием фильтров Габора.Среди всевозможных представленных локальных методов распознаваниялиц,благодаряустойчивостикшумам,обусловленнымизменениемвосвещенности, масштабе, сдвиге и вращении [111],[120], вейвлеты Габора былипризнаны одним из самых лучших локальных методов выделения отдельныхчастей лица.1Проклятие размерности — проблема, связанная с экспоненциальным возрастанием количества данных из-заувеличения размерности пространства. Термин «проклятие размерности» был введен Ричардом Беллманом в1961 году[63].32Окрестность пикселя a(i, j) может быть представлена значениями фильтровГабора. Общий вид фильтра Габора, который характеризуется радиусами эллипсаи углом ориентации θ, представлен ниже:,где ,(1.12)является двумерным гауссианом со стандартными отклонениями, повернутым на угол θ:.√(1.13)На основе фильтров Габора предложено много подходов к распознаваниюлиц, такие как архитектура динамических связей (АДС) [113], метод гибкогосравнения на графах (МГС)[134], классификатор Габора-Фишера (КГФ) [116],объединение крупномасштабных характеристик Габора (ОКХГ) [135], методгистограмм локальных бинарных шаблонов Габора (МГЛБШГ)[136].
АДС и МГСэто методы представления лиц с использованием согласования эластичныхграфов. АДС представляет лицо прямоугольным графом с деформируемымивершинами, соответствующими отдельным чертам лица, полученными сиспользованием фильтров Габора. Вискотт и соавторы [134] расширили АДС доМГС,используяобъектно-адаптированныйграфсвершинами,которыесоответствуют конкретному лицевому ориентиру. Для распознавания лица Лю идр.
[116], применили усовершенствованный линейный дискриминантный анализФишера (ЛДАФ) к вектору черт лица, полученному с использованием фильтровГабора, и продемонстрировали, что результат превзошел как МГК, так и ЛДА.Однако общим недостатком методов распознавания лиц с использованиемфильтров Габора является высокая трудоемкость и, следовательно, низкаяскорость распознавания [76].4.Метод сравнения эластичных графов.В данном методе [33] изображения лиц описываются в виде графов свзвешенными вершинами и ребрами.
Вершины графа расположены на ключевых33точках лица, таких как контуры головы, губ, носа и пр., а также на крайних точкахэлементов лица. Каждое ребро графа помечено расстоянием между вершинами.Рисунок 1.8 Пример эластичного графаДля каждой вершины графа вычисляются джеты. Джеты – комплексныекоэффициенты габоровых функций при различных частотах и ориентациях:(1.14),где аргументы функции aj и φj – есть амплитуда и фаза, определяемые всоответствии с «обстоятельствами» окрестности ключевой точки (яркостью,цветом, контрастностью и т.п.).Джеты характеризуют локальные области изображения и могут применятьсядлянахожденияточкисоответствиязаданнойобластинаразличныхизображениях, а также сравнения соответствующих областей изображений.Для обнаружения ключевых точек в автоматическом режиме можетиспользоваться обобщенный граф [33].34Рисунок 1.9 Обобщенный графПример обобщенного графа представлен на рисунке 1.9.
Для построенияобобщенного графа необходимо иметь n подготовленных графов, которыеотображают структуру человеческого лица. Они могут быть получены путемручной расстановки точек. Тогда вершинами обобщенного графа будут являтьсявекторы из значений соответствующих вершин каждого из n графов. Ребраобобщенного графа размечены средним значением соответствующих реберкаждого из n графов.Поиск ключевых точек на изображении неизвестного лица можетосуществляться путем вычисления джетов в различных точках и сравнении их сджетами обобщенного графа при помощи функции подобия джетов (1.15).∑Процесс√∑распознаваниясостоит∑в(1.15).сравненииграфаизображениянеизвестного лица с графами изображений известных лиц.
Пример функцииподобия, которая используется для сравнения графов, представлен ниже:∑()∑̅̅̅̅̅̅̅̅̅̅̅̅̅,(1.16)где: N – количество вершин графа; Е – количество ребер графа; λ – коэффициент относительной важности топографической информации.35Методэластичныхграфовсчитаетсядовольнонадежным,однаковычислительно трудоемок. Так, в работе [76] сообщается, что при 95%коэффициентераспознаваниянасравнениеодногоизображенияс87изображениями тратилось приблизительно 25 с.4.