Диссертация (Распознавание лица на телевизионных изображениях при наличии искажающих факторов), страница 2
Описание файла
Файл "Диссертация" внутри архива находится в папке "Распознавание лица на телевизионных изображениях при наличии искажающих факторов". PDF-файл из архива "Распознавание лица на телевизионных изображениях при наличии искажающих факторов", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве РТУ МИРЭА. Не смотря на прямую связь этого архива с РТУ МИРЭА, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Lukac, T. Kanade[5, 27, 33, 52, 87, 95].Первые работы по распознаванию динамических объектов былиопубликованы еще в конце 1980-х гг. Следует отметить значительный вкладсоветских и российских ученых, занимающихся в данной области, таких какЮ.И. Журавлев, В.А. Сойфер, Е.В. Медведева, А.И. Галушкин, В.Н. Вапник,А.Я. Червоненкис,Б.А. Алпатов,М.Н. Фаворская,Ю.В. Визильтер,А.С. Конушин [10, 12, 13, 96].При всем многообразии различных алгоритмов и методов распознаваниялиц, в большинстве из них можно выделить три основных этапа [94]:− преобразование исходного изображения в стандартное представление;− выделение ключевых характеристик (признаков);− классификация по имеющейся базе изображений лиц.На текущем этапе развития систем технического зрения для решениязадачираспознаваниялициспользуютсяразличныеподходы,основанные на вейвлетах Габора, дискретном косинусном преобразовании,обнаружении ключевых точек лица и определении расстояния между ними,вычислении геометрических свойств лица, методе главных компонент,5линейном дискриминантном анализе, обнаружении локальных признакови др.
[5, 27–46].В реальных системах охранного телевидения задачу распознаванияобъектов приходится решать в условиях наличия искажений, связанных спомехами в радиотехнических устройствах и сжатием двумерного сигнала[1, 2, 4, 90]. Поэтому для эффективного решения поставленной задачитребуется применение специализированных алгоритмов цифровой обработкиизображений. Среди них можно выделить современные алгоритмы сжатиявидеоданных,нелинейныеалгоритмыфильтрацииивосстановленияизображений, вейвлет-обработку, системы, построенные на базе нейронныхсетей [6, 8–11, 70, 91, 92, 94–96].Для решения практических задач распознавания лиц актуальнымостается поиск алгоритмов, работающих в реальном или близком креальному режимах времени и позволяющих идентифицировать человека вусловиях наличия искажений и помех на телевизионных изображениях.Поэтомунасегодняшнийденьразработкаианализалгоритмовраспознавания лиц для систем охранного телевидения представляет собойактуальную научно-техническую задачу.Основнойцельюработыявляетсяулучшениехарактеристикалгоритмов распознавания лиц для работы в условиях наличия искажений ипомех, характерных для современных систем охранного телевидения.Объектом исследования являются алгоритмы распознавания лиц наизображениях, применяемые в радиотехнических системах обработки ианализадвумерныхцифровыхсигналовисовременныхсистемахприкладного телевидения.Предметомалгоритмовисследованияраспознаваниялицявляютсясцельюразработкаповышенияимодификацияэффективностифункционирования видеоинформационных систем охранного телевидения.6Задачи диссертационной работы:−анализ существующих алгоритмов детектирования и распознавания лицна телевизионных изображениях;−разработка и анализ алгоритмов локализации положения глаз наизображениях лиц;−разработка и исследование алгоритма распознавания лиц на основелокальных бинарных шаблонов;−повышение робастности алгоритма распознавания лиц в условияхналичия искажений и помех на телевизионных изображениях.Методыисследования.Прирешениипоставленныхзадачиспользовались современные методы цифровой обработки изображений,компьютерного зрения, распознавания образов, машинного обучения, теориивероятностей и математической статистики.
Для практической реализацииалгоритмов применялись современные численные методы и методыобъектно-ориентированного программирования на языке С++.Научная новизна полученных результатовВ рамках работы получены следующие новые научные результаты:−разработан итерационный алгоритм локализации положения центровглаз на основе мультиблочных локальных бинарных шаблонов;−предложена модификация алгоритма распознавания лиц на основелокальных бинарных шаблонов, показывающая свою эффективность дляразличных условий тестирования;−разработаналгоритмраспознаваниялицнаизображенияхсиспользованием фильтров Габора, робастный к воздействию различныхтипов искажений и помех, характерных для систем охранноготелевидения.7Практическая значимость полученных результатов1.Разработана методика и программное обеспечение для объективногосравнения различных алгоритмов распознавания лиц на телевизионныхизображениях при наличии искажающих факторов.2.Проведен анализ работы алгоритмов локализации положения глаз нателевизионных изображениях и предложен новый итерационныйалгоритм, позволяющий сократить число грубых ошибок локализацииглаз на изображениях низкого качества на 8–13%.3.Предложен, реализован на языке высокого уровня и протестированробастныйалгоритмраспознаваниялицнаосновелокальныхквантованных шаблонов и фильтров Габора, позволяющий увеличитьуровень верного распознавания на 20% по сравнению с существующимиоткрытыми реализациями алгоритмов распознавания лиц при тестах наунифицированной базе FERET.Разработанные алгоритмы требуют для их практической реализацииотносительнонебольшихвычислительныхресурсов,чтопозволяетиспользовать их для обработки телевизионных изображений в системахреального или близкого к реальному режимах времени.РезультатыработывнедренывсоответствующиеразработкиООО «Проектный сервис» и ООО «АйДата» г.
Ярославль. Отдельныерезультаты диссертационной работы внедрены в учебный процесс ЯрГУим. П.Г. Демидова в рамках дисциплин «Цифровая обработка изображений»,«Компьютерное зрение», а также в научно-исследовательские работы привыполнении исследований в рамках гранта РФФИ №12-08-01215-а. Полученосвидетельство о государственной регистрации программы для ЭВМ.Личный вклад автора. Выносимые на защиту научные положенияпредложены и реализованы лично автором. Практическая реализацияалгоритмовимоделированиенаЭВМисследователей при личном участии автора.8проводилиськоллективомДостоверностьполученныхнаучныхрезультатовобусловленаприменением адекватного математического аппарата, подтверждается ихсогласованностьюсрезультатамипроведенногокомпьютерногомоделирования и сопоставлением ряда полученных результатов с научнымиданными, известными из российской и зарубежной литературы.Апробация работы.
Результаты работы докладывались и обсуждалисьна следующих научно-технических конференциях:−16-я и 17-я международные конференции «Цифровая обработкасигналов и ее применение» (DSPA), Москва, 2014, 2015;−69-яи70-ямеждународныеконференции«Радиоэлектронныеустройства и системы для инфокоммуникационных технологий»(REDS), Москва, 2014, 2015;−4-я всероссийская конференция «Радиоэлектронные средства получения,обработки и визуализации информации», Нижний Новгород, 2014;−21-я международная конференция «Радиолокация, навигация и связь»(RLNS), Воронеж, 2015;−15th International Conference on Image Processing, Computer Vision, &Pattern Recognition (IPCV), Las Vegas, USA, 2011;−17th International Conference of Open Innovations Association FRUCT,Yaroslavl, Russia, 2015;−ISPRS WG V/5 and WG III/3 International Workshop «Photogrammetrictechniques for video surveillance, biometrics and biomedicine», Moscow,Russia, 2015.Публикации.
По теме диссертации опубликовано 16 научных работ, изних 3 статьи в рецензируемых журналах из перечня ВАК и 13 докладов нанаучных конференциях; получено свидетельство о регистрации программыдля ЭВМ.9Структура и объем работы. Диссертация состоит из введения, четырехглав, заключения, списка литературы, содержащего 118 наименований, трехприложений. Она изложена на 136 страницах машинописного текста,содержит 51 рисунок и 11 таблиц.Основные научные положения и результаты, выносимые на защиту1.Итерационныйалгоритмлокализацииположенияцентровглаз,значительно превосходящий известные аналоги по скорости работы идопускающий грубые ошибки локализации (err > 0,15) только для 1%изображений из тестовой базы FERET и для 4% из базы BioID.2.Алгоритм распознавания лиц на основе локальных квантованныхшаблонов, позволяющий увеличить уровень верного распознавания настандартном тесте fb базы FERET на 20% в сравнении с открытымиреализациями алгоритмов распознавания лиц из библиотеки OpenCVпри сопоставимой вычислительной сложности.3.Применение фильтров Габора совместно с алгоритмом распознавания наоснове локальных квантованных шаблонов, увеличивающее уровеньраспознавания на тесте fb базы FERET с 97,6% до 98,6% и повышающееробастность алгоритма к воздействию основных типов искажений,возникающих на телевизионных изображениях.Благодарности.
Автор выражает глубокую благодарность своемунаучному руководителю доценту Хрящеву Владимиру Вячеславовичу запомощь на всех этапах выполнения данной работы. Отдельная благодарностьпреподавателямЯрГУИ.Т. Рожкову,М.А. Дубову,А.И. Топникову,И.В. Апалькову,В.Ф. Чаплыгину,В.А. Волохову,С.Е. Биркгану,К.С. Артемову, Т.К. Артемовой, работы которых оказали значительноевлияние на формирование взглядов автора в данном научном направлении.Эти взгляды формировались также в совместной работе с коллегами полаборатории «Цифровые цепи и сигналы» кафедры динамики электронныхсистем ЯрГУ, среди которых особенно хочется отметить Ю.
Лукашевича,10А. Ганина,Д. Куйкина,М. Голубева,Л. Шмаглита,Е. Павлова,А. Шемякова,Е. Саутова,Д. Зараменского,Д. Матвеева,В. Бекренева,В. Соловьева, Е. Аминову, О. Степанову (Кисельникову), Р. Бабенко.ОсобаяблагодарностьАлександровичуБрюханову–идокторамтехническихАндреюЛеонидовичунаукПриоровупостоянную поддержку во время обучения в аспирантуре ЯрГУ.11ЮриюзаГЛАВА 1. АЛГОРИТМИЧЕСКАЯ ОСНОВА СИСТЕМДЕТЕКТИРОВАНИЯ И РАСПОЗНАВАНИЯ ЛИЦНА ТЕЛЕВИЗИОННЫХ ИЗОБРАЖЕНИЯХ1.1.
Вводные замечанияБлагодаряаппаратногоповышениюобеспечениякачестваипостоянномувидеоинформационныхиудешевлениювычислительныхустройств появилась возможность на практике реализовать теоретическиеразработки в области распознавания образов для систем охранноготелевидения,техническогозрения,зренияроботов,системанализааудитории в реальном времени [4, 5, 89]. Одной из ключевых задач,привлекающей все больший интерес исследователей во всем мире, являетсязадача идентификации человека по изображению его лица, полученному скамерынаблюдения[1, 2, 5].Технологиираспознаваниялицмогутиспользоваться в системах контроля доступа, расположенных в местахскопления большего количества людей, например, при входе на футбольныйстадиониливокзал,длядальнейшегоусовершенствованиясистем«Безопасный город» [3], в системах биометрической идентификации припересечениигосударственнойграницыидр.Сложностьзадачираспознавания лиц на изображении объясняется не только непостоянствомвыражения лица, положения головы объекта наблюдения, различнымиусловиями освещения, но и помехами, возникающими при захвате и передачевидеоизображения с камеры.Возможность создания систем распознавания, необходимым элементомкоторых является связь с высокопроизводительными вычислительнымиустройствами, во многом объясняется широким распространением всовременных цифровых системах охранного телевидения IP-видеокамер.Внутри IP-камеры осуществляется формирование аналогового видеосигнала,его оцифровка, компрессия, а соответствующий интерфейс обеспечивает12подключение IP-камеры к сети, например, Ethernet 10/100 Мбит/с (протоколыTCP/IP, HTTP и пр.).