Глава 6 (Учебник - информационные системы), страница 19
Описание файла
Файл "Глава 6" внутри архива находится в папке "Учебник - информационные системы". Документ из архива "Учебник - информационные системы", который расположен в категории "". Всё это находится в предмете "информационные устройства и системы" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "информационные устройства и системы" в общих файлах.
Онлайн просмотр документа "Глава 6"
Текст 19 страницы из документа "Глава 6"
L = L0 (Lф/Lи),
где L0 - исходное значение яркости, Lф - суммарная яркость пикселей фильтра, Lи - суммарная яркость пикселей исходного изображения в текущей фильтруемой области.
Таким образом, результатом фильтрации является отклик :
здесь W и H - соответственно ширина и высота фильтра (маски), lij и lфij - значения яркости пикселя изображения и пикселя фильтра соответственно. Минимум соответствует левому верхнему углу области изображения размером WH, содержащему искомый элемент - правый глаз.
Далее в секторе изображения с центром в правом глазе и дугой 20 ищется левый глаз (рис. 6.56б), после чего осуществляется поворот изображения так, чтобы глаза оказались на одном уровне по горизонтали (рис. 6.57а). Изменение ориентации требует уточнения первоначального положения центра лица (как середины отрезка, соединяющего глаза), и координаты масок определяются относительно нового центра (рис. 6.57б).
Н а следующих этапах выделяются области остальных масок (рта, носа, подбородка и носогубных складок) и осуществляется их поиск по величине отклика . Таким образом, в процессе регистрации, формируется полная модель лица, которая сохраняется в базе данных. Модель описывается набором векторов rk, связывающих центр лица с центрами найденных элементов.
Алгоритм распознавания (верификации) близок к алгоритму регистрации. Текущее изображение лица сравнивается со всеми моделями из базы данных, в результате чего формируется некоторый функционал F, равный:
F = (rk* C1k; k C2k),
здесь rk* - вектора соединяющие центры k-ых элементов исходного изображения с центрами элементов верифицируемого лица, C1k, C2k - весовые коэффициенты, показывающие влияние смещения и отклика каждого элемента на результирующий счет. Параметр k = min k вычисляемый через величину откликов, определяется по всей области, в которой производилась фильтрация с помощью соответствующей маски.
В результате верификации принимается решение об идентичности сравниваемых лиц (рис. 6.58). Лица считаются идентичными при условии, что 100 - F P, где P – заранее заданный порог сравнения.
6.7.2. Особенности получения трехмерных изображений
В завершении вкратце рассмотрим принципы анализа трехмерных сцен. Этому вопросу в последнее время уделяется значительное внимание, созданы соответствующие алгоритмы распознавания. В большинстве случаев они относятся к различным частным задачам, во всяком случае, универсальных описаний трехмерных объектов не получено [ ]. СТЗ, как правило, ограничиваются анализом плоских изображений и этого оказывается достаточно для надежного распознавания типовых объектов промышленного назначения. Однако при этом возникает необходимость надлежащей ориентации объектов в поле зрения телекамеры. Типичным решением является обеспечение ортогональности оптической оси камеры и рабочей сцены. Кроме того, необходимо, чтобы в поле зрения оказалась именно та поверхность объекта, которая использовалась на этапе описания, при формировании признаков объекта. Все эти ограничения выполнимы в случае детерминированной рабочей сцены, когда существует возможность ее некоторого упорядочивания. В более сложных задачах все же приходится учитывать трехмерный характер рабочей сцены.
В СТЗ под трехмерным понимают изображение, содержащее информацию о трех геометрических измерениях объекта. Оно может быть получено с помощью двух телекамер (3D), или могут использоваться специальные приемы. (В этом случае, обычно говорят о 2,5D или K2D изображениях). При использовании 2-х телекамер, каждая из них обрабатывает свой плоский 2D образ, на основании описанных выше принципов. Если известна ориентация каждой камеры и расстояние между ними, всегда можно восстановить третью координату объекта (рис. 6.59). Основная трудность этого метода заключается в идентификации каждой точки объекта по их плоским изображениям на двух камерах, особенно в случае нечетких изображений. Обычно две телекамеры используются в задачах телеуправления, в мобильных роботах и др. (Примерами таких роботов являются отечественные разработки МРБ-25, МГТУ им. Н.Э. Баумана и «Богомол», ИФТП). При необходимости, результирующее 3D изображение может быть выведено на обычный монитор, что применяется, например, в задачах телеуправления. С этой целью, в одно поле вводится информация с одной камеры, а в другое - с другой. Другими словами, нечетный полукадр развертки образует видеосигнал, например, с левой телекамеры, а четный - с правой. Ясно, что такое изображение субъективно воспринимается как двоящееся. Поэтому, для получения бинокулярного эффекта необходимо использовать стереоочки.
Д ругой распространенный способ получения «псевдотрехмерных» изображений, требует только одного телевизионного датчика и связан с применением «структурированной подсветки» (рис. 6.61). В частности, он используется в лазерных 3D-сканерах. Объект освещается от проектора через матрицу - транспарант с периодической системой полос, а изображение воспринимается камерой, расположенной под некоторым параллаксным углом к оси проектора. Зная расстояние (период) между полосами, а также взаимное положение камеры и проектора, можно восстановить форму объекта. Полученное изображение объекта в виде бинарных искривленных линий можно интерпретировать как результат фазовой пространственной модуляции оптического сигнала. Действительно, если периодическую сетку, спроецированную на плоский экран считать несущим сигналом, то любая неплоская поверхность вносит фазовую модуляцию в этот сигнал, причем закон модуляции линейно связан с профилем поверхности в направлении оптической оси камеры. Данный способ также позволяет восстановить третью координату объекта. Рис. 6.60а и б иллюстрируют принцип восстановления рельефа объекта и наблюдаемая на экране его трехмерная модель. Обозначив Tx - период полос транспаранта вдоль оси Х, - паралаксный угол, определим период полос, воспринимаемых камерой: Txk = Tx/tg. Следовательно, для любой точки на изображении с координатами xk, yk, принадлежащей i-ой линии транспаранта можно восстановить третью координату zk:
zk = xk /tg = (xk – iTxk)/tg.
В завершении заметим, что в описанных подходах к анализу трехмерных сцен, собственно обработка информации производится на двухмерных образах. Третья координата используется, как правило, для вычисления дальности до объекта или при определении взаимного положения нескольких объектов сцены. Обширная библиография, посвященная алгоритмам обработки трехмерных сцен приведена в [ ].
Вопросы для самостоятельной подготовки
-
Когда поверхность воспринимается разноцветной?
-
В чем разница между кадром и полем?
-
Что такое цветоразностные сигналы?
-
Как получить черный цвет в системе RGB?
-
Что такое чувствительность телекамеры, и какой тип камеры обладает наивысшей чувствительностью?
-
Как соотносятся пропускные способности каналов цифровой и аналоговой записи изображений?
-
Зависит ли разрешающая способность видикона и ПЗС-камеры от полосы частот сигнала изображения?
-
В чем разница между дискретизацией и квантованием видеосигнала?
-
Применяется ли субдискретизация к полутоновым изображениям?
-
В чем сущность медианной фильтрации?
445