Воротников С.А. - Информационные устройства робототехнических систем (960722), страница 67
Текст из файла (страница 67)
К геометрическим признакам также относятся моменты инерции, инвариантные к трансляции, повороту и гомотетии. Пусть в изображении объекту принадлежат Ж~ хФ2пикселей, а У; — яркость пикселя изображения в точке х;.. Тогда момент инерции порядка р+ д (где р, д — целые положительпыс числа) для некоторой области изображения можно определить по формуле Ж~ И~ м ю'=1 у=1 В большинстве случаев при описании объекта используют центральные моменты инерции.
Центральный момент инерции порядка р+ д равен 6, 7. Распознавание июбражеиия ные объекты могут иметь одинаковые площади, периметры и моменты инерции не только первого, но и более высоких порядков. В качестве примера можно привести объекты с регулярной, но неодинаковой структурой — решетки со смещенными одна относительно другой ячейками. Поэтому при составлении вектора признаков, с одной стороны, необходимо учитывать особенности конкретных объектов, а с другой — пе ограничиваться несколькими компонентами.
6.7. Распознавание изображения 6.7.1. Основные методы Распознаванием называется процесс, при котором на основании набора признаков некоторого изображения объекта определяется его принадлежность к определенному классу. Следовательно, распознавание реализует функцию анализа визуалыюго образа. В большинстве промышленных СТЗ предполагается, что этот образ формируется сегментированными объектами, т.
е. разделенными между собой или представляющими собой набор отдельных элементов объектами. В противном случае, когда на сцене присутствует несколько неразделенных объектов, задача многократно усложняется, за исключением тех случаев, когда априорно речь идет о перекрывающихся объектах.
Задачи такого уровня сложности требуют активного применения методов искусственного и1ггеллекта и экспертных систем. Кроме того, распознавание должно проводиться в тех же условиях, что и формирование признаков объекта, Во всяком случае, различия в значениях признаков объекта, полученных на этапе обучения СТЗ и при распознавании, не должны быть слишком велики. Заметим, чго такие же ограничения имеют место и при распознавании объектов человеком: если при распознавании обычные признаки имеют непривычные числеиныс значения, то объект может быть не опознан. Характерным примером является детский рисунок. Теория распознавания образов представляет собой самостоятельную научную дисциплину, подробное рассмотрение которой выходит за рамки настоящей книги.
Отметим лишь, что пока нс создано единого подхода к распознаванию изображений и существует большое количество частных методов. В робототехнике обычно рассматривается частный случай, когда все возможные типы объсктов и их классы заранее известны. Тогда процедура распознавания сводится к классификации объектов, т. е. отнесению априорно известных объектов к априорно известным классам. Условно все методы распознавания можно разделить на две группы: теоретические и структурные.
Наиболее распросграненные теоретические методы распознавания используют принципы теории принятия решений. Рассмотрим группу, состоящую из М классов объек'гов т~„т2, ..., т~~. Па этапе описания формируется и-мерное пространство признаков, такое, что каждому объекту соответствует свой вектор признаков У = (~~, ю2, .„ ~„)". Компонентами этого вектора обычно служат рассмотренные ранее геомет- 6. С!ссвемы техпи1! еского зреиия рическис признаки объекта. Тогда распознавание представляет собой процедуру отнесения данного объекта к одному из М классов на основании анализа его вектора признаков. Согласно теории принятия решений, нужно найти Мдискриминирующих функций Я~ (У), ЯЪ'), ..., ~~(У),таких, чтобы для произвольного вектора У',принадлежащего некоторому классу, выполнялось неравенство вида Л (К') > ~' (У') при всех ~', ~' =-1, 2, ..., М; ~ ~ у'.
Таким образом, неизвестный объект, обладающий вектором призна- ков Уо, распознается (т. е. относится к г-му классу), если при подстановке Ъо во все дискриминирующие функции функция ЯУО) будет иметь наи- большее значение. При построении дискриминирующих функций обычно используется эталонный вектор Ъ"з, с которым сравниваются векторы при- знаков объектов, В качестве эталонного может быль выбран вектор, все компоненты которого являются средними арифметическими значениями соответствующих компонент всех объектов заданного класса.
Например, 2 для трех объектов одного класса с площадями поверхности 50, 60 и 64 см 2 значение соответствующей .компоненты вектора Ъ~, будет равно 58 см . В некоторых случаях распознавания весьма эффективна достаточно простая процедура поточечного сравнения текущего изображения объекта У; с его эталонным изображением У~; . При этом решение о принадлежности объек- та к классу принимается на основании минимума некоторой заранес задан- ной меры ", его различия с эталоном: ~=~~(к, -у„,), !=1 у=1 где Ф„и Ф,— число точек изображения по горизонтали и вертикали соответственно. Строго говоря, определить реальное значение признаков объекта невозможно, так как значения различаются при каждом измерении. Поэтому задача распознавания ставится так: определить вероятность того, что объект принадлежит к заданному классу.
Поскольку распознавание является вероятностной процедурой, возможны варианты, когда объект идентифицируется как принадлежащий другому классу или как не принадлежащий никакому классу вообще. Структурные методы распознавания возникли из теории формальных языков, основанной на математических моделях грамматик. Наиболее известной здесь является модель Хомского. Ее идея состоит в построении описания сложного объекта в виде иерархической структуры подобразов (образ описывается более простыми подобразами, каждый подобраз — еще более простыми подобразами и т.
д,). 6.7. Распознавание изобралсеиия Одно из наиболее интересных направлений распознавания образов в СТЗ связано с разработкой алгоритмов распознавания лнц. Эти алгоритмы получили широкое применение в системах контроля доступа, предназначенных для ограничения круга пользователей, имеющих доступ как к физическим, так и виртуальным объектам, включая, например, узлы компыотер1гых систем. В качестве примера рассмотрим один из таких алгоритмов.
В нем модель лица представлена в виде набора некоторых элементов прямоугольной формы — масок. Каждая маска характеризуется двумя геометрическими признаками — площадью и расстоянием от геометрического центра маски до выбранного центра изображения. Анализируются семь масок: правый глаз, левый глаз, нос, рот, правая и левая носогубпые складки и подбородок. Центром изображения является геометрический центр лица (эта точка приблизительно соответствует середине переносицы, рис. б.23). Рис. 6.23. Модель исходного изображения: 1 — контур лица.„2 — геометрический центр изображения; 3 — 7 — маски глаз, носогубных складок, рта.
подбородка и носа соответственно Элементы распознаваемого лица хранятся в виде вектора признаков, содержащего все маски с их признаками. Следовательно, лицо характеризуется !4-компонентным вектором признаков. Размеры масок различны и изменяются в диапазоне от 15х! 1 пикселей для носогубйых складок до 31~!3 пиксслей для рта. Изображение лица полутоновое и квантуется на 256 градаций яркости. Как и большинство алгоритмов распознавания, программы такого рода состоят из двух частой: предварительного обучения и распознавания. Предварительное обучение, или регистрация нового пользователя, служит для формирования описания лица и занесения его вектора признаков в базу данных.
Распознавание представляет собой выбор наиболее похожего изображения из базы данных. Предварительное обучение выполняется за несколько шагов. Сначала проводится традиционная предварительная обработка изображения в целях удаления шумов и выделения контура. Для этого применяется градиентный фильтр Собеля размером Зх3 пикселя. В результате на изображении выде- 32! 6. Системы технического зреиия ляется овал, определяющий форму лица.
11а следующем этапе осуществляется масштабирование изображения до заданного формата (составляющего 64 пикселя по горизонтали) и находится приблизительный геометрический центр лица. Далее на изображении ведется поиск правого глаза. С этой целью в выделенной области осуществляется сканирование изображения локальным фильтром, содержащим стандартную маску правого глаза. Вы4с числяется значение параметра ~, равного сумме разностей приведенных яркостей У„„пикселей изображения и соответствующих им яркостей Уф пикселей фильтра: где Ф„~ и Фвф — число пикселей по горизонтали и вертикали фильтра, соответствующее ширине и высоте маски. Приведенное значение яркости пикселя с координатами ~',~' вычисляется по формуле где (Ко); — исходное значение яркости пикселя„Уф — суммарная яркость пикселей фильтра; Х,„— суммарная яркость пикселей исходного изображения в текущей фильтруемой области.
Минимум ~ соответствует левому верхнему углу области изображения размером Мгф х Ф,ф, содержащему искомый элемент — правый глаз. Далее в секторе изображения с центром в правом глазу и углом 25 ищется левый глаз, после чего осуществляется поворот изображения так, чтобы глаза оказались на одном уровне по горизонтали.
При изменении ориентации уточняется первоначальное положение центра лица и координаты масок определякл'ся окончательно относительно нового центра. На следующих этапах выделяются области остальных масок и осуществляется их поиск по минимуму с, . Таким образом, в процессе регистрации формируется полная модель лица, которая сохраняется в базе данных. Алгоритм распознавания (всрификации) близок к алгоритму регистрации, Выделенные из текущего изображения признаки объединяются в вектор признаков, компоненты которого сравниваются с соответствующими компонентами всех векторов, содержащихся в базе данных.