Воротников С.А. - Информационные устройства робототехнических систем (960722), страница 66
Текст из файла (страница 66)
Если априорно известно, что изображение содержит несколько объектов, процедура сегментации проводится после выделения контуров перед этапом кодирования изображения. Несмотря па многообразие алгоритмов сегментации, все они направлены на поиск однородных областей изображения, которые можно было бы присвоить одному объекту. Частным случаем такой области является контур, разделяющий объект и фон.
Поэтому алгоритмы сегментации, как правило, основываются на поиске разрывности в контуре и подобии областей. В псрвом случае находится контур и осуществляется его программный обход по установленному правилу. Если контур оказывается замкнутым, считаегся, что он принадлежит объекту, Во втором случае опрсделяются области изображения, обладающие общими свойствами (например, одинаковой яркостью пикселей). При нахождении таких областей проводится их отпессние либо к фону, либо к объекту. Заметим, что существующис алгоритмы сегментации очень чувствительны к освещенности сцены. Алгоритмы сегментации путем обхода контура получили большее развитие, Нскоторыс из них используются в программах компьютерного распознавания текста. Обход контура начинается после того, как в результате фильтрации изображения выделяются точки, которые могут принадлежать контуру.
При этом анализируются яркости пикселей в некоторой окрестности ~ЗхЗили 5х5) каждой точки образа, которая предположительно принадлежит контуру. Процедура сегментации, называемая анализом связности, реализуется в каждой точке контура путем поиска ближайших точек с теми жс свойствами. В простейших алгоритмах расстояние между этими точками не должно превышать одного пикселя. (Следовательно, сегментация может использовать алгори'гмы работы с программными окнами, подобные рассмотренным вышс.) Различают четырех- и восьмисвязные области.
В первом случае считают, что каждый пиксель связан только с четырьмя соседними элементами (сверху, снизу, слева и справа), во втором — с восемью. В четырехсвязных областях возможна неоднозначность иптсрпретации — и один объект, и четыре объекта, касающиеся друг друга углами, интерпретируются одинаково. Поэтому во избежание неоднозначности чаще используют восьмисвязные области, которые реализуются программным окном размером Зх 3 пикселя. Заметим, что при восьмисвязном представлении удастся локализовать разрывы в контуре и тем самым обозначить на изображении отдельные сегменты. Если эти сегменты принадлежат замкнутому контуру, то считается, что обнаруженный контур является контуром объекта.
Наиболее простой алгоритм обхода контура предполагает перемещение сканирующего окна размером ЗхЗ пикселя от точки к точке с последующей нумерацией точек контура. Если контур оказывается замкнутым, то в результате описанной процедуры все его точки получают привязку к абсолютной системе координат. Недостатком такого алгоритма является значительный объем памяти, занимаемый сегментируемым изображением, так как каждая точка характеризуется двумя координатами. В этом случае размерность выходного массива оказывается равной размерности массива исходного изображения.
Для более 6.6. Базовые алгоритмы обработки изображенин компактного представления данных в СТЗ сразу после обхода контура или одновременно с ним проводится кодирование контура. 6.6.4. Кодирование изображения Под кодироесгиие.и изображения понимается обратимое преобразование информации, позволяющее получить компактный 1сжатый) массив чисел, однозначно описывающий это изображение в удобной для данной вычислительной структуры форме. В СТЗ робототехнических комплексов, как правило, применяются алгоритмы сжатия без потерь.
Для систем, обрабатывающих полутоновые изображения пространственными методами, различают два основных метода кодирования: кодирование. собственно изображения методом кодов длин серий; кодирование контура изображения цепным кодом Фримана. В обоих случаях при кодировании происходит значительное уменьшение объема данных, характеризующих изображение. Эффективность кодирования определяется степенью сжатия изображения.
Сущность кодирования методом кодов длин серий реализуемого с помощью алгоритма И.Е, заключается в представлении изображения однородными отрезками строки развертки, где яркости и цвета пикселей одинаковы. При этом каждая серия характеризуется соответствующим значением и длиной серии (числом пикселей). Например, для полутонового изображения кодируется номер пикселя, его яркость и длина серии, начинающаяся с этого пикселя. Исследования, проведенные для бинарных изображений, показали„что использование метода кодов длин серий обеспечивает сжатие информации в 4 — 7 раз.
Приведем пример записи бинарного изображения, представленного на рис. 6.22, и, с помощью этого метода: 3,8,6; 2,7, 1; 8,7„1;2,6, 1;9,6, 1; 2,5,2; 10,5, 1;3,4, 1;9,4, 1;4,3,6. Этот метод наиболее эффективен для кодирования изображения с гладким контуром 1без резких изломов). Для кодирования непосредственно контура изображения чаще всего применяют цепной код Фримаиа (рис. 6.22, б).
В этом случае контур объекта начиная с некоторой точки задается последовательностью векторов, принимающих дискретныс значения, с углом наклона модуля, кратным 45 . Значение модуля равно ~Г2, если угол наклона вектора составляет 45, и 1 при вертикальном или горизонтальном его положении. Изменение направления вектора при псрсходе от одной точки кривой к другой отражает характер изменения моделируемой кривой.
Цепной код для бинарного изображения, приведенного на рис 6.22, б, имеет вид 2, 2, 2, 2„ 2, 4, 3, 3, 5, 4, 6, 6, 6, 6, 6, 7, О, 6, О, О, 1. 6. Системы технического зрения Достоинством представления контура объекта с помощью кода Фримана является инвариантность полученного описания к выбору точки начала обхода.
Кроме того, запись в цепном коде эффективна для изображения с ломаным контуром. Пиксель Пиксель Точка начала обхода О 2 4 6 3 10 х Рис. 6.22. Кодирование изображения методами кодов длин серий (а) и Фримана ® В общем случае выбор способа кодирования зависит от признаков объекта, которые будут использоваться на стадии описания изображения. Так, при выборе геометрических признаков (периметра, площади, момента инерции) целесообразнее применение кодов длин серий, а при использовании локальных признаков (углов, отверстий) — цепного кода Фримана. б.б.5.
Описание изображении Под онисапием понимается определение характерных параметров объекта — признаков (дискрипторов), необходимых для его выделения из числа всех, образующих сцену. Выбор описания является очень ответственной задачей, так как если оно выбрано удачно, то распознавание (идентификация) может быть проведена достаточно легко, и наоборот, Чаще всего. формирование признаков проводит сам разработчик СТЗ или эксперт, хорошо знающий конкретную задачу. Поэтому универсальных подходов к выбору признаков нс существует, и при распознавании объектов велика роль субъективного фактора. В то жс время некоторые общие принципы существуют. Так, в большинстве случаев к признакам, входящим в описание, предъявляется требование инвариантности к повороту, трансляции ~переносу) и гомотетии (изменению масштаба).
Инвариантность к гомотетии особенно существенна, когда объекты располагаются не па плоскости. а в.пространстве. К таким инвариантным признакам относятся, например, яркость объектов сцены, их текстура и цвет. По своей физической сущности признаки разделяются на глобальныс и локальные. Глобальный признак изображения — это признак, который можно вычислить для любого изображения объекта, Идентификация объектов 6.6. Базовые алгоритмы обработки изображения на основании этих признаков проводится по соотношению их численных значений. Примерами таких признаков могут служить площадь изображения объекта„большая и малая оси, периметр контура, минимальный и максимальный радиус-векторы, соединяющие геометрический центр изображения с его границей.
Также используются моменты инерции (полярные и декартовы), площади вписанных и описанных окружностей и т. п. Заметим, что с помощью глобальных признаков можно описывать как контур объекта (дискрипторами границы), так и сам объект (дискрипторами области). Локальные лризнаи~ используют реже; они характеризуют не все изображение, а только часть его. К ним относятся утол между двумя контурными линиями, число и параметры отверстий иа изображении объекта и т. п. Рассмотренные выше глобальные и локальные признаки достаточно просты для вычисления и относятся к классу геол~етрических.
Наряду с ними применяют и эмпирические признаки, выбор которых определяется интуицией разработчика. Это, например, параметры кривизны контура, распределение яркости в заранее заданных областях изображения и т. д. Если сцена состоит из объектов просгой геометрической формы, то для их описания можно использовать лингвистические методы. Их суть заключается в так называемом грамматическом разборе сцены, при котором составляется граф отношений признаков объектов. Такими признаками могут быть различные графические элементы, возникающие при пересечении контурных линий (углы, Т-, 1.- и Х-образные изломы контура, стрелки и т. д.).
В робототехнике описание объектов чаще всего проводят после выделения их контуров с помощью простых геометрических признаков, Целью описания при этом является формирование некоторой совокупности признаков — так называемого вектора признаков. Практически всегда используют инвариантные к повороту и трансляции признаки — площадь ю и периметр Р изображения объекта, а также инвариантный к гомотетии коэффициент формы Аф, или псраунд: йф =ю/Р . Например, в бинарном изо- 2 бражении объекта вычисление его площади сводится к определению суммы пикселсй, яркость которых равна единице.