Робототехника.Фу, Ли, Гонсалес (962794), страница 56
Текст из файла (страница 56)
8 это приводит к введению ограничений и предположений для уменьшения сложности задачи. Рассмотренную классификацию можно использовать в основном для всех видов применяемых систем технического зрения. Это не означает, что она может служить моделью человеческого зрения и в то же время не связана с ним. Известно, например, что распознавание и интерпретация для человека представляют собой взаимосвязанные функции.
Однако наличие этих связей не определяет возможностей их аналитического моделирования. Таким образом, приведенная классификация функций может рассматриваться как практический метод реализации систем технического зрения, отражающии наш уровень понимания и владения аналитическими подходами в этой области. В главе описаны получение изображения, его предварительная обработка, а также идеи и методы реализации функций, осуществляемых на низком уровне технического зрения. Верхний (высокий) уровень технического зрения рассмотрен в гл. 8. Хотя зрение отражает объемное трехмерное пространство, в системах технического зрения используется только его плоское изображение, объемную информацию из которого получают с помошью специальных методов, таких, как метод структурного освешения (равд.
7.3) или стереоизображения (разд. 7.4). 7.2. ПОЛУЧЕНИЕ ИЗОБРАЖЕНИЯ Визуальная информация преобразуется в электрические сигналы с помощью видеодатчиков. После пространственной дискретизации и квантования по амплитуде эти сигналы дают цифровое изображение. Ниже рассмотрены основные методы гголучения изображения при использовании технического зрения в роботах, влияние дискретизации на пространственное разделение и влияние квантования по амплитуде на разделение по интенсивности. Математический аппарат формирования изображения описан в равд.
7.4. Основными устройствами, используемыми в техническом зрении роботов, являются телевизионные камеры, состоящие из электронной трубки или твердотельного чувствительного элемента с соответствующими электронными блоками. Хотя подробное изучение этих устройств не входит в рамки данной книги, мы рассмотрим принцип работы трубки видикон, которая представляет семейство телевизионных камер. Твердотельные чувствительные элементы будут представлены приборами с зарядовой связью (ПЗС). Они обладают рядом преимуществ перед электронными трубками (например, имеют меньшие вес и размеры, больший ресурс и малую энергоемкость).
Однако разрешающая способность некоторых трубок пока выше возможностей твердотельных камер. Трубка виднкон представляет собоой цилиндрическую стеклянную оболочку, содержащую с одного конца электронную пуш. ку, а с другого — экран и мишень (рнс. 7.1, а). Электронный луч фокусируется и отклоняется с помощью напряжения, прикладываемого к катушкам. Отклоняющий контур обеспечивает сканирование луча по внутренней поверхности мишени для «считыванияа изображения. Внутренняя поверхность стеклянного экрана покрыта прозрачной металлической пленкой, которая образует электрод, формирующий электрический видеосигнал. На металлическую пленку нанесен тонкий фоточувствительный слой мишени. Этот слой состоит из мелких шаровидных частиц, сопротивление которых обратно пропорционально интенсивности светового потока.
За фоточувствительной мишенью расположена 328 положительно заряженная тонкая проволочная решетка, которая тормозит электроны, испускаемые пушкой, так что они попадают на мишень со скоростью, близкой к нулю. В нормальном режиме на металлическое покрытие экрана подается положительный потенциал. При отсутствии света фо. точувствительный материал ведет себя как диэлектрик, так как Лььара еяье ятеьяая.тиееькье ьтькрььтлие Фьяь цйгляиятелькььй ьяьц тттлл яьяяаттьгая лаятужьтт рис.
тд Схема трубки видиков (а) и сканирование алектроииым лучом (б), потенциал на внутренней поверхности мишени, вызываемый электронным лучом, компенсируется положительным зарядом на металлическом покрытии. Таким образом, при сканировании электронного луча по поверхности мишени фоточувствительный слой становится накопителем отрицательного заряда па внутренней поверхности и положительного заряда на внешней повзрхности. Когда на поверхностный слой мишени попадает свет, его 329 сопротивление падает и появляется электрический ток, нейтрализующий положительный заряд.
Так как поток электронов пропорционален величине светового потока в каждой точке мишени, иа поверхностном слое мишени образуется изображение, соответствующее световому изображению на экране трубки, т. е. остаточная концентрация электронных зарядов выше в темных местах и ниже в светлых местах мишени.
Таким образом, в процессе сканирования мишени образуется ток в металлическом слое, который подается на выводы трубки. Величина тока пропорциональна числу перемещающихся электронов и, следовательно, интенсивности светового потока в соответствующем месте, по которому проходит сканирующий луч. Это изменение тока во время сканирования электронного луча после его обработки в электронном блоке камеры формирует видеосигнал, пропорциональный интенсивности входного изображения. Осиовнои стандартный вариант сканирования, используемый в США, показан на рис. 7.1, б. Электронный луч сканирует по всей поверхности мишени ЗО раз в 1 с. Полный объем сканирования (называемый кадром) состоит из 525 линий, 480 из которых содержат информацию об изображении. Если линии сканировать последовательно, а результат подавать на телевизионный монитор, то изображение будет заметно дрожать.
Это можно устранить, используя механизм сканирования, при котором кадр делится на две соединенные области по 262,5 линии. Они сканируются 60 раз в 1 с, т. е. с удвоенной скоростью. Первая область в каждом кадре сканируется по нечетным линиям (показаны штрихами на рис. 7.1, б), в то время как вторая область сканируется по четным линиям. Данная схема сканирования, соответствующая соглашению по сканированию КЕТМА, является стандартной для телепередач в США.
Другие стандарты применяются при использовании более высоких скоростей сканирования кадра, но принцип их действия по существу совпадает с описанным. Например, распространенный метод сканирования в машинном зрении и при получении цифрового изображения основан на применении 559 линий, 512 из которых содержат данные об изображении. Работа с числами в аиде целых степеней числа 2 имеет ряд преимуществ как в аппаратной, так и в программной реализации.
При рассмотрении устройств на ПЗС удобно подразделить датчики на два типа: датчики линейного сканирования и датчики с плоскостной структурой. Основной частью ПЗС-датчиков является ряд кремниевых чувствительных элементов, называемых фотоячейками. Фотоны от отображаемого объекта проходят через входную прозрачную поликристаллическую кремниевую структуру и абсорбируются в кристалле кремния, образуя пары электрон — дырка. Полученные фотоэлектроны собираются на фотоячейках, при этом величина заряда на каждой фотоячейке 330 ча о ча б Рис. 7.2. ПЗС-датчик линейного сканиронании 1а) и ПЗС-датчик с плоской структурой (б).
пропорциональна соответствующей интенсивности светового потока. Типичный датчик линейного сканирования (рис, 7.2, а) состоит из ряда фоточувствительных элементов, из двух шин, используемых для передачи содержимого с фоточувствительных элементов в транспортные регистры, а также из выходной шины, служащей для передачи содержимого из транспортных регистров на усилитель. На выходе усилителя формируется сигнал нацряжения, величина которого пропорциональна содержимому фото- ячеек. зз! ПЗС-датчики с плоскостной структурой аналогичны датчикам линейного сканирования с тем отличием, что в них фотоячейки расположены в форме матрицы, а между рядами фотоячеек имеется комбинация переходных транспортных регистров (рис. 7.2, б).
Информация с нечетных номеров фотоячеек поступает последовательно в вертикальные транспортные регистры, а затем — в горизонтальный транспортный регистр. Информация с этого регистра поступает на усилитель, выход которого сопряжен с видеоканалом. Повторение данного процесса для фото. ячеек с четными номерами относпту ся к обработке второй области телевизионного кадра, Такое «сканирование» производится 30 раз в 1 с. .Фч уу' Камеры с линейным сканированием воспроизводят, естественно, только одну линию входного изображения. Эти камеры удобно использовать в случае движения объекта относительно датчика (например, болтов на конвейере). Движение объекта в направлении, перпендикулярном датчику, дает двумерное изображение.
1-1ередко испольРнс. 7.3, Обозначения кооплн- зуются датчики линейного сканиквт прн описании нзобрвження. Знвяенне произвольной РОвання с разреша!оШим днапазоточки (х, и) звлвется вепнчн- ном, включаюшим 256 — 2048 эле- ной (ннтенснвностью) функпнн ментов. Разрешаюшая способность 1 в этой точке. датчиков с плоскостной структурой составляет 32 Х 32 элементов на нижней границе н 256Х 266 элементов для средних диапазонов.
Современные промышленные устройства с высокой разрешающей способностькэ содержат 480 Х 380 элементов, а экспериментальные ПЗС-датчнкн имеют 1024 Х 1024 элементов и больше. Обозе!ачим через 1(х, у) двумерное изображение (рис. 7.3), почучаемое телевизионной камерой или другим устройством, дающим изображение, Здесь х и у пространственные координаты (т. е, координаты плоскости изображения), а величина 1 в произвольной точке (х, у) пропорциональна яркости (интенсивности) изображения в этой точке. Переменной г обозначим изменение интенсивности изображения для случая, когда пространственное расположение этих изменений не сушественно. Для получения удобной с точки зрения вычисления формы функции изображения 1(х, у) ее необходимо дискретизнровать как пространственно, так и по амплитуде (интенсивности).
Дискретизацн!о по пространственным координатам (х, у) будем называть дискргтиза!4игй изображения, а амплитудную дискретизацию — квантование,н по интенсивности или квантованием по 332 Рнс. 7.4. Эффекты уменьшения веппшнны днскретнзвпни. (и) 512 Х 5126 (б) 256 Х 256; (в) !26 Х !26; (г) 64 Х 64; (д) 32 Х 32. уранию серого. Последний термин применяется для одноцветных изображений и отражает тот факт, что изображение меняется по тону от черного до белого в серых оттенках. Термины интенсивности и уровня серого будем использовать попеременно.
333 Рис, 75. Изображение разверни 5!2 Х 5!2 соответственно с 256, !28, 64, 32, !6, 8, 4 и 2 уровннми интенсивности. Продолжение рис. 7.5. Предположим, что непрерывное изображение дискретизировано равномерно на уу' рядов и М столбцов, причем каждая дискретная величина проквантована по интенсивности. Такая система, называемая цифровым изображением, может быть представлена в виде )(О, 0) ~(0, 1) ... ~(0, М вЂ” 1) 1(1, О) 1(1, 1) ... 1(1, М вЂ” !) !(й! — 1,0) !'(й7 — 1, 1) ... !(Л! — 1, М вЂ” 1) 7. 2-! еде и х и у теперь дискретные переменные: ( ) х О, 1, 2, ..., й! — 1; у = О, 1, 2, ..., М вЂ” 1.