Робототехника.Фу, Ли, Гонсалес (962794), страница 78
Текст из файла (страница 78)
Вогнутая линия (помеченная — ) образуется в результате пересечения двух поверхностей, принадлежащих двум различным телам (например, пересечение стороны куба с полом) Скрытые линии (помеченные стрелками) представляют собой контуры невидимых поверхностей Поверхности, закрываюшие другие ча- 455 туиатений урееяке — Иелкуклая линия — Юаенуятая линия — — Закаегятая линия Рис, 5.45. Три основные разметки линий. (т. е. тела, у которых три плоские грани сходятся к одной вершине), После того как произведена классификация соединений в соответствии со словарем, возникает задача объединения различных поверхностей в объекты, Как правило, она решается е помощью набора эвристических правил, построенных для 457 интерпретации помеченных линий и последовательностей из соседних соединений.
Основные понятия, лежащие в основе этого метода, могут быть проиллюстрированы рис. 8.49. Из рис. 8.49, б следует, что капля полностью составлена из скрытой невидимой границы, за исключением короткой вогнутой линии, указывающей место, где она касается базовой детали. Поскольку перед каплей ничего нет, она может быть выделена из сцены. Отметим также, что имеется вершина типа (1О) из словаря, приведенного на рис. 8.48. Очевидно, что для трехгранных объектов три поверхности, сходящихся к этой вершине, образуют кубичеРнс. 8.47. Объект, ие имеющий физического скую поверхность. Подобсмысла. Отметим, что одна нз линий ме- ные рассуждения приминает метку из-за того, что загорожена вы- пимы к базовой детали, пуклость между двуми вершинами. после того как устранены кубические поверхности. После устранения базовой детали на фоне остается единственный объект, на котором завершается декомпозиция сцены.
Хотя этот пример и дает достаточно полное представление о применении анализа линий и соединений для описания трехмерных объектов сцены, тем не менее создание алгоритма для обработки более сложных сцен является далеко не тривиальной задачей. Работы, посвященные исследованиям в этой области, приводятся в конце главы. ( о о я'о о я „о о зз.
и о сч о л и )' о а а Ябз 8.4.4. Обобщенные конусы Обобп(енноьи конусом (или цилиндром) называется поверхность, получаемая в результате перемещения плоского поперечного сечсния вдоль произвольной пространственной кривой (хребта) под постоянным к ней углом, причем поперечное сечение преобразуется по правилу залегания объема.
В техническом зрении метод обобщенных конусов независимо от других методов позволяет создавать образы трехмерных структур, что полезно при моделировании и для проверки соответствия построенных моделей исходным данным. Пример работы процедуры генсрации обобщенных конусов приведен на рис. 8.50. На рис. 8.50, а поперечным сечением является кольцо, хребтом — прямая линия, а правило заметання объема состоит в перемещении поперечного сечения перпендикулярно хребту, в то время как его диаметр остается постоян- 'Ф че и о о о о о сс ным. В результате получается полый цилиндр. На рис. 8.50,б приведена та же ситуация, за исключением того, что сначала правило заметания объема состоит в том, чтобы поддерживать диаметр поперечного сечения постоянным, а затем после прохождения поперечным сечением средней точки хребта диаметр линейно возрастает.
к расположению устройств сбора информации относительно исследуемой сцены (обычно они располагаются перпендикулярно рабочей поверхности). Это приводит ь уменьшению отклонений в характеристиках формы, а также упрощает процесс сегментации и описания в результате уменьшения вероятности загораживания одних объектов другими. Управление отклонениями в ориентации объекта производится путем выбора дескрипторов, инвариантных к вращению, или путем использования главных осей объекта для ориентирования его в предварительно определенном направлении, Современные методы распознавания делятся на две основные категории: теоретические и структурные методы.
Как показано ниже, теоретические методы основываются на количественном описании (например, статистическая текстура), а в основе структурных методов лежат символические описания и нх связи (например, последовательности направлений в грану це, закодированной с помощью цепного кода). За нескольу ы кими исключениями, рассмотренные в этом разделе процедур используются для распознавания образов двумерных объектов Рис. 8.50. Поперечные сечения и соответствующие им обобщенные конусы. о — поперечное сечение остается псстоиннмм яо время ааметания объема; б — диаметр поперечного сечения пинейно уиеничияается после прохождения средней точки хребта, Когда устанавливается соответствие между набором трехмерных точек н набором известных обобщенных конусов, сна.
чала определяется центральная ось точек, а затем набор поперечных сечений, который наилучшим образом соответствует данным при перемещении вдоль хребта. Обычно для получения удовлетворительного результата требуется большое число испытаний, особенно при неполных данных. 8.5. РАСПОЗНАВАНИЕ Распознаванием называется процесс разметки, т, е, алгоритмы распознавания идентифицируют каждый объект сцены и присваивают ему метки (гаечный ключ, перемычка, болт). Обычно в большинстве промышленных систем технического зрения предполагается, что объекты сцены сегментированы как отдельные элементы, Другое общее ограничение относится 460 8.5.1.
Теоретические методы Теоретические методы распознавания объектов основываются на применении решающих функций (дескриминанта). Пусть х = (х„х,, х„)т — вектор модели объекта (модельный вектору сд" ) с действительными компонентами, где хт — 1-й дескриптор данного объекта (например, площадь, средняя интенсивность, длина периметра). Тогда, если заданы М классов объектов оть тотг .
°, отм, ..., отм, основной задачей распознавания является определение М решающих функций т(у(х), ат(х), ..., дм(х), таких, что для любого модельного вектора х*, принадлежащего классу ыь выполняются следующие неравенства: й („')) й,(х'), (=1, 2, ..., М; (чьй (85-1) Другими словами, неизвестный объект, представленный вектором х', относится к 1-му классу (т. е. распознается), если прн йодстановке х' во все решающие функции с(;(х') имеет наибольшее значение.
В промышленных системах технического зрения решающие функции используются главным образом для установления соответствия (подбора). Предположим, что мы представляем каждый класс объектов с помощью вектора прототипа (усредненного вектора); т;= — ~~ха, 1=1,2,..., М, г'уг йм й=! 461 где ха — модельные векторы, о которых известно, что они относятся к классу у шь Тогда, побы определить, к какому классу объектов относится неизвестный вектор х', надо найти его ближайший прототип. Если для определения близости к прототипу Рис.
8.51, Подобрав ш(х, Ч] (о), образ 1(х, д] !б) и областм соответствуюшаи иаилучшему подбору ш в й что соответствует наибольшему зиачеишо коэффициента корреляции (а]. на более большом образе 1(х, д), Для каждого участка (х, д) обчаза 1(т д) доэффцйиенг корретчаии определяется выраже нпем [ш 15, ]] — ш, [ [1(э, ]] сп]) м (х, д) — ' ' „ . . . (8.5-5) [ш (э, ]] — шш]е ~ ~~~~ [1(ь. ]] — ш([а ~" э С э где предполагается, что еа(з,1) цеитрпруется в каждой точке (х, д). Суммгбювание проводится по всем координатам, общим для обоих областей, и- — средняя интенсивность ш и т!— средняя интенсивность [ в области, совпадаюнтсй с ш, Отметим, что обычно значение х(х, д) лежаи]ес в диапазоне [ — 1, 1), сильно изменяется прн переходе от одного участка образа к другому, причем значение 1 соответствует наилучшему подбору.
Затея для каждого участка (х,д) определяется м(х,д), п для установления наилучшего соответствия ш в 1 выбирается сго наибольшее значение. [Процедура движения еа(х, д) по 1(х, д) аналогична рассмотренной в равд. 7.6.1 (рис. 7.20).[ Качество подбора можно регулировать, принимая в рассмотрение только те коэффициенты корреляции, значения которых превышают некоторое предварительно установленное значение (например, 0,9), Поскольку этот метод заключается в непосредственном сравнении двух областей, он весьма чувствителен к отклонениям ориентации и размера объекта.
Отклонения интенсивности иормируются знаменателем в уравнении (8.5-5). Пример подбора с помощью коэффициента корреляции показан на рис. 8.5!. используется евклидово расстояние, задача сводится к вычпсленшо следующих выражений: 0](х*)=!!х' — зп;[1, 1=1, 2, ..., 51; (8.5-3) где !,'а[1 = (а'а)'' — -евклидова норма.
В этом случае вектор х* относится и классу ол, если 0,(х') является наименьшим расс~овином. Нетрудно показать, что это эквивалентно вычислению значений функций с],(х )=(х )гтп,— ~уйт,гть 1=1, 2, ..., ут1 (85-4) и выбору наиболыпего значения, что совпадает с определением решающей функции (выражение 8.5-1). Другое применение соответствия состоит, например, в нахождении подобраза ео(. ) "(х д) 8.5.2. Структурные методы Методы, рассмотренные в равд, 8.5,1, основываются на количественных моделях, в которых пренебрегают геометрическими связями, присущими форме объекта.
В структурных же методах объект описывается с помощью этих связей. В основе структурных методов распознавания образов лежит декомпозиция обьекта на просгещпие элементы (примитивы) (рис. 8.52). На рпс. 8.52, а показана простая граница объекта, а на рис. 8.52,6 — набор простейших элементов определенной длины п паправлещ]я. Начиная с верхней левой точки в направлении по часовой стрелке, мы кодируем грап|шу простейшими элементами, как показано иа рпс.
8.52,в. Таким образом, граница представляется слелт юпгей цепочкой; апаЬсЬЬЬсс(Исс(. Таким образом, зная длины п направления простейших элементов, а также порядок пх расположения ом носительно друг друга, мы можем описать с.руктуру объек а. В этом разделе описаны подобные методы, предназначепп:.е для создания и работы с такими видами структурных описаний моделей объектов.