Робототехника.Фу, Ли, Гонсалес (962794), страница 65
Текст из файла (страница 65)
ззт Рис. 7.36. Окрестность размерностью 3 Х 3 точки (х, у) (а) и маски для вычисления О, и й„ (б и а). при 6[1(х, у)[) Т, [~ 0 при 6[1(х у)[- Т, (7.6-45) дх( д", [[ (Х У)[ дсе + дуз (7,6-46) 388 записи показана на рис. 7.35, а. Отметим, что ближайшие к точке (х, у) пикселы в данном варианте определения производных цифрового изобрагкения имеют значение, равное 2. Вычисление градиента в области размерностью 3 Х 3 имеет преимушество по сравнению с использованием уравнений (7.6-40) и (7.6-41) в смысле большего усреднения, что делает градиент менее чувствительным к помехам. В принципе возможно применение и более широких окрестностей для нахождения градиента, но в промышленных системах технического зрения распространено использование размерности 3 Х3 благодаря высокой скорости вычислений и умеренным требованиям к оборудованию для этого случая.
В соответствии с изложенным в равд. 7,6.1 значение 6, по уравнению (7,6-42) можно определить с помощью маски (рнс. 7.35, б). Аналогично находится и значение 6„(рис.7.35,в), Эти две маски обычно называются операторами Собеля, Использование данных масок в произвольной точке (х,у) сочетает в себе результат применения уравнений (7,6-38) илп (7.6-39) в виде аппроксимации градиента в этой точке.
Перемещая маски по изображению 7(х, у), получают градиенты во всех его точках. Существует множество способов формирования выходного изображения д(х, у), основанных на вычислении градиента. Простейшим способом является задание функпии д в точке 388 (к,у) значения, равного величине градиента входного изображения 7' в этой точке, т. е. п(х, у) = 6[[(х, у)). (7.6-44) Пример использования такого подхода при получении градиентного изображения приведен на рпс. 7.36.
Рис. 7.36. Исходное изображение (а) и результат ксиользоиаиия уравиеиия (7.6-44) (б), Др гим способом получения дискретного изображения яву ляется применение следующих соотношений: где Т вЂ” неотрицательная пороговая величина. В этом случае имеют значения только ппкселы кромки, градиенты которых превышают величину Т. Таким образом, использование уравнения (7.6-45) может рассматриваться как процесс выделения только тех ппкселов, которые характеризуются значительным (определенным величиной Т) перепадом интенсивности. Дальнейший анализ полученных ппкселов обычно требует стирания отдельных точек н связывания пикселов вдоль соответствующих контуров, которые однозначно определяют объекты на изображениях. Применение для этих целей уравнения (7.6-45) рассматривается и иллюстрируется в равд.
8.2.!. Оператор Лапласа. Оператор Лапласа является оператором производных второго порядка вида Для дискретных изображений оператор Лапласа определяется следующим образом: Е [) (х, уН = [1 (х + 1, у) + ) (» — 1, у) + 1 (», у + 1) + + [(х у — 1)1 — 41(» у) (7 6-47) Эта цифровая запись оператора Лапласа дает нуль на участках постоянной интенсивности и на участках изменяющейся интенсивности на кромках, что характерно для производной второго порядка. Ре- 0 1 0 шение уравнения (7.6-47) может быть основано на применении маски, данной на рис. 7.37. Хотя, как было отмечено в начале этого раздела, оператор Лапласа определяет переход интенсивности, он редко о сам по себе используется для нахозкденця кромки. Дело в том, что, являясь оператором производных второго порядка, оператор Лапласа дает результат обычно очень чувствительный к помехам.
Таким образом, этот оператор, как правило, выполняет второстепенную роль при определении, на какой из сторон (темной или светлой) кромки находится данный ппксел. Рис, 7.37. Маска для вы числсиия оператора Лап ласи. 7.6.5. Пороговое разделение Пороговое разделение является одним из основных методов, используемых в промышленных системах технического зрения для обнаружения объектов, особенно в случаях, когда требуется наличие высокой пропускной способности системы.
В данном разделе рассматриваются особенности порогового разделения, которые относятся к нижнему уровню обработки информации, Применение порогового разделения на более высоком уровне обработки излагается в гл. 8. Предположим, что гистограмма интенсивности (рнс. 7.38,а) соответствует изображению [(х, у), состояшему цз светлых объектов на темном фоне. При этом интенсивности пикселов объектов и фона разделяются на две выделяющиеся части.
Одним из очевидных путей отделения объектов от фона является выбор порогового значения Т, которое разделяет эти группы интенсивностей. Тогда любая точка (х, у), для которой [(х, у) ) Т, принадлежит объскту, а в противном случае — фону. Несколько более общий вариант этого подхода показан на рис. 7.38, б, где гистограмма изображения характеризуется тремя отдельными частями, соответствующими, например, двум светлым объектам 390 на темном фоне. В этом случае используется тот же подход, и точка (х, у) классифицируется как принадлежащая к первому объекту при Т| 1(х, у) ( Тз, ко второму объекту при 1(х,у): Т, и к фону при [(х, у) ( Т,.
Данный вариант многоуровнего порогового разделения обычно менее надежен, чем одноуровневый вариант, из-за трудности установки нескольких пороговых значений, которые эффективно разделялн бы интересуюшие области гистограммы, особенно когда нх число достаточно велико, Обычно такие задачи при использовании порогового раз- 1 деления лучше решаются с помошью одной меняю- Т щейся пороговой велнчиа ны (гл.
8). В соответствии с изло- женным подходом можно рассматривать пороговое разделение как операцию, включающую действия с функцией Т в виде Т = Т [х, у, р (х, у), [(х, у)), (7.6-47) где 1(х, у) — интенсианость точки (х,у), а р(х, у) обозначает некоторое частное свойство этой точки, например среднюю интенсивность окрестности с центром в точке (х,у). Пороговое изображение получается путем Ю Рпс.
7.ЗВ, Гистограммы интенсивности, которые могут быть разделены с поыоптью (а) одного порогового значения и (б) нескольких пороговых значений, определения 1 при 7(х у))Т, д(х, у) = О при [(х у) - Т. (7.6-48) Таким образом, на изображении д(х, у) пикселы со значением 1 (илн с любым другим соответствуюшим уровнем интенсивности) относятся к объектам, в то время как пикселы со значением О относятся к фону. 39) Когда величина Т зависит только от 1[х, У), порог называется глобальным, Пример такого порога приведен на рис. 7.38, а. Если величина Т зависит как от 1(х, и), так и от р(х, у), то порог называется локалоиыли Если к тому же величина Т зависит от пространственных координат х и и, порог называется динамическим.
К нижнему уровню технического зрения относят методы порогового разделения, которые основаны на одной глобальной величине Т. Поскольку пороговое разделение играет наны на изображениях трехмерныхобъектов. Важнымп методами для получения информации о глубине изображения являются методы измерения, изложенные в равд. 7.2, и методы структурированного освещения, описанные в равд. 7 3. Отметим, что многие изложенные способы имеют гораздо большую область применения.
Показательным примером является улучшение качества изображения, которое долго оставалось трудной задачей при обработке цифровых изображений. Одним из основных требований при использовании систем технического зрения — предьявляемые и часто противоречащие друг другу требования низкой стоимости н высокого быстродействия. Рис.
7 39. (а) Исходное изображение. (о) Гистограмма интенсивности в диапазоне от О до 255, (а) Изображение, полученное по уравнению (7.5-4а), с глобальным порогом Т = 90. центральную роль при выделении объектов, его более сложные варианты относятся к среднему уровню техмпического зрения. Простой пример глобального порогового разделения показан на рис, 7.39.
7.7. ЗАКЛЮг)Е1!ИЕ Представленный в этой главе материал охватывает широкий круг методов обработки информации, обычно относящихся к нижнему уровню технического зрения. Как отмечено в равд. 7.1, системы технического зрения решают пространственные задачи, н большинство алгоритмов (особенно на нижнем уровне) осно- 392 Литература Более подробный материал по оборудованию для получения изображений дан в [79, 119, 74]. Тема, изложенная в разделе 7.3, основана на работах [201, !21, 203].
Преобразования, рассмотренные в разделах 7.4.1 и 7.4.2, могут быть найдены в большинстве кинг по вычисчительной графике, например в [2!2]. Дополнительные сведения по моделированию и калибровке камер находятся в [66, 317]. Обзорная статья [12[ содержит обширное количество ссылок на литературу по обработке стереоизображеиий. Материал раздела 7.5 базируется на работах [288, 252], а раздела 7.6.1 — на [104]. Подробности использования усредняющнх факторов даны в [129, 314, 44], а метод сглаживания путем усреднения изображения — в [148]. Методы сглаживания для дискретных изображений, рассмотренные в разделе 7.6.2, основаны на статье [295]. Материал раздела 7.6 3 соответствует работам [101, 315].