Дуда Р., Харт П. - Распознование образов и анализ сцен (1033979), страница 57
Текст из файла (страница 57)
В качестве примера, представляющего интерес в историческом и практическом плане, аппроксимируем модуль градиента в точке изображения (1, 1) следующим образом: '2 уд(ю', 1) ~~ ж Я(1, 1) = =Ь Ь ((, 1) — И((+1,1+1))'+ Ы', 1'+ 1) — а( +1, 1)Р. Заметим, что здесь в качестве ортогональных направлений выбраны линии, наклон которых равен +1 и — 1. Схематически мы рассматриваем для клетки (1, 1) окно размером 2 х 2, элементы которого по Гл.
7. Представление изаб виий диагонали связаны операцией вычитания: Направленная производная для каждого направления аппроксимируется просто разностью соседних элементов. Оператор )с(1, 1) иногда называют перекрестны,и оператором Робертса. Рассмотрим пока, качественно, в чем заключается его действие. Если точка (с, 1) находится в области однородной интенсивности, значение )г(1, /), как и можно было ожидать, равно О. Если между столбцами 1 н /+1 наблюдается перепад интенсивности, Я (с', 1) имеет большую ве- Рнс.
7.3. Градиентное изображение. личику; то же самое происходит, если перепад наблюдается между строками 1 и У+1. Для повышения скорости вычислений перекрестный оператор Робертса часто упрощают путем использования абсолютных значений вместо квадратов и квадратных корней. Определим оператор г'(1, 1): р(с',1) = ~й(с',1) — й(с+1, 1+1)!+ ~й(с',1+1) — л(1+1, 1)!. 7.8.
Прострел«военное ди4»й«р«нцигованое Ясно, что )«(1, 1)~Р(1, Д~(У2 1«(1, 1) и Р(1, 7) в качественном от. ношении ведет себя так же, иак и 1«(1, 1). На рис. 7.3 показан результат применения оператора Р к дискретному изображению рис, 7.2 с последующим выводом на экран элементов (1, 1), для которых Р(1, 1))2. Наиболее заметный дефект этого изображения заключается в том, что задний край клина потерян. Как мы отмечали выше, между интенсивностями с обеих сторон от пропавшей линии существует разность только в один полутоновый уровень квантования. Если такую разность считать существенной и сделать пороговую величину меньше 2, появится недопустимо большое число «ложных» линий на полу и на стене. В целом, однако, большое количество «существенной» информации, содержащейся в рис. 7.2 здесь сохранилось.
Теперь отвлечемся на некоторое время и поговорим о терминологии. Изображение, показанное иа рнс. 7.3, называют обычно гради- е(а7 Рис. 7.4. Идеальный край. ентнеие изображением. Процесс получения градиентного изображения широко известен кап пространственное дифференцирование, выделение контуров, повышение резкости или просто взятие градиента.
Строго говоря, на рис. 7.3 показано градиентное изображение, ограниченное порогом. Тан как пороговое ограничение градиентного изображения является весьма обычным приемом, изображение до этой операции неточно называют аналоговым градиентным изображением, каким оно, конечно, не является. Во избежание дальнейшей путаницы оставим пока терминологические рассуждения, Теперь рассмотрим несколько подробнее задачу взятия градиента, Трудность здесь порождается существованием шумов. Мы можем сказать, что с точки зрения теории связи дискретная функция интенсивности д(!, 1) есть сумма двух функций: «идеального» изображения или сигнала з(1, 1) и чисто шумового изображения п(1, 1). Проблема возникает из-за того, что на самом деле мы хотим оценить градиент не суммы у, а идеального изображения з.
Для иллюстрации этого ограничимся одномерным случаем и для простоты рассмотрим только аналоговые функции. На рис. 7.4 показана одно- Гх. 7. Предсааехеиие иаобрааеениа мерная идеальная функция интенсивности ') з(х), которая претерпевает резкое изменение вблизи точки х,. К сожалению, в нашем распоряжении имеется только сумма я(х)=з(х)+п(х) (рис. 7.5).
Какая же процедура подойдет для оценки положения точки х, по функции д(х)? Интуиция подсказывает, что решение должно быть связано с операцией усреднения. Нам желательно сгладить функцию рСх) Хе Рис. 7.5. Реальный край. Я(х) иег иег Рис. 7.6. бина усреднения. д настолько, чтобы подавить и среднем самый сильный шум, но в то же время не в такой степени, чтобы сделать совершенно незаметным скачок функции з.
Действуя эмпирически, можно было бы определить оператор оценки производной Р(х) формулой х+и, х Р(х) = — ) д(и) е(и — — ') д(и)е(и. х «-мв г) Мы можем интерпретировать одномерное изображение как функцию интенсивности двумерного изображения вдоль некоторого одномерного разреза на плоскости изображения. 29! 7.9. Про«трен«ни«нное дафн«реняироеание Как показано на рис. 7.6, этот оператор выделяет два интервала («окна») длиной са«и «а, непосредственно перед точкой х и после нее, усредняег функцию я по каищому из этик «окон» и вычисляет разйость средних величин.
Если выбрано окно подходящих размеров, подобный оператор может работать очень хорошо. Для расчета градиента в двумерном изображении точно так же требуется некоторая комбинация усреднения и взятия разностей. По этому принципу был построен ряд операторов для оценки градиента, использующих окна различных размеров. В качестве примера оператора оценки градиента, использующего окно размером 3 х3, рассмотрим следующий оператор '), в котором для простоты элементы изображения в этом окне обозначены так: Определим величину Я„формулой Я„= (с+2~+1) — (а+ 2«(+я) и величину 5« формулой Бе=(д+2(«+1) — (а+20+с).
Тогда градиент в точке е можно либо определить с помощью выражения 3 =)/'3,'+ 3„', либо использовать более эффективное с точки зрения скорости вычислений выражение 3= 6«!+ 1Зе!. Остановимся на определении Я„, Это определение представляет собой попытку оценить частную производную функции интенсивности в направлении Х. Сначала формируются два взвешенных средних значения для оценки интенсивности в точках ~ и с( (нормирующие множители опущены). Затем для расчета частной производной берется разность этих взвешенных средних. Аналогичная операция выполняется при вычислении Яе. Константы взвешивания 1, 2, 1 выбраны, лишь исходя из интуитивных соображений.
В следующей главе мы рассмотрим эту проблему с большей математической строгостью и обсудим требования к «оптимальному» оператору оценки градиента. »1 Предложен И. Сои«лен. Гл. 7. Пр«дсяимлеиие изображений 7лн ПРОСТРАНСТВЕННОЕ СГЛАЖИВАНИЕ В прсдыдущем разделе мы познакомилн читателя с классическим методом борьбы с шумом путем усреднения.
Хотя нашей непосредственной целью была оценка градиента функции, очевидно, Ряс. 7.7а. Пример регуляризации для сдиомериого случая. х ис 2 аут Рис. 7.7б. Другой пример регуляризации для одномерного случая. что тот же метод в более общем случае может быть использован для «очистки» изображения от шума. Как и прежде, основная идея заключается в том, чтобы заменить величину уровня полутонов в 7.4. Пригн(ранга««нное села)»инанне точке средним значением функции интенсивности в ее непосредствен- ной окрестности. Опасность при усреднении занлючается, конечно, в том, что в результате расплываются детали.
Для простоты рас- смотрим сначала случай с одномерной аналоговой функцией ин- тенсивности д(х). Сглаженная версия д„(х) определяется формулой )» д. (х) = — „~ у(и)(1и. »-Ю/$ Этот процесс называется рггуляризацией функций. Методами ана- лиза нетрудно доказать, что регуляризация сглаживает функции в некотором точном смысле слова: если функция д(х) разрывна, то функция у„(х) непрерывна, и если д(х) — непрерывная функ- ция, то у (х) имеет непрерывную производную.
Эти свойства проиллюстрированы на рис. 7.7а и 7.7б. Заметим, что ширина «переходной области» функции д„(х) зависит от размера окна. В ре- зультате увеличения окна в) изображение становится еще более рас- плывчатым. Наоборот, чем меньше становится окно и), тем точнее функция у„(х) аппроксимирует функцию у(х). Регуляризованная функция д„(х) называется также скользящим или текущим средним функции я(х). Этот процесс регуляризации непосредственно обобщается на двумерный случай. Для заданной аналоговой функции интенсив- ности д(х, у) определим регуляризованиую функцию д„(х, у) вы- ражением с (х, у)=л- Д я(и, о)йийо, ! н(», у) где и) (х, у) — окно произвольной формы на плоскости изображения с площадью А„вокруг точки (х, у). В случае дискретной функции интенсивности д((, /) ее сглаженный вариант д„((, 7) определим формулой А,„~Х.и~4.
~к ( и ((, /) где, как и прежде, и) (1, !) — окно площадью А„„окружающее элемент ((, 1). Естественно возникает мысль об использовании окна какой-нибудь простой геометрической формы. Если мы решим использовать прямоугольное окно с основанием 2()+1 и высотой 2й+1, то регуляризованный вариант функции д(1, 1) примет следующий вид: ! й-(( 1) =(а~+!!(яя;» ~." ~' й(' ~ ~~1+") -ь<т<ь -ьч нкн В качественном отношении регуляризация изображения имеет много общего с расфокусировкой камеры, причем большое окно ус- Га. 7.
Представление иеабрижениа реднения соответствует сильной расфокусировке. Этот эффект часто совершенно противоположен тому, что нам хотелось бы получить, поскольку мы предпочитаем иметь дело с возможно более резким и четким изображением. Поэтому регуляризация используется избирательно для определенных целей. Один нз случаев, в которых она полезна, связан с обработкой бинарных дискретных изображений.
Бинарное изображение, как и следовало ожидать, — это изображение только из черных и белых элементов; для любой точки (1, 1) величина я(1, 1) либо равна О (черное), либо 1 (белое). Множество элементов, для которых функция д(1, 11)=1, называется объекигом; множество элементов, для которых д(1, 1)=О, называется фоном. Рис. 7.8. Рис. 7ти Пример регуляриаации для двумерного случая.
Бинарные изображения представляют значительный интерес как сами по себе, так н потому, что они являются результатом других операций по обработке изображения (рнс. 7.3 есть бинарное изображение). Для сглаживания бинарного изображения д(1, у) применяется сравнение функции д (1', 7) с порогом. Если она превышает порог, то значение сглаженной функции равно 1. В противном Рис.