Гонсалес Р., Вудс Р. Цифровая обработка изображений (3-е изд., 2012) (1246138), страница 25
Текст из файла (страница 25)
Меры расстоянияПусть элементы изображения p, q и z имеют координаты (x, y), (s, t) и (v, w) соответственно. Функция D называется функцией расстояния или метрикой, если:а) D(p, q) ≥ 0, причем D(p, q) = 0 тогда и только тогда, когда p = q,б) D(p, q) = D(q, p),в) D(p, z) ≤ D(p, q) + D(q, z).Евклидово расстояние (метрика L2) между элементами p и q определяется следующим образом:1De ( p,q ) = ⎡⎣( x − s )2 + ( y − t )2 ⎤⎦ 2 .(2.5-1)106Глава 2. Основы цифрового представления изображенийПри такой метрике пиксели, находящиеся на расстоянии не более r от заданнойточки (x, y), образуют круг радиуса r с центром в этой точке.Расстояние D 4 (метрика L1) между элементами p и q определяется следующим образом:D4 ( p,q ) = x − s + y − t .(2.5-2)В этом случае пиксели, находящиеся на расстоянии D 4, меньшем или равном r,от заданной точки (x, y), образуют повернутый на 45° квадрат с центром в этойточке.
Например, пиксели с расстоянием D 4 ≤ 2 от центральной точки образуютследующие замкнутые линии равных расстояний:2221210121222Пиксели с расстоянием D 4 = 1 являются четверкой соседей для элемента (x, y).Расстояние D 8 (метрика L ∞) между элементами p и q определяется следующим образом:D8 ( p,q ) = max ( x − s , y − t ) .(2.5-3)В этом случае пиксели, находящиеся на расстоянии D 8, меньшем или равномr, от заданной точки (x, y), образуют квадрат с центром в этой точке.
Например,пиксели с расстоянием D 8 ≤ 2 от центральной точки образуют следующие замкнутые линии равных расстояний:2222221112210122111222222Пиксели с расстоянием D 8 = 1 являются восьмеркой соседей для элемента (x, y).Заметим, что расстояния D 4 и D 8 между двумя элементами p и q не зависятот каких-либо путей, которые могли существовать между этими пикселями, поскольку в определении этих расстояний участвуют только координаты элементов.
Однако, если мы выбираем в качестве меры m-смежность, то расстояниеDm между двумя элементами изображения определяется как длина кратчайшегоm-пути между этими элементами. В этом случае расстояние между пикселямибудет зависеть от значений всех пикселей вдоль этого пути, равно как и от значений их соседей.
Например, рассмотрим следующую конфигурацию пикселей,и пусть элементы p, p2 и p4 имеют значение 1, а элементы p1 и p3 могут приниматьзначения 0 или 1:2.6. Введение в математический аппарат, применяемыйв цифровой обработке изображений107p3 p 4p1 p2pПредположим, что рассматривается смежность пикселей со значением 1,т. е. V = {1}. Если оба элемента p1 и p3 имеют значения 0, то длина кратчайшего m-пути (т. е. расстояние Dm) между p и p4 равна 2. Если значение p1 равно 1,то элементы p и p2 больше не являются m-смежными (см. определение отношения m-смежности) и длина кратчайшего m-пути становится равной 3 (этот путьпроходит через точки p, p1, p2, p4). Аналогичные рассуждения имеют место в томслучае, если значение p3 равно 1 (а значение p1 равно 0).
В этом случае длинакратчайшего m-пути также равна 3. Наконец, если оба пикселя p1 и p3 имеютединичные значения, то длина кратчайшего m-пути между p и p4 станет равной4. В таком случае путь проходит через последовательность точек p, p1, p2, p3, p4.2.6. Ââåäåíèå â ìàòåìàòè÷åñêèé àïïàðàò,ïðèìåíÿåìûé â öèôðîâîé îáðàáîòêåèçîáðàæåíèéЭтот раздел преследует две главные цели: (1) познакомить читателя с различными математическими инструментами, которые используются на протяжениивсей книги и (2) помочь читателю ощутить, как именно этот аппарат используется, применяя его в разнообразных простых задачах обработки изображений,часть которых будет неоднократно появляться в дальнейших обсуждениях.По мере необходимости область применения этих инструментов будет расширяться в последующих главах.Перед тем, как двигаться дальше, читателю может быть полезно загрузить и изучить обзорный материал из раздела «Обучающие материалы» на сайте книгив Интернете.
Этот обзор содержит вводный материал о матрицах и векторах, линейных системах, теории множеств и теории вероятности.2.6.1. Поэлементные и матричные операцииПоэлементные операции, в которых участвуют одно или более изображений,всегда выполняются попиксельно над соответственными элементами изображений. Ранее в этой главе упоминалось, что изображения можно также эквивалентно рассматривать как матрицы. И в самом деле, во многих случаяхоперации над изображениями выполняются по правилам матричной алгебры(см.
раздел 2.6.6). Именно по этой причине необходимо четко разграничитьпоэлементные и матричные операции. Рассмотрим, например, следующие дваизображения размерами 2×2:108Глава 2. Основы цифрового представления изображений⎡a11 a12 ⎤ ⎡b11 b12 ⎤⎢a a ⎥ и ⎢b b ⎥ .⎣ 21 22 ⎦ ⎣ 21 22 ⎦Поэлементное произведение этих двух изображений вычисляется так:⎡a11 a12 ⎤ ⎡b11 b12 ⎤ ⎡a11b11 a12b12 ⎤⎢a a ⎥ ⎢b b ⎥ = ⎢a b a b ⎥ .⎣ 21 22 ⎦ ⎣ 21 22 ⎦ ⎣ 21 21 22 22 ⎦Напротив, матричное произведение изображений определяется выражением⎡a11 a12 ⎤ ⎡b11 b12 ⎤ ⎡a11b11 + a12b21 a11b12 + a12b22 ⎤⎢a a ⎥ ⎢b b ⎥ = ⎢a b + a b a b + a b ⎥ .⎣ 21 22 ⎦ ⎣ 21 22 ⎦ ⎣ 21 11 22 21 21 12 22 22 ⎦В последующем на протяжении книги мы всюду подразумеваем, что операциивыполняются попиксельно, если не оговорено иное.
Например, говоря о возведении цифрового изображения в степень, мы имеем в виду, что значениекаждого пикселя по отдельности возводится в эту степень; говоря об операцииделения одного изображения на другое, мы на самом деле подразумеваем, чтоделение выполняется для соответственных пикселей двух изображений и т. д.2.6.2. Линейные и нелинейные преобразованияОдна из важнейших характеристик любого метода обработки изображений —это является ли он линейным или нелинейным. Рассмотрим оператор общеговида H, который строит выходное изображение g(x, y) для данного входного изображения f(x, y):H [ f ( x, y )] = g ( x, y ) .(2.6-1)Говорят, что оператор H линейный, еслиH [ai fi ( x, y ) + a j f j ( x, y )] = ai H [ fi ( x, y )] + a j H [ f j ( x, y )] = ai gi ( x, y ) + a j g j ( x, y ),(2.6-2)где f i(x, y) и f j(x, y) — любые изображения одинаковых размеров, а ai и aj — произвольные константы.
Соотношение (2.6-2) показывает, что результат применениялинейного оператора к сумме двух входных изображений совпадает с суммойрезультатов применения такого оператора к этим изображениям по отдельности. А также результат применения линейного оператора к изображению,умноженному на константу, идентичен умножению на эту константу результатаприменения оператора к исходному изображению. Первое свойство называетсяаддитивностью, а второе — однородностью.Рассмотрим простой пример, где в качестве H используется оператор суммыΣ, функция которого состоит просто в суммировании его входов. Для проверкилинейности этого оператора начнем с левой части (2.6-2) и попытаемся доказать, что она равна правой части:∑[a f ( x, y ) + a f ( x, y )] = ∑ a f ( x, y ) + ∑ a f ( x, y ) == a ∑ f ( x, y ) + a ∑ f ( x, y ) = a g ( x, y ) + a g ( x, y ),i ijiiji ijjjiijjjгде первый шаг преобразования вытекает из дистрибутивности сложения.
Таким образом, левая часть (2.6-2) равна правой, и можно заключить, что оператор суммы линейный.2.6. Введение в математический аппарат, применяемыйв цифровой обработке изображений109Здесь всюду используется поэлементное суммирование, а не сумма всех пикселейизображения.
Применение оператора суммы к одному изображению дает самоэто изображение.Напротив, рассмотрим оператор max, функция которого состоит в нахождении максимального значения пикселя во входном изображении. Для нашихцелей простейший способ доказать, что этот оператор нелинейный, — найтиконтрпример, для которого нарушается условие (2.6-2).
Рассмотрим следующиедва изображения:⎡0 2⎤⎡6 5⎤и f2 = ⎢f1 = ⎢⎥⎥,⎣2 3⎦⎣4 7⎦и предположим, что константы a1 = 1 и a2 = –1. Проверку линейности опятьначнем с левой части (2.6-2):⎧⎡−6 −3⎤⎫⎧ ⎡0 2⎤⎡6 5⎤⎫max ⎨(1) ⎢+ (−1) ⎢⎬ = max ⎨⎢⎥⎬ = −2.⎥⎥⎣4 7⎦⎭⎩⎣−2 −4⎦⎭⎩ ⎣2 3⎦Действуя теперь с правой частью, получим⎧⎡6 5⎤⎫⎧⎡0 2⎤⎫(1)max ⎨⎢⎬ + (−1)max ⎨⎢⎥⎬ = 3 + (−1)7 = −4 .⎥⎩⎣4 7⎦⎭⎩⎣2 3⎦⎭В данном случае левая и правая части (2.6-2) не равны друг другу, и тем самымдоказано, что в общем случае оператор max является нелинейным.Как мы увидим в трех следующих главах, особенно в главах 4 и 5, линейныеоператоры исключительно важны для обработки изображений, поскольку ониопираются на значительную совокупность хорошо изученных теоретическихи практических результатов.
Нелинейные операторы исследованы значительнохуже, поэтому область их применения более ограничена. Однако мы познакомимся в последующих главах с несколькими нелинейными операциями обработки изображений, результаты которых значительно превосходят те, которыедостигаются с помощью линейных аналогов.2.6.3. Арифметические операцииАрифметические операции над изображениями являются поэлементными операциями, т. е., как уже говорилось в разделе 2.6.1, они применяются к паре соответственных пикселей двух изображений. Эти четыре арифметические операции обозначаются следующим образом:s ( x, y ) =d ( x, y ) =p( x, y ) =v( x, y ) =f ( x, y ) + g ( x, y ),f ( x, y ) − g ( x, y ),f ( x, y ) × g ( x, y ),f ( x, y ) ÷ g ( x, y ).(2.6-3)Понятно, что эти операции применяются к соответственным парам элементовизображений f и g для x = 0, 1, 2,..., M – 1 и y = 0, 1, 2,..., N – 1, где, как обычно,M и N — число строк и столбцов изображений соответственно.
Ясно, что s, d, pи v тоже являются изображениями с размерами M×N. Заметим, что в так опреде-110Глава 2. Основы цифрового представления изображенийленной арифметике участвуют изображения одинаковых размеров. Следующиепримеры показывают важную роль, которую играют арифметические операциив цифровой обработке изображений.Пример 2.5. Сложение (усреднение) зашумленных изображений для уменьшения шума.■ Рассмотрим зашумленное изображение g(x, y), формируемое прибавлениемшума η(x, y) к исходному изображению f(x, y), то естьg ( x, y ) = f ( x, y ) + η( x, y ) ,(2.6-4)где предполагается, что значения шума в каждой точке (x, y) являются некоррелированными5 и имеют нулевое среднее значение.
Целью нижеследующейпроцедуры является уменьшение уровня шума путем суммирования серии зашумленных изображений {gi(x, y)}. Этот метод часто применяется для улучшения изображений.Если шум удовлетворяет только что сформулированным условиям, то можно показать следующее (задача 2.20). Пусть изображение g ( x, y ) получено усреднением K изображений gi(x, y), отличающихся лишь шумом ηi(x, y),g ( x, y ) =1KK∑ g ( x, y ) ,i =1i(2.6-5)откуда следует, чтоE { g ( x, y )} = f ( x, y )σ 2g ( x ,y ) =и1 2σ η( x ,y ) ,K(2.6-6)(2.6-7)где E { g ( x, y )} есть математическое ожидание g , а σ 2g ( x ,y ) и σ 2η( x ,y ) — дисперсии g иη , все в точке (x, y).