Гонсалес Р., Вудс Р. Цифровая обработка изображений (3-е изд., 2012) (1246138), страница 21
Текст из файла (страница 21)
Хотя в этом примерепо графику можно представить себе структуру изображения, сложные изображения обычно содержат большое число деталей, которые трудно интерпретировать на основании подобных графиков. Такое представление полезно для работыс множествами полутонов, элементы которых представляются тройками вида(x, y, z), где x и y — пространственные координаты, а z — значение яркости f в точкес координатами (x, y). Это представление будет использоваться в разделе 2.6.4.Представление на рис. 2.18(б) намного привычнее.
Оно отображает f(x, y)в таком виде, как изображение выглядит на мониторе или фотографии. Здесьяркость каждой точки пропорциональна значению f в этой точке. На данномрисунке есть только три значения яркости, взятые через равные промежутки.Если нормализовать яркость на интервал [0, 1], то каждая точка изображенияимеет одно из значений — 0, 0,5 или 1.
Монитор или принтер просто преобразуют эти три значения в черное, серое или белое соответственно, что и показано на рис. 2.18(б). Третье представление изображает численные значения f(x, y)в виде матрицы. В этом примере f имеет размеры 600×600 элементов, т. е. 360 000чисел. Ясно, что печать всей матрицы была бы громоздкой и малоинформативной. Однако при разработке алгоритмов такое представление вполне полезно,если в числовой форме печатаются и анализируются только фрагменты изображения, как показано на рис. 2.18(в).Из сказанного можно заключить, что наиболее полезны представления,изображенные на рис.
2.18(б) и (в). Графические дисплеи позволяют мгновенноувидеть результаты. Числовые массивы применяются для обработки изображений и разработки алгоритмов. Представление числовой матрицы размерамиM×N можно записать в форме соотношенияf (0,1)Lf (0, N − 1) ⎤⎡ f (0, 0)⎢ f (1, 0)f (1,1)Lf (1, N − 1) ⎥⎥.(2.4-1)f ( x, y ) = ⎢⎥⎢MMM⎥⎢⎣ f (M − 1, 0) f (M − 1,1) L f (M − 1, N − 1)⎦Обе части этого равенства — эквивалентные способы количественного представления цифрового изображения.
В правой части стоит матрица действительных чисел. Каждый элемент этой матрицы называется элементом изображенияили пикселем. Далее повсюду будут употребляться термины изображение и пиксель для указания на цифровое изображение и его элементы.В ряде случаев для обозначения цифрового изображения и его элементовбывает полезно использовать более традиционную матричную запись:a0,1 L a0,N −1 ⎤⎡ a0,0⎢ aa1,1 L a1,N −1 ⎥1,0⎥.(2.4-2)A=⎢⎢ MMM ⎥⎥⎢⎣aM −1,0 aM −1,1 L aM −1,N −1 ⎦Ясно, что aij = f(x = i, y = j) = f(i, j), поэтому матрицы (2.4-1) и (2.4-2) идентичны.
Можно даже представлять изображение как вектор v, например, формируя вектор-столбец размерами MN×1 так, что первые M элементов v совпадают90Глава 2. Основы цифрового представления изображенийс первым столбцом матрицы A, следующие M — со вторым столбцом и т. д. Альтернативно для формирования такого вектора мы может использовать строкиматрицы A. Любое представление будет правильным, коль скоро обработка изображения ведется соответственно.Возвращаясь ненадолго к рис. 2.18, отметим, что начало координат расположено в левом верхнем углу цифрового изображения, ось x направлена вниз, а осьy — вправо.
Такое общепринятое представление основано на том факте, что многие графические дисплеи (например телевизионные мониторы) осуществляютразвертку изображения, начиная с левого верхнего угла и двигаясь затем вправовдоль каждой строки. Еще важнее то, что первым элементом матрицы считаетсяэлемент в левом верхнем углу, так что выбор в качестве начала координат этойточки является математически осмысленным. Следует иметь в виду, что такоепредставление является привычной правосторонней2 декартовой системой координат, в которой просто оси направлены вниз и вправо, а не вправо и вверх.Иногда может быть полезно выражать операции дискретизации и квантования в более формальных математических терминах. Пусть Z и R обозначаютсоответственно множества целых и действительных чисел. Процесс дискретизации можно рассматривать как разбиение плоскости xy на множество ячеекпрямоугольной сетки, координаты центра каждой ячейки которой суть элементы декартова произведения Z 2, т.
е. множества всех пар (zi, z j), где zi и z j — элементы множества Z. Следовательно, f(x, y) — цифровое изображение, если (x, y) сутьцелочисленные пары из Z 2, и функция f приписывает каждой паре координат(x, y) конкретное значение яркости, т. е. действительное число из множества R.Такое сопоставление, осуществляемое функцией f, отвечает описанному вышепроцессу дискретизации. Если (как обычно в этой и последующих главах) значения яркости также целочисленные и вместо множества R используется Z, тогда цифровое изображение становится двумерной цифровой функцией, у которой как обе координаты, так и значения — целые числа.Для вычислений или разработки алгоритмов часто бывает полезно отобразитьшкалу L значений яркости на интервал [0, 1], так что они перестают быть целочисленными. Однако при хранении и визуализации изображений в большинствеслучаев полученные значения масштабируются обратно на интервал целых значений [0, L – 1].Для выполнения процесса оцифровки изображения необходимо принять решения относительно значений M и N, а также числа дискретных уровней (градаций) яркости L.
Для M и N не устанавливается специальных ограничений помимотого, что они должны быть положительными целочисленными значениями. Однако значение L по соображениям удобства построения оборудования для хранения и квантования обычно выбирают равным целочисленной степени двойки:L = 2k .(2.4-3)2Напомним, что правосторонней называется такая система координат (x, y, z),для которой при вытянутом указательном пальце правой руки вдоль оси x и согнутомпод прямым углом среднем пальце вдоль оси y большой палец направлен вдоль оси z.Как видно из рис.
2.18(а), система координат изображения именно такая.2.4. Дискретизация и квантование изображения91Мы предполагаем, что дискретные уровни яркости расположены с постояннымшагом (т. е. используется равномерное квантование) и принимают целые значения в интервале [0, L – 1]. Иногда интервал значений яркости неформальноназывают динамическим диапазоном изображения.
Этот термин используетсяпо-разному в различных областях. Здесь мы определяем динамический диапазонсистемы регистрации изображений как отношение максимально возможногозначения измеренной яркости к минимальному уровню яркости, обнаруживаемому этой системой. Как правило, верхний предел определяется насыщением,а нижний предел — шумом (см. рис.
2.19). По существу, динамический диапазонустанавливает минимальный и максимальный уровни яркости, которые системаспособна представлять и, следовательно, могут присутствовать в изображении.С этим понятием тесно связан контраст изображения, который мы определяемкак разность между максимальным и минимальным уровнями яркости в данномизображении. Если заметная доля пикселей обладает большим динамическимдиапазоном, можно ожидать, что такое изображение имеет высокий контраст.Наоборот, изображение с малым динамическим диапазоном обычно выглядиттусклым, размытым и серым. Более подробно эта тема обсуждается в главе 3.Общее количество бит b, необходимое для хранения цифрового изображения, определяется по формулеb = M ×N ×k .(2.4-4)НасыщениеШумРис. 2.19.Изображение, в котором присутствуют насыщение и шум.
Насыщение определяется тем максимальным уровнем, выше которого всеуровни яркости неразличимы (обрезаются). Обратите внимание, чтовся область насыщения имеет высокий постоянный уровень яркости.Шум в данном случае проявляется в виде зернистой текстуры. Шум,особенно в темных областях изображения (например на стебле розы),маскирует минимально различимый уровень истинной яркости92Глава 2. Основы цифрового представления изображенийТаблица 2.1.N/kЧисло бит для хранения изображения при различных значениях Nи k. L — число градаций яркости1 (L = 2)2 (L = 4)3 (L = 8)4 (L = 16)321.0242.0483.0724.096644.0968.19212.28816.38412816.38432.76849.15265.53625665.536131.072196.608262.144512262.144524.288786.4321.048.57610241.048.5762.097.1523.145.7284.194.30420484.194.3048.388.60812.582.91216.777.216409616.777.21633.554.43250.331.64867.108.864819267.108.864134.217.728201.326.592268.435.456N/k5 (L = 32)6 (L = 64)7 (L = 128)8 (L = 256)325.1206.1447.1688.1926420.48024.57628.67232.76812881.92098.304114.688131.072256327.680393.216458.752524.2885121.310.7201.572.8641.835.0082.097.15210245.242.8806.291.4567.340.0328.388.608204820.971.52025.165.82429.369.12833.554.432409683.886.080100.663.296117.440.512134.217.7288192335.544.320402.653.184469.762.048536.870.912В случае квадратного изображения M = N и это равенство приобретает видb = N 2k .(2.4-5)В табл.
2.1 приводится число бит, необходимых для хранения квадратных изображений при различных значениях N и k. Количество градаций яркости, соответствующее каждому значению k, указано в скобках. Если пиксели изображения могут принимать 2k значений яркости, то такое изображение частоназывают «k-битовым»; например, изображение с возможными 256 градациями яркости называют восьмибитовым. Из таблицы видно, что для хранения8-битовых изображений размерами 1024×1024 и более элементов требуется существенный объем памяти.2.4.3.
Пространственное и яркостное разрешенияИнтуитивно понятно, что пространственное разрешение — это размер мельчайших различимых деталей на изображении. Количественно пространственноеразрешение можно определять многими способами; к наиболее употребительным относятся число пар линий на единицу длины и число точек (пикселей) на единицу длины. Предположим, что построен чертеж, состоящий из чередующихся2.4. Дискретизация и квантование изображения93черных и белых вертикальных линий, каждая шириной W единиц длины (Wможет быть меньше 1).