Оппенгейм - Применение цифровой обработки сигналов (1044221), страница 51
Текст из файла (страница 51)
Нетрудно заметить, что формула (4.30) описывает двухэтапное преобразование: сначала по строкам изображения, а затем по столбцам преобразований от строк. Записывая преобразо~вание (4.30) в явно~м виде через элементы ~матриц,,получим Л вЂ” 1Х вЂ” 1 6(т, и) =~ ~~~ д.(1, Й) ы(т, и, 1, й)= ~=О 1-О Х вЂ” 1 Х вЂ” 1 = ~ ы(и, Й) ~ д(1,Й) ю(т, 1), (4.31) 1=О !=о где второе равенство является следствием разделимости ядра преобразования.
Свойством разделимости обладает ядро преоб1Разования Фурье, наиболее часто применяемого на практике: ~'2-.. ы(т, и, 1, Й)=ехр — — (т1+ий) =- г2т~ . 1 Г 1'2-,. = ехр — — (т!) ~ ехр ~ — —" (ий) 1, 1 (4.32) а также ядра менее известных преобразований, таких, как преобразования Адамара и Хаара. Более подробно этот вопрос рассмотрен в работе Эндрюса [31].
Собственные значения л,;, получаемые методом КЛ-,преобразования, соответствуют фа~ктическим величинам дисперсий проекций вектора-изображения на координатные оси пространства, в котором ~все ком~поненты изображения некоррелиро~ваны. В системах координат, получаемых при быстром преобразовании, ~коэффициенты преобразования (т.
е. элементы матрицы [6]) равны про- екциям вектора-изображения на оси координат, полученным с помощью матрицы преобразования [ррах], но не являются дисперсиями. Однако как при КЛ-преобразовании, так и в 1пространствах быстрых преобразований происходит концентрация энергии. В перовом случае наибольшие дисперсии (и, следовательно, наибольшие энергии) связаны с теми столбцами матрицы [Ф] или [Фр], которые соответствуют .предпочтительным (или «естественным») направлениям наибольшего изменения видеоинформации.
Аналогично в пространстве быстрого преобразования наибольшими являются коэффициенты, которые соответствуют предпочтительным (или «естественным») направлениям вектора-изображения. С этой точки зрения сжатие в пространстве преобразований (как для преобразования Карунена — Лоэва, так и для быстрых преобразований) является по существу разложением изображения в ряд.
до базисным векторам (или базисным изображениям, так как каждый вектор должен описывать двумерную структуру) и таким усечением разложения, при котором ошибка мала, а число отбрасываемых составляющих — большое. Усечение оказывается возможным потому, что небольшое число компонент содержит основную часть энергии изображения.
Для иллюстрации рассмотрим схему сжатия в п~ространстве .преобразований, основанную на преобразовании Фурье. Из соотношений (4.31) и (4.32) видно, что (т, и)-й коэффициент преобразова~ния 6 (т, и) является проекцией исходного изо~бражения,а(1,Й) на базисный вектор (или базисное изображение), образованный при помощи (т, и)-го значения ядра Фурье т 12г.
г(щ, п)=ехр~ ' ~пп). Для типичных изображений характерно, что в области пространственных частот элементы с малыми индексами велики по сравнению с элементами с большими индексами. Таким образом„ структура, изображения обычно имеет низкочастотный характер. Низкочастотные составляющие определяют контуры предметов, а также я~р~кость и контрастность изображения. Высокочастотные со1ставляющие создают резкие линии и определяют общую четкость изображения, но суммарная энергия .их невелика.
Так, 95% энергии типичного изображения может приходиться на низкочастотные составляющие, занимающие 5% от общей площади двумерной пространственно-частотной области преобразования Фурье. Сохраняя эти спектральные ~составляющие и достаточнс» много высокочастотных компонент, чтобы резкость изображения была приемлема для человеческого глаза, можно, добиться существенного уменьшения объема избыточной информации.
После топо как установлено, что основной пр~инцип сжатия в пространстве преобразований заключается в избирательном сохранении коэффициентов разложения, задача создания системь1 224 Глава 4 225 Цифровая обработка изображений сжатия изображений может показаться нетрудной. Сложность построения подобных схем кодирования обусловлена необходимостью сра~внен~ия свойств операторов различных преобразований и создания, методов выбора коэффициентов преобразования, которые следует оста~вить. Кроме топо, задача усложняется квантованием выбранных коэффициентов и кодированием квантованных чисел.
Ниже пр~и~ведены краткие результаты исследований, посвященных этим вопросам. Был и~сследован ряд алгоритмов быстрого преобразования, таких, как преобразования Фурье, Адамара, Хаара .[32], слэнт-преобразование [33], косинусное преобразование ~[34], преобразование по дискретно-линейно~му баз~и~су [35]. Все алгоритмы сравнивались по эффекти|вности сжатия с преобразованием Карунена— Лоэва (оптимальным). Для выявления оптимального алгоритма необходи|мо ~сравни~вать все преобразования Б одинаковых условиях — при одном и том же входном изображении и одинаковых параметрах схем выбора,,квантования и кодирования коэфф~ициентов.
Этого не было сделано, но пр~и~водимые в литературе данные позволяют сделать следующие выводы. 1. Ни один из алгоритмов бы~строго преобразования не обеспечивает оптимальной эффективности сжатия изображения, какая получается при ,использовании преобразования Карунена— Лоэва. 2. По таким критериям качества, как средняя квадратическая ошибка, ближайши~м к прео~б~разованию Карунена — Лоэва оказывается слэнт-преобразован)ие, а за ним следуют по порядку преобразования Фурье, Адамара и Хаара, причем сравнение выполнялось для изображений небольшого формата, напри~мер 16К16 или 32К32 отсчета.
3. Разница между наилучшими по~казателями слэнт-преобразован~ия и наихудшими показателя~ми преобразования Хаара (как по субъективным, так и по объективным критериям) невелика. Коэффициенты преобразования, которые необходимо сохранить и передать, можно выбрать двумя ~способами. При пороговой дискретизации устанавливается некоторый уровень (о~пределяемый, как пра~вило, на основе полной средней квадратической ошибки), и коэффициенты, его превышающ(ие, сохраняются для передачи, а все остальные отбрасываются.
При зонной дискретизации в простра~нстве преобразований размещается маска (трафарет) и эле:менты, попавшие,в нее, сохраняются, а остальцые отбрасываются. Операции, выполняемые в ходе преобразования, обычно упорядочи~ваются .в соответствии 'с некоторым обобщенным индексо~м (частотой или порядком базисной функции), и коэффициенты преобразования выстраиваются в ряд в порядке увеличения сложности (т. е. числа колебаний на единицу длины) базисных ~векторов, причем энергия изображения концентрируется в области низких частот или малых порядков. Следовательно, зонная дискретиза- ция эквивалентна обобщенной низкочастотной фильтрации изображен~ия.
Пороговая дискретизация, напротив, позволяет выделить значительные коэффициенты преобразования, расположенные ~де-либо в пространстве преобразований. В результате оказалось, что пороговая дискретизация при одинаковом числе отброшенных Коэффициентов дает более высокое качество восстановленного изображения, чем зонная дискретизация. К сожалению, в схемах с пороговой дискретизацией вместе с каждым отсчетом необходимо передавать и его место~положение в пространстве п~реобразований.
По этой причине объем передавае|мой информации может заметно возрасти, если положения отсчетов передаются простыми кодами. Однако коды с псременной длиной дают возможность передать адрес при небольшом увеличении чи~сла разрядов кода [32]. Отсчеты, выбранные из пространства преобразований, необходимо квантовать. К сожалению, обычно они,имеют гораздо больший динамичес~кий,дна~назон, чем исходные отсчеты в пространстве преобразований, что подтверждает, напри~мер, о~пыт работы с преобразованием Фурье. Такое я~вление наводит на мысль об использовании чисел с переменной разрядностью, зависящей от значения коэффициента, но это значительно усложняет процесс обработки. Кроме того, для создания устройства квантования, дающего минимальный шум квантования, необходимо знать плотность вероятности значений отсчетов.
Исследования плоти~ости ве.роятности отсчетов в пространстве прео~бразо~ваний [32, 33] показали, что наилучший компромисс между простотой и точностью обеспечивает квантование, осно~ванное на гауссовской плотности, при фиксированной разрядности отсчето~в. В этом случае удается получить высококачественные восстановленные изображения, если число уровней квантования соста~вляет всего 64 (6 разрядо~в) $32].,По-видимому, это с~вязано с тем, что операторы преобразований линейны и дают вз~вешенные сум~мы, а сумма произвольных случайных величин распределена по закону, блиэко~му к гауссовскому.