Оппенгейм - Применение цифровой обработки сигналов (1044221), страница 50
Текст из файла (страница 50)
4.9. Изображение, сжатое методом ДИКМ. Разрядность 3 бит/точка, п есказывающее устройство 3-го порядка (разр рядность исходного изображения 8 бит/точка). рядным) квантованием при оптимальном раз~мещени ещении порогов дает изображения, качество которых такое с ИКМ имею ей же, как ~в системе с, имеющей разрядность от 6 до 8. Исключение ~составляют ошибки вблизи лициний резкого изменения яр~кости. Сигнал с выхода устройства квантования, конечно, следует кодировать, поскольку распределение вероятностей квантованных разностей не является ~равномерным. При удачном выборе кода (например, кода Шеннона — Фано или Хаффм ) фмена) удается до- П этт 28 полнительно по~низить общую скорость со ф создания ин|формации. рэтт [281 указывает, что при использовании кода Хаффмена в пределе удается понизить скорость создания инфор~мации о 2,5 бит/точка.
Эт то дополнительное понижение скорости требуется сопоставить с увеличением стоимости и сложно жности запоминающего устройства, синхро|низаторов и вспомогательных регистров памяти, необходимых для работы с кодами Хаффмена. На ис. 4.9 по ф р .. казана фотография, полученная в системе сжатия методом ДИКМ с 3-разрядным квантованием и предсказывающим устройством третьего порядка.
Исходное изображение было ивантовано в 8-разрядные числа, причем получ!ившееся изображение (рис. 4.9) визуально от него неотличимо. Выше обсуждались вопросы сжатия изображений с помощью ДИКМ при выборе элементов .по строке (т. е. для прогноза брались точки, лежащие на текущей строке развертии). В силу двмерного характе|ра изображений возможно (и целесообразно) расширить мето ДИКМ р д Д КМ так, чтобы прои прогнозе учитывались яркущей, но и на пред- кости ~в точках, лежащих не только на теку ей, н шествующих строках развертии.
Схемы сжатия методом ДИКМ с таким двумерным предсказанием основаны на тех же принципах, что при одномерном предсказании. Поскольку для изображений характерно наличие двумерных статистических вза~имосвя- зей, можно надеяться, что двумерное предсказание даст лучшие результаты по сжатию изображений, так как декорреляция изо4ражений с помощью операций п~редсказа~ния и ~вычитания будет ттроизводиться по двум коор~дината~м. Действительно, устройства ,с пространственным предсказанием дают более качественные изображения.
Хабиби [221 показал, что с помощью д~вумерного предсказывающего устройства третьего порядка при 8-уровневом (3-разрядном) квантовании, получались, изображения, которые,визуально не удавалось отличить от исходных фотографий, обработанных методом ИКМ с 11-разрядными числами. Для изображений, состоящих из последовательных кадров, наттример телев!изионных, идеи предсказания и вычитания, связанные с ДИКМ, можно распространить на временную область.
В по,добных изображениях яркость многих точек от кадра к кадру не изменяется или изменяется медленно. Следовательно, можно построить систему сжатия методом ДИКМ, в которой яркость очередной точки прогнозируется на осно|ве яркостей двумерного набора точек текущего кадра и соответст~вующ~их точек предшествующих кадров.
На практике порядок временного предсказания ее может быть высоким, так как для каждого временного слагаемого необходимо иметь запоминающее устройство, где сохранялся ~бы весь кадр. Мо~делиро~вание с предсказывающим устройством третьего порядка, в котором для предсказания ис~пользовались точечки, расположенные в данном !и предшествующем кадрах слева от рассматриваемой точки и ~вверх от нее, показало, что можно получить очень хорошие изображения при средней разрядности 1 бит/точка [28). 4.3.3.
Схемы сокращения избыточности изображений с обработкой в области преобразований Для ~пояснения основанных о~пераций, выполняемых системой сжатия видеоинформации с обработкой в области преобразований, обратимся к ковар~иацио~нной матрице, определяемой соотношением (4.20). Матрица [Ся] описывает корреляцию отсчетов изображения в плоскости (х, у), являющейся координатной плоскостью изображения. Важным методом многомерного статистического анализа служит исследование массива данных не только н их естественных координатах, но и в системах координат с более удобными свойствами.
В частности, весьма полезным!и оказались системы координат, основанные на собственных значениях и собственных векторах ковариационной матрицы № [С,1=[Ф] [Л1 [Ф1г=~ >. Ф,Ф. (4.24) !=! где '[Ф1 — матрица, составленная из ортогональных собственных Вектор-столбцов Ф,, а [Л1 — диагональная матрица собственных значен!ий. 220 22Ь Глава 4 Цифровая обработка изображений Преобразование координат, определяемое матрицей собственных векторов [Ф1, обладает тем свойством, что оно производит преобразование заданного масси|ва чисел в другой с некоррелированными элементами, причем получающиеся компоненты имеют убывающие дисперсии. Пусть собственные значения матрицы :[Се] расставлены в убывающе~м порядке и пронумерованы так, что (4.27) восстанавливается исходное изображение.
В процессе сжатия воз- никает средняя квадратическая ошибка !1а — а,11= ' (4.28) особен~ность КЛ-преобразования состоит в том, что из всех линейных преобразований именно оно обеспечивает минимальную величину этой ошибки. Из соотношений (4.25) и (4.26) видно, что число операций, необходимых для выполнения КЛ-преобразования, пропорционально Ж4, так как исходный массив со~держ1ит Ж2 отсчетов. Для типичных .значений У (У=256 или 512) такое число чрезмерно вели~ко. '> Имеется в виду различие дисперсий этих переменных. — Прим.
перев. Л, )~ Л2 )~ Лз )~ ° )~ Лл, (4.25) и пусть собственные векторы, связанные с ними, расставлены в том же порядке. Тогда матрица собственных векторов [Ф1 обладает тем свойством, что умножение ее на вектор-изображение (образованный лексикографической расстановкой) дает вектор С=[Ф!а, (4.26) имеющий некоррелированные ком|поненты, причем компоненты вектора б оказываются расставленным1и в порядке убывания их дисперсий,[~291, что является свойством дискретного варианта разложения Карунена — Лоэва, фактически о~писанного соотношениями (4.24) — (4.26) . Полезность ~преобразования Ка~рунена — Лоэва (КЛ, или ковариационного) для сокращения избыточности изображений очевидна.
Массив отсчетов изображения заменяется набором переменных, имеющих различные статистические веса11. Сжатие можно получить, отбрасывая ~переменные с малым статистическим весом и сохраняя остальные. Если, например, оставить М(1Р ко~ппонент вектора б и передать их вместе со специальной информацией о том, какие ко~м~поненты сохранены, то можно сузить ширину полосы ~в Ж2/М раз.
В пр1ием~нике из принятых М чисел образуют Ж2-компонентный |вектор ~путем подстановки нулей вместо Ж2 — М непереданных ко~апонент. Из этого нового вектора, обозначенного как 6', с помощью, преобразования [Ф[тС, Еще труднее вычислить собственные значения и собственные векторы ковариационной матрицы [Се1 размером Ж",~Ж'.
Эксперименты показал~и, что очень многие элементы |этой матрицы близки к нулю, т. е. коэффициент корреляции между отсчетами быстро стремится ~к нулю с у~величением расстояния между соответствующ~ими точками изображений. Расстояние, прои котором коэффициент корреляции между яр~костями элементов изображения становится .настолько малым, что его можно ~приравнять нулю (например, 5 ил~и 10% максимального значения), называется радиусом корреляции отсчетов; его можно выразить через целое число отсчетов. Зная это расстояние, все изображение можно разбить на блоки, размер которых больше радиуса корреляции, но сравним с ним.
Если размер каждого блока ра~вен Р, то можно вычислить ковариационную матрицу всех блоков, 'имеющую раз~мер Р2ХР~: Я2 [С, [= ,'Ь~ Е[(а; — Е(а;)) М; — Е(а;))'[ где Я=И~Р, а д; — вектор, построенный из отсчетов 1'-го блока. Тогда, если [Ф Д вЂ” матрица собственных векторов, связанных с Р' собственными значениями, расположенными так же, как в формуле (4.25), то операции по сокращению избыточности для ка|ждого из блоков выполняются по формулам (4.26) и (4.27), как для |полного изображения, но матрица [Ф1 заменяется на [Ф 1. Как,правило, радиус корреляции большинства изображений 1имеет такую величину, что Р=16 является разумным компромиссом между размером ковариационной матрицы и скоростью„ с которой коэффициент корреляции отсчетов приближается к нулю ~[301.
Длительность вычислений, выполняемых при сжатии видеоинформации ~поблочно, пропорциональна О'~Р4. Хотя разложение изображения на блоки и делает сжатие видеоин~формации методом КЛ-преобразования реально осуществимым процессом, но эффекти|вность его остается недостаточной. Большой объем вычислений препятствует ис|пользованию подобных ~методов для обработки изображений типа телевизионных. Создание алгоритмов быстрых преобразований (Фурье, Адама~ра и т. д.) существенно .повлияло на ~многие области применения цифровой обработки сигналов. Аналогичным образом оно сказалось и на методах сокращения избыточности изображений. Любое линейное преобразование, подобное разложению Карунена — Лоэва, переводит изо~бражение в новую систему координат.
В силу свойств КЛ-,преобразования случайные компоненты изображения в новых координатах оказываются некоррелированными. Резонно спросить: будут ли другие преобразования, особенно быстрые типа БПФ, обладать такими же полезными свойствами? К счастью, ответ оказывается положительным. Хотя быстрые преобразования и не приводят к полной некоррелированности 222 223 Глава 4 Цифровая обработка изображений компонент, как в случае КЛ-прео~бразования, но все же они дают очень хорошие результаты.
Их достоинства, связанные с быстротой вычислений, полностью компенсируют некоторое понижение эффективности сжатия, характерное для них. Схемы сжатия на основе быстрых преобразований можно описать примерно так же, как и схемы с КЛнп~реобразованием. Дополнительным достоинством быстрых алгоритмов является их разделимость, так что,двумерные преобразования можно выполнить с помощью одномеРных о~пераций. Кроме того,,их проще описать математически.
Если матрица [%] соответствует оператору ортогонального унита~рного одномерного прео~бразования (как, например, матрицы ядер преобразований Фурье, Адамара и т. д. [31]), то «поворот» изображения в новую систему координат выполняется по формуле 161 = [1~'1'[~1 [ 1Ч тде [д] — исходная матрица отсчетов изображения размером Л~~(Л~, а [6] — преобразование матрицы [д].