Оппенгейм - Применение цифровой обработки сигналов (1044221), страница 48
Текст из файла (страница 48)
Типичное изображение содержит очень много избыточной информации, что заметно даже при беглом взгляде на большинство изображений. Эта избыточность |приводит к экономическим потерям. Ширина полосы частот, необходимая для передачи изображения в цифровой форме, зависит от числа отсчетов изображения, разрядности отсчетов, времени, отведенного на передачу, и от мощности передатчика. С расширением полосы увеличиваются необходимая мощность |передатчика и расходы. Деньги и энергия не являются проблемой, но электромагнитный спектр предельно загружен.
Поэтому сокращение избыточности при передаче изображений является очень важной задачей. Столь же важно оно и для хранения, изображений в .цифровом виде. Если ~бы требовалось хранить только одно изображение, то об этом можно было бы не беспокоиться. Однако во многих существующих и ~проектируемых системах, таких, как геологоразведочный спутник КАЯА ЕКТЯ (Еаг111 Кезоцгсез Тес11по1оду Яа1е1111е), получается большое количество изображений, которые целесообразно получать и хранить,в цифровой форме. Хотя цифровые запоминающие у1стройства и становятся все дешевле, число получаемых изображений настолько увеличивается, что сокращение их,избыточности является задачей первостепенной важности.
4.3.1. Некоторые замечания о сокращении избыточности изображений Избыточность видеоинформации может .быть описана функцией корреляции между отсчетами изображений; она проя|вляется в .высокой степени .взаимной статистической прогнозируемости близколежащих отсчетов, взятых из изображения. Конечной целью операции сжатия видеоинформации является устранение этой статистической прогнозируемости (т. е. необходимо в максимально возможной, степени уменьшить коррелированность отсчетов). На блок-схеме рис. 4.7 показаны основные,операции, выполняемые системой сжатия видеоин~формации.
Сначала выполняется операция по максимальному уменьшению коррелированности отсчетов изображения. Затем отсчеты должны быть соответствующим образом квантованы. Квантованные отсчеты кодируются в форму, благоприятную для передачи (при этом, конечно, может быть обеспечена возможность обнаружения или,исправления ошибок). Квантование и кодирование выполняются с учетом общих правил, не зависящих от особенностей схемы декорреляции, выбранной для,первого этапа о|бработки.
Поэтому системы сжатия видеоинформации различаются видом схемы, выполняющей операции, относящиеся к первому эта~ну. В силу этого способам реализации первого блока, схемы рис. 4.7 здесь будет уделено больше рис, 4.7. Блок-схема системы сокращения избыточности видеоинформации. внимания, чем вопросам построения второго и третьего блоков. Такой подход полностью соответствует замыслу данной книги, посвященной техническим применения~м цифровой обработки сигнало1в, т.
е. задачам, в основном относящимся к первому блоку. При разработке принципов реализации первого блока схемы рис. 4.7 следует учесть ряд соображений. Рассмотрим сначала статистические свойства изображений. Если отсчеты изображения образуют сетку точек размером УХУ и каждый отсчет представлен Р-разрядным двойным числом, то при записи и передаче изображения с помощью обычной импульсно-кодовой, модуляции (ИКМ) потребуется 1т'2Р двоичных разрядов. Однако, как было отмечено выше, ти~пичное изображение имеет большую избыточность. Один из способов, позволяющих измерить эту избыточность и сравнить ее с номи~нальным числом Н2Р разрядов, заключается в .построении гистограммы яркости изображения и вычислении соответствующей энтропии. С помощью Р-разрядных чисел можно описать квантование по 2Р уровням. Для этого следует проанализировать все Л' отсчетов и подсчитать, сколько раз встречается каждый уровень квантования.
Затем следует построить гистограмму яркости изображения, т. е. для каждого уровня квантования указать число его появлений в изо~бражении. Разделив эти числа на общее число точек Ж2, можно получить аппроксимацию плотности вероятности процесса, порождающего изображение. Если обозначить нормированные частоты через р; (1=1, 2, ..., 2Р), то энтропия по определению выражается суммой зР Ь = ~ Р; 10Яа (Р';) (4.19) 1-1 и равна средней информации (измеряемой числом бит, приходяи~ихся на элемент изображения), содержащейся в каждом элементе изображения.
Анализ изображений показал, что типичное значение й гораздо меньше числа разрядов Р, необходимого для стандартного представления с помощью ИКМ. В работе [201 от- 14' 212 Глава 4 213 Цифровая обработка изображений мечалось, что энтропия имеет величину порядка 1 бит/точка. Это означает, что разрядность массива, описывающего изображение, можно (хотя бы теоретически) сократить без потерь информации в среднем до 1 бит/точка. Энтропия служит мерой статистической избыточности, но не .дает сведений о ее происхождении. Источником избыточности, как подсказывает наблюдателю его зрение, является высокая степень однородности изображения на малых участках.
Эту пространственную избыточность можно определить с помощью ковариационной матрицы изображения. Сначала лексикографически преобразуют матрицу из ЖКЖ отсчетов изображения в Ж'-компонентный вектор [т. е. элементы первой строки (или столбца) матрицы д(/, Й) становятся компонентами вектора с номерами от 1 до Х, элементы второй строки (столбца) — компонентами с номерами от У+1 до 2 Ж и т. д.1.
Затем вычисляют ковариационную матрицу изображения где Š— среднее значение по ансамблю, а ~ — вектор, построенный из отсчетов изображения. На практике редко оказывается возможным проводить усреднение по ансам~блю и ковариационную матрицу получают с помощью оценки пространственной корреляции [21~. Ковариационные структуры, такие, как матрица [СД, не имеют взаимно-однозначной связи с,исходным изображением. Коул [211 показал, что многие неодинаковые изображения могут оказаться весьма сходными в ковариационном (или спектральном) смысле.
Следовательно, имеются основания для замены сложной матричной структуры типа [СД более простой. В частности, рассматривалось (см., |например, работу [221) применение модели с авторегрессионным марковским процессо~м и-го порядка, где и обычно невелико (например, п=З). Тот факт, что подобные модели оказываются корректными и применение их оправдано при анализе методов сжатия информации, таких, как дифференциальная импульсно-кодовая модуляция (ДИКМ), указывает на высокую степень взаимосвязи между соседними участками изображения.
При сжатии видеоинформации кроме .статистических свойств изображения весьма важно учитывать и особенности получателя изображений. Зрение человека обладает ограниченными возможностями и характеризуется некоторыми известными (отчасти) отличительными особенностями. Использование конкретных особенностей зрения для сокращения избыточности изображений называется психофизической обработкой. Известно, например, что при восприятии яркости света, попадающего в глаз, зрительная система ведет, себя как нелинейная система с логарифмической характеристикой. Кроме того, система зрения человека не чувствитель- на к очень высоким или очень низким пространственным частотам, а в области 'средних частот ведет себя почти как полосовой фильтр, что обусловлено торможением нервных клеток сетчатки глаза.
Нелинейность и частотная зависимость чувствительности зрительной системы позволили создать оптимальные системы сжатия видеоинформации. В этих системах для достижения большей устойчивости к ошибкам, появляющимся при кодировании и передаче,,изображение обрабатывается примерно так же, как и в зрительной системе человека. Впервые это предложение было сдела~но Стокхэмом [)231.
Сокращение избыточности информации математически строго обосновывается положениями теории кодирования ~при заданном критерии точности [241. Как отмечали Маннос и Сакрисон [171, эффективные теоремы теории кодирования при заданном критерии точности в задачах сжатия видеоин~формации применить не удалось. Основной ~прич~иной этого я|вилась ~сложность выбора критерия допустимой величины ошибок, согласующегося со свойствами, системы зрения человека. Маннос и Сакрисон смогли показать, что можно пользоваться критерием, связанным с нелинейными,и,пространственно-частотными свойствами зрения. Их ~абота имеет очень важное значение для дальнейшего развития методов со1кращения избыточности изображений.
Введение подходящей предварительной обработки во ~всех схемах, кокоторые будут рассмотрены ниже, может значительно улучшить качество работы систем сжатия видеоинформации. 4.3.?. С~емы сокращения избыточности изображений с обработкой в пространственной области В одном из возможных вариантов схемы сокращения избыточности ~видеоинформации в первом блоке (схема рис.
4.7) выполняется операция тождественности, т. е. исходная картинка никак не изменяется, а все сжатие достигается за счет квантования и кодирования. Однако сжатие информации невозможно выполнять без использования кр~итериев, учитывающих особенности наблюдателя и свойства 'передаваемых данных.
Если, например, наблюдателю нужна точность '/,ооо, то необходимое число уровней квантования получается при,ис|пользовании 10-разрядных двоичных чисел; если же допустима точность '/8, то достаточно взять 3-Разрядные числа. Следовательно, квантование при сжатии информации играет ограниченную роль. Однако сокращения избыточности можно добиться при кодировании, и одной из основных задач после создания Шенноном теории информации было построение кодов, оптимальных с точки зрения сокращения избыточности информации. Шеннон доказал, что существует код, для которого скорость передачи совпадает,со скоростью создания информации источником. Таким образом, для изображений с эн- 21 э 214 Цифровая обработка изображений Глава 4 тропией порядка 1 бит/точка, существуют схемы кодирования, позволяющие построить коды со средней длиной в 1 бит/точка К сожалению, само 1по себе существование таких кодов,бесполезно, если отсутствуют алгоритмы их построения.
Известны алгор~итмы построения кодов, |приближающихся к оптимальным. Например, кодирование по Хаф~фмену является эффективной процедурой для согласования кода со статистикой источника информации и,позволяет сократить длину сигнала по сравнению со стандартной ИКМ. Однако подобные коды имеют переменное число символов (т. е. при передаче сообщений кодовые слова состоят из различного числа символов); при кодировании и декодировании требуются сложные алгоритмы, связанные с записью, (синхронизацией и вспомогательным накоплением информации.