Воротников С.А. - Информационные устройства робототехнических систем (960722), страница 61
Текст из файла (страница 61)
Следовательно, удаляя из видеосигнала высокочастотную составляющую, можно существенно уменьшить требуемую емкость памяти. Однако при этом некоторая часть изображения теряется безвозвратно. Наиболсс известным способом сжатия изображения с потерей информации является ДКП, при котором сигнал сначала преобразуют в частотную форму, а затем из него удаляют часть частотных составляющих. Для примера рассмотрим процедуру сжатия полутонового изображения, состоящего из матрицы пикселей. На первом этапе яркости каждого пикселя преобразуют в частотные составляющие.
Для этого изображение разбивают на фрагменты размером 8х 8 элементов (субматрицы), в которых определяют частотные составляющие. Затем число этих составляющих сокращают, сохраняя только самые существенные, и, наконец, записывают их возможно более компактным способом. При этом процедуру ДКП применяют не ко всему изображению, а только к его фрагментам. Алгоритм ДКП реализуется в виде где У вЂ” матрица исходного изображения размером 8х8 пикселей; 1'о— матрица изображения после ДКП;  — матрица косииусиого преобразования. Например, для полутонового изображения матрица У представляет собой 64 значения яркостей соответствующих пикселей. Матрица ДКП имеет следующий вид: О,З5З О,З5З 0,490 0,415 0,461 0,191 0,415 — 0,097 0= 0,353 — 0,353 О,277 -О,490 0,353 0,353 0,353 0,353 -0,277 — О 191 О,З5З -О,О97 О,З5З -0,415 0,191 0,097 -0,353 0„490 -О 461 -0,490 0,461 -0,415 0,277 -0,191 0,097 -0,461 -0;461 — 0,490 -0,353 0,097 0,490 -0,277 0,277 0,353 -0„415 —.0,353 -0,097 0,353 0,415 0,353 -0,277 О 191 0,191 -0,461 0,097 -О,277 0,46! 0„415 0,46! -0,19! -О,19! -0,490 0,490 -0,415 0,277 -0,097 !Здесь для упрощения записи в каждом коэффициенте учтены только три цифры после запятой.) Процедура ДКП реализуется с помощью последовательности матричных перемножений, т.
е. поблочио ~размер блока 8х8 пикселей). Сначала матрица изображений Ъ' умножается на транспони- 6. Системы технического зрения рованную ДКП матрицу Р, а затем полученный результат — на собственно матрицу ДКП. Существенно, что в результате этих преобразований образуется новая матрица, численные значения элементов которой быстро уменьшаются от левого верхнего угла к правому нижнему: 3 О О -41 — 56 9 15 — 3 3 5 2 -82 57 О -21 -42 -14 16 -11 5 -4 О 18 -7 — 3 5 4 -7 2 О -65 69 — 12 -2 -15 17 -32 16 — 1О 3 2 -1 -51 31 -8 -6 19 О 1 1 Полученная матрица характеризует распределение частот в видеосигнале; так, в ее левом верхнем углу размещаются наиболее важные ~низкочастотные) элементы изображения. Сжатие выполняется путем устранения менее важных (высокочастотных) составляющих, для чего проводится квантование частотных данных.
Суть его заключается в том, что в матрице остаются только те элементы, значения которых превышают некоторое заранее установленное пороговое значение, зависящее от обрабатываемого изображения ~монохромное или цветное). Остальным элементам присваивается нулевое значение. Выбор порогового значения является непростой задачей.
Например, если оно будег слишком высоким, то потеряется большая часть данных, хотя само сжатие будет значительным, а восстановленное изображение будет сильно отличаться от исходного. На практике можно обеспечить степень сжатия изображения до 80 % без видимой потери качества. Квантование осуществляется умножением полученной частотной матрицы Ъ'р на некоторую априорную матрицу делителей, элементы которой определяют качество изображения. Для оценки качества изображения используют специальный параметр, называемый Д-фактор 1,от англ. оиай~у).
Значения Д находятся в диапазоне от 1 до 100„причем каждому из них соответствует своя матрица делителей'. Например, при Д = 90 сжатие мало, т. с. файл изображения. имеет значительный размер, но и изображение будет высокого качсства. При О = 20 потеря качества практически малозаметна, однако при этом в матрице Ур сохраняется только несколько ненулевых элементов, расположенных в левых столбцах матрицы; В программе ЛдоЬе РЬоюзЬор 7.0 качество характеризует козффнцнент Д, значения которого изменяются от 1 до 12. 6.5. Форл~аты хрпиемия изобрижеиия в СТЗ 34 ΠΠΠΠΠΠΠ— З вЂ” 9 2 1 О О О О -12 7 О ~ О О О О -6 — 5 2 О О О О О Ур = — 3 О 1 ΠΠΠΠ— 4 4 ΠΠΠΠΠΠ— 1 О ! 16 ΠΠΠΠ— 4 Оптимальное значение Д-фактора зависит от конкретного изображения и подбирается индивидуально.
Дальнейшее сжатие достигается кодированием длинной непрерывной послсдоватсльности нулей„например с помощью алгоритма Хаффмана. Восстановление сжатого изображения проводится обратным ДКП. При этом все шаги выполняются в обратном порядке. Коэффициенты восстановленной матрицы несколько отличаются от соответствующих коэффициентов исходной матрицы изображения У, но, как правило, не более чем на 10 %. ДКП является очень эффективным способом сжатия. Однако напомним, что для обработки было выбрано полутоновое изображение, а следователыю, при использовании ДКП в изображении необходимо выделить компоненты яркости и цветности. Это означает, что если исходное изображение представлено в цветовых моделях РОВ или СМУК, его следует преобразовать в одну из аппаратно-независимых модслей — НБУ или У1.Ж. Яркостная информация сжимается непосредственно с помощью ДКП, а для сжатия цветовой информации предварительно используется специалыгая процедура субдискретизации изображения.
Суть этого подхода, заключающегося в уменьшении количества никселей для компоненты цвстности, основана на меньшей чувствительности глаза к цветовой информации, Например, при сохранении цветного изображения размером 1000х1000пикселей можно использовать все пиксели яркости, но только 500х 500 пикселей для каждой компоненты цвстности. При таком представлении каждый пикссль цветности будет охватывать ту же область, что и блок 2х 2 пикселя яркости. Следовательно, для кодирования этого блока требуется всего шесть числовых значений (четыре для компоненты яркости У и по одному значению для каждой компоненты цветности У и У).
В несжатом виде такой блок требует 12 значений (4 + 4 + 4). Существенно, что уменьшение объема данных на 50 % практически нс отражается на качестве большинства изображсний. Таким образом, при сжатии изображения в цветовой модели 'ЛЗУ значения компоненты яркости У (как и у полутоновых изображений) сжимаются непосредственно, а значения компонент цветпости У и Ъ' в соседних элементах изображения складываются. Так, при субдискретизации 4:2:2 проводится суммирование значений У и 1~ для четырех соседних элементов, а запоминается только среднее значение. Тогда даже несжатый по яркости, но субдискрстизированный по цвету массив из четырех элементов изображения 295 6, Системы технического зрения будет представлен шестью числами (байтами), что соответствует 12 битам на пиксель.
Уже при этом стспснь сжатия информации составляет 50 %. Еще более высокая степень сжатия достигается при субдискретизации 4:1:1, когда объединяются значения восьми соседних пикселей. Ьлагодаря этому объем данных на элемент изображения сокращается с 24 до 10 бит на пикссль, а степень сжатия равна 58 %, хотя уже становятся заметными нскоторыс цветовые искажения. Еще большее сжатис используется только для динамических изображений.
Заметим, что и ДКП, и субдискретизация применимы для изображений в естественных цветах. Для палнтровых изображений, в которых цвет пикселей представлен не непосредственно, а через ицдексы в таблице цветов, необходимо преобразование изображения в модель НЯУ или ЪЧ3У. Рассмотрим теперь некоторыс особенности формата ЗРЕЙ, широко используемого при сжатии как сздтических (т. е.
отдельных кадров), так и динамических изображений . Кодирование в 1РЕО необходимо рассматривать как набор алгоритмов, специально разработанных для сжатия цветных и полутоновых растровых изображений. На практике 3РЕО следует применять только к изображениям, имеющим. глубину не менее 4...5 битов на каждый. цветовой канал. Поэтому.для черно-белых растровых, а .также векторных изображений ЗРЕЙ, как правило, не используют.
Алгоритмы 1РЕС преобразуют компоненты яркости и цвстности изображения отдельно, что обеспечивает их полную независимость от цветовой модели. Наибольшая степень сжатия достигается для цветовых моделей ИЛ~ и УСЬСг. Формат УРЕО позволяет сохранять одно и то жс изображение с разными размерами (например, 250х 250, 1000х1000 и 2000х 2000 пиксе-. лей), т. с. поддерживать его на экранах мониторов, лазерных принтерах и на высококачественных устройствах печати. Отметим, что спецификация ПРЕС не всегда обеспечивает лучшее сжатие изображения по сравнению с другими алгоритмами.
Например, изображения, содержащие большие области одного цвета, в 3РЕб сжимаются мало. При этом в них появляются артефакты (фрагменты, которых не было на исходном изображении), особенно заметпыс на сплошном фоне. Кроме того, в ПРЕС сжатие выполняется медленнсс других процедур, поэтому в целях ускорения его реализуют также аппаратными средствами. Компоненты цвстности в ЗРЕЙ кодируются методом субдискретизации.
Эта спецификация предлагает несколько различных значений коэффициентов дискретизации. Компонента яркости всегда остается с полным разрешением (дискретизация .1:1), Для обеих компонент цветности обычно проводят субдискретизацию 2:1 в горизонтальном направлении и 1:1 или 2:1 — в вертикальном. При этом подразумевают, что пиксель каждой компоненты цветности будет охватывать ту жс область, что и блок 2х1 или 2х 2 пиксе- ' Аббревиатура ЗРЕЙ происходит от названия комитета но стандартам акоп! РЬосодгарЫс Ехрепз (згонр, входянжго в состав Международной организации по стандартизации (!БО).