Воротников С.А. - Информационные устройства робототехнических систем (960722), страница 62
Текст из файла (страница 62)
б.5. Форматы хранения изображения в СТЗ лей компоненты яркости. В )РЕЮ эти процедуры называются 2Ыч- и 2п2чдискретизацией соответственно. Заметим, что рассмотренные выше алгоритмы сжатия изображения несимметричны — кодирование длится гораздо дольше, чем декодирование. В последние годы в СТЗ широко используют фракптльное кодирование изображения. Это математическая процедура, применяемая для перевода растрового изображения в совокупность математических данных, которые описывают фрактальные свойства этого изображения. Фрактальное кодирование ~наиболее известен формат НР) основано на том факте, что все естественные и большинство искусственных объектов содержат избыточную информацию в виде одинаковых, повторяющихся рисунков, называемых фракталами. Фрактальное представление, подобно векторной графике, оперирует математическими описаниями обьсктов, а нс их реальными изображениями.
Существенное различие между ними состоит в том, что фрактальные описания получают из реальных изображений объектов, тогда как векторныс — э.го чисто искусственные структуры. гРрактальнос представление существенно асимметрично: кодирование изображения требует значительно большего объема вычислений, чем декодирование, однако оно имеет два важных достоинства: во-первых, изображение можно масштабировать без введения артефактов и потери деталей, что характерно для растровых изображений, и во-вторых, количество данных в файле значительно меньше (более чем в ! 00 раз) количества исходных растровых данных. Сравнительный анализ хранения тестового цветного изображения объемом !ОООх670м3 байтов в разных графических форматах показал, что размер файла„в котором изображение сохранено, варьирустся от 2 Мбайт в 'форматах ВМР, ТОЛ и ТИ.
Р до 37 Кбайт в УРЕб и 24 Кбайт в НР, т. е, отличается.более чем в 80 раз. Использование алгоритма сжатия без потерь 1 ХЮ уменьшает размер файла втрое. Сжатие с потерей информации эффективно как для цветных, так и полутоновых изображений, но поскольку цветовая информация сжимается сильнее, то и степень сжатия в первом случае будет выше, чем во втором, Сжатие динамического изображения Композитный видеосигнал перед оцифровкой (дискретизацией и квантованием) чаще всего разделяют на базовые компоненты с помощью аппаратнонезависимых цветовых моделей УБУ, УСЬСг и У1Ц, позволяющих существенно уменьшить объем данных без ущерба для качества изображения.
При обработке динамического изображения приходится иметь дело с огромными массивами информации, объединенными в кадры, или фреймы. Один фрейм видеоданных размером 5 ! 2х 482 будет содержать 246 784 пикселя, Если каждый пиксель кодируется 3 байтами, то для хранения этого фрейма потребуется 740 352 ба~гга памяти. Следовательно, объем памяти, необходимый для хранения десятисекупдного динамического изображения, при скорости воспроизведения 30 фреймов в секунду составит более 220 Мбайт.
6. Системы технического зрения Для обеспечения эффективной работы с такими массивами изображений в реальном масштабе времени были разработаны программные кодеки Кайпа С1пераЕ, 1п1е1 1пдео и другие, а также формат МРЕО 1Мо6оп 1РЕО), объединяющий группу алгоритмов с общими принципами кодирования. Основныс идеи, применяемыс при сжатии изображения, направлены на устранение временной и пространственной избыточности и использование более низкого разрешения при представлении цветовой составляющей видеосигнала. Так, при устранении временной избыточности учитывается тот факт, что в пределах коротких интервалов времени большинство фрагментов сцены незначительно смещаются по полю.
Устранение пространствснной избыточности основано на подавлении мелких деталей сцены, нссуществснных для восприятия. Асимметричный кодек С1пераК удобен благодаря минимальному использованию ресурсов процессора. Однако процедура кодирования занимает существенно больше времени, чем декодирования, что затрудняет использовапис этой программы в системах реального времени. Для устранения этого недостатка фирма 1п1е1 разработала семейство симметричных кодеков 1пдео; у пих продолжительности циклов кодирования и декодирования приблизительно равны. В настоящее время формат МРЕО включает четыре стандарта: МРЕО-1, МРЕО-2, МРЕО-3 и МРЕО-4.
Первый международный стандарт сжатия МРЕО-1 был создан в ! 992 г. для записи динамических изображений с разрешением 352х240 пикселей и звукового сопровождения на С0-КОМ с учетом максимальной скорости передачи данных 1,5 Мбит/с. Качественные параметры МРЕО-1 во многом аналогичны стандарту УНЗ.
Стандарт МРЕО-2, появившийся в 1995 г„предназначен для обработки динамических изображений телевизионного качества 720х486 пнкселей при пропускной способности канала передачи данных до 50 Мбнт7с. Технологию МРЕО-2, позволяющую кодировать чересстрочный сигнал, применяют в телевещании, спутниковом н кабельном телевидении. Развитием МРЕО-2 явился стандарт МРЕО-З, разработанный для.телевизионных систем высокой четкости, однако позже он стал частьго стандарта МРЕО-2 и отдельно теперь не применяется. Наконец, стандарт МРЕО-4„получивший официальный статус в 1999 г..
задает общие правила работы с цифровыми видео- н аудноданнымн для интерактивного мультимедиа. графических приложений и цифрового телевидения. В отличие от МРЕО-2 он использует процедуры фрактального кодирования н содержит соответствующие средства для описания взаимного положения объектов сцены в пространстве н времени. Существенным достоинством МРЕО-4 является возможность представления одного и того же видеофрагмента с разным качеством с учетом пропускной способности канала передачи данных.
Во всех существующих кодеках используют сжатие изображений методами субдискретизации и ДКП. Например, использование процедуры субдискретизации 4:1:1 для кадра размером 512х 482пикселей позволяет существенно уменьшить поток информации: 512 482.30.106 = 9,25 Мбайт!с. Данное кодирование называется внутрифреймовым и является традиционным. Степень сжатия зависит от содержимого кадра и достигает 95 %. При этом в формате МРЕО предусмотрено сжатие не отдельных кадров- 6.5.
Форматы хранения изображения в СТЗ фреймов, а их последовательности, что позволяет достичь еще более высокой степени сжатия. Действительно, обычно различия между ближайшими фреймами весьма незначительны. Если же кодировать только те пикссли, которые отли кают один фрсйм от другого, то объем данных, необходимых для хранения каждого фреймв, значительно уменьшится. Этот тип сжатия получил название межфреймовоео, или дсльта-сжатия. Степень сжатия при межфреймовом кодировании достигает 99,5 % и выше. Рассмотрим процесс межфрсймового сжатия, использусмый в стандарте МРЕС-2. В нем выделяют три типа кадров, объединенных в так называемую последовательность СОР (Огоире о1 Рк1пгея): 1-кадр (Ьйга агате) — начальный (опорный) кадр группы, содержащий полную информацию обо всех деталях изображения.
Этот кадр кодируется только с применением внутрифрсймового сжатия по алгоритмам, аналогичным 3РЕб; Р-кадр (РгейсМе 1гаше) — вычисленный (предсказуемый) кадр„содержащий только информацию об изменениях по сравнению с предыдущими кадрами. Обработка таких кадров проводится с использованием предсказания вперед; кадр разбивается на макроблоки 16х16 пикселей, каждому макроблоку ставится в соответствие наиболее похожий участок изображения из опорного кадра.
Это наиболее скомпенсированный кадр, степень сжатия которого превышает возможную для 1-кадров степень в 3 раза; В-кадр (В1-йгесйопа! 1гаше) — интерполируемый кадр, использующий для своего восстановления при воспроизведении информацию как предыдущего, так и последующего кадров, Строится он либо как продолжение предыдущего 1- или Р-кадра, либо как предшествснник следующего за ним 1- или Р-кадра, либо как интерполяция обоих. Если Р-кадр сильно отличается от предыдущего, а В-кадр — от предыдущего и последующего, то они кодируются как 1-кадр.
Качество сжатия зависит от количества кадров, образующих группу. Так, для группы из 12 кадров при частоте развертки кадра 25 Гц новый 1-кадр появляется через 12 1/25= 0,43 с. В этот момент восстанавливается идентичность исходного и сжатого изображений. Часто видеоинформация кодируется последовательностью из 15 кадров; тогда она имеет следующий вид: 1 В В Р В В Р В В Р В В Р В В 1. Здесь 1-кадр, начинающий каждую новую группу, является ключевым и содержит полную информацию об изображении, а В- и Р-кадры получаются в предположении, что различия между кадрами не слишком велики. Исходным для межфрсймового сжатия является компонентный видеосигнал, к которому применяется процедура субдискретизации 4:1:1, ДКП, а также сжатие по алгоритму Хаффмана. Представление изображений группами из 15 кадров эффективно в большинстве случаев, за исключением динамичных сцен н сцен, насыщенных отдельными фрагментами, которые необходимо кодировать более короткими группами.