Э. Таненбаум - Компьютерные сети. (4-е издание) (DJVU) (1130092), страница 211
Текст из файла (страница 211)
Цифровые цветные изображения создаются тремя сканирующими лучами, по одному на цвет. Геометрия сканирования кадра полностью совпадает с аналоговой системой, показанной на рис. 7.36, с той разницей, что непрерывные линии развертки заменяются аккуратными рядами дискретных пикселов. Для сглаживания при передаче движения, как и в аналоговом видео, в цифровом видео необходимо отображать по меньшей мере 25 кадров в секунду.
Однако, поскольку качественные мониторы обычно сами сканируют по несколько раз изображения, хранящиеся в нх памяти, с частотой 75 и более кадров в секунду, проблема мерпания изображения решается на уровне монитора сама собой, и чередование строк в цифровом видео не требуется. Другими словами, плавность движущегося изображения определяется количеством различающихся изображений в секунду, тогда как мерцание зависит от частоты перерисовки экрана.
Не следует путать эти два параметра. Неподвижное изображение, рисуемое с частотой 20 кадров в секунду, не будет дергаться, но будет мерцать, поскольку возбуждение сетчатки глаза успеет угаснуть, прежде чем появится следующий кадр. Фильм, в котором выводится 20 различных кадров в секунду, каждый из которых повторяется по четыре раза, не будет мерцать, но будет заметно отсутствие плавности движений. Важность этих двух параметров станет ясна, если мы попробуем оценить пропускную способность, необходимую для передачи цифрового видеосигнала по сети. Во всех современных компьютерных мониторах используется соотношение размеров экрана 4:3, поэтому в них вполне могут использоваться недорогие серийные электронно-лучевые трубки, предназначенные для телевизоров. Стандартные используемые разрешения экрана составляют 1024х768, 1280х960 и 1600х1200.
Для показа цифрового видео даже на экране с самым низким нз этих разрешений при 24 битах на пиксел и 25 кадрах в секунду потребуется передавать поток данных со скоростью 472 Мбит/с. С этим может справиться лишь канал 5ОХЕТ ОС-12, однако подведение таких линий в каждый дом пока что не стоит на повестке дня. Удвоение частоты, позволяю|цее избавиться от мерцания, выглядит еще менее привлекательна Оптимальное решение состоит в том, что- 786 Глава 7. Прикладной уроввнь бы передавать 25 кадров в секунду, и позволить компьютеру самому хранить эти кадры и отображать их с удвоенной частотой.
В обычном широковещательном телевидении такая стратегия почти не используется, так как у обычных телевизоров нет памяти. Кроме того, для хранения аналоговых сигналов в ОЗУ необходимо сначала преобразовать их в цифровую форму, что потребует дополнительного оборудования. Таким образом, чередование строк применяется в обычном широковещательном телевидении, но оно не нужно в цифровом видео. Сжатие видеоданных Итак, теперь должно быть очевидно, что о передаче мультимедийной информации в несжатом виде не может быть и речи.
Есть лишь одна надежда: на повсеместное сжатие данных. К счастью, за несколько последних десятилетий было разработано множество методов сжатия, делающих возможной передачу мультимедийной информации. В данном разделе мы рассмотрим некоторые методы сжатия движущихся изображений. Для всех систем сжатия требуется два алгоритма: один для компрессии данных источником информации, а другой — для распаковки ее получателем. В литературе эти алгоритмы называют, соответственно, алгоритмами кодирования и декодирования. Мы также будем пользоваться здесь этой терминологией, Эти алгоритмы обладают определенной асимметрией, которую следует хорошо понять.
Во-первых, во многих приложениях мультимедийный документ, например фильм, кодируется всего один раз, при его создании и помещении на мультимедийный сервер, но декодируется тысячи рзз при просмотре пользователями. Эта асимметрия означает, что алгоритм кодирования может быть довольно медленным и требовать дорогого оборудования, тогда как алгоритм декодирования должен быть быстрым и должен работать даже на дешевом оборудовании. В конце концов, оператор мультимедийного сервера может позволить себе арендовать на пару недель параллельный суперкомпьютер, чтобы закодировать всю свою видеотеку, но нельзя требовать от клиентов, чтобы они арендовали суперкомпьютер на 2 часа для просмотра видеофильма.
В большинстве современных систем сжатия высокая скорость декодирования является основной задачей, достигаемой даже ценой большой сложности и медленности алгоритма кодирования, С другой стороны, для мультимедийных данных реального времени, например видеоконференций, медленное кодирование неприемлемо. Кодирование здесь лолжно происходить кна лету», в режиме реального времени. Поэтому в системах мультимедиа реального времени применяются другие алгоритмы или их параметры, чем при хранении фильмов на дисках.
Чаще всего используется существенно меньшее сжатие. Еще один аспект асимметрии состоит в том, что процесс кодирования/декодирования не обязан быть обратимым. Это значит следующее. При сжатии обычного файла, его передаче и декомпрессии получатель обязан получить копию, совпадающую с оригиналом с точностью до бита. При передаче мультимедиа аб- мультимедиа 787 солютная точность не требуется. Вполне допустимы небольшие отклонения видеосигнала от оригинала после его кодирования и декодирования. Система, в которой декодированный сигнал не точно соответствует кодированному оригиналу, называется системой с потерями. Если же выходной сигнал идентичен входному, то такая система называется системой без потерь.
Системы с потерями являются важными, так как, допуская небольшие потери информации, можно достичь очень большого коэффициента сжатия. Стандарт 1РЕО Видеосигнал представляет собой обычную последовательность изображений (сопровождаемую звуком). Если мы сможем найти хороший алгоритм сжатия неподвижного изображенти, нам с не меньшим успехом удастся сжать видеоданные. Уже существуют достаточно хорошие алгоритмы сжатия изображений, поэтому мы начнем изучение принципов сжатия видеоданных именно с этого.
Стандарт .)РЕО для сжатия неподвижных изображений с непрерывно меняющимся цветом (например, фотографий) был разработан группой экспертов в области фотографии )РЕС (1о!пс РЬосойгарЬу Ехрегсз Огоцр — Объединенная группа экспертов по машинной обработке фотоизображений). Эта группа работала под совместным покровительством Международного союза телекоммуникаций 1Т(), Международной организации по стандартизации 180 и еще одной организации, занимающейся стандартизацией, — 1ЕС (1псегпасюпа1 Е1есСгосесЬпгса1 Сошт)ззсоп— Международная электротехническая комиссия). Стандарт )РЕС является очень важным для мультимедиа, так как в первом приближении мультимедийный стандарт для движущихся изображений, МРЕС, представляет собой просто кодирование каждого кадра отдельно алгоритмом 1РЕС плюс некоторые дополнительные процедуры межкадрового сжатия и обнаружения движения. Стандарт)РЕО определен как международный стандарт 10918.
У метода сжатия 1РЕО есть четыре режима и множество параметров. Он больше напоминает номенклатуру товаров в небольшом магазине, чем просто олин алгоритм. Для нас сейчас важен только последовательный режим с потерями, показанный на рис. 7.37. Кроме того, мы сконцентрируемся лишь на использовании 1РЕО для кодирования 24-битового КСВ-видеоизображения и опустим не- Ф которые незначительные детали.
выхол Рио. 7.37. Работа алгоритма оРЕ0 в последовательном режиме с потерями Первый этап кодирования изображения алгоритмом )РЕС представляет собой подготовку блока Рассмотрим частный случай кодирования 24-битового КОВ- видеоизображения размером 640х480 пикселов, показанного на рис. 7.38, а. Поскольку разделение на яркость и цветность позволяет сильнее сжать изображение, 788 Глава 7. Прикладной уровень мы сосчитаем сначала яркость У и два значения цветности 1 и Я (по стандарту ыТЯС) в соответствии со следующими формулами; У = 0,30 К + 0,59 С а 0,11 В; 1 = 0,80 К вЂ” 0,28 С вЂ” 0,32 В; Я = 0,21 К вЂ” 0,52 С в 0,31 В. В стандарте РАЕ значения цветности называются (1 и У, и коэффициенты используются другие, но идея та же самая.
Стандарт 8ЕСАМ отличается и от ХТЗС, и от РА1.. йОВ тг — нг > Блок 4799 24-битовый пиксел а Рис. 7.ЗВ. Исходные данные в формате ИВВ 1вй после подготовки блока (б] Для значений У, 1 и Я строятся отдельные матрицы с элементами, значения которых лежат в диапазоне от 0 до 255. Затем значения цветности 1 и Я усредняются по квадратным блокам из четырех пикселов, что уменьшает размеры матриц цветности в 4 раза до размера 320х240. Это сжатие является преобразованием с потерями, но человеческий глаз его почти не замечает, так как чувствительность глаза к яркости значительно выше, чем к цветности.
Тем не менее, уже на этом этапе общий объем данных уменьшается вдвое. Затем из каждого элемента вычитается число 128, чтобы переместить число 0 в середину диапазона. Наконец, каждая матрица разбивается на квадраты по 8х8 пикселов. Таким образом, матрица У состоит из 4800 квадратных блоков, а матрицы 1 и Я содержат по 1200 блоков каждая, как показано на рис. 7.38, б. На втором этапе кодирования изображения алгоритмом 1РЕС к каждому из 7200 квадратных блоков отдельно применяется дискретное косинусное преобразование. На выходе получается 7200 матриц 8х8 коэффициентов дискретного косинусного преобразования (дКП), Элемент (О, 0) такой матрицы представляет собой среднее значение блока. Остальные элементы содержат информацию о спектральной интенсивности каждой пространственной частоты.