Глава 6 (Учебник в электронном виде), страница 11
Описание файла
Файл "Глава 6" внутри архива находится в папке "Учебник". Документ из архива "Учебник в электронном виде", который расположен в категории "". Всё это находится в предмете "информационные устройства и системы" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "информационные устройства и системы" в общих файлах.
Онлайн просмотр документа "Глава 6"
Текст 11 страницы из документа "Глава 6"
Более распространенный в последнее время компонентный телевизионный видеосигнал на выходе телекамеры также имеет аналоговую форму. Для его представления в цифровом виде в соответствии с рекомендацией ITU-R 601устанавливаются правила раздельной дискретизации, квантования и кодирования сигнала яркости Y и двух цветоразностных сигналов R-Y (Cr) и B-Y (Cb). Кодирование видеосигнала, также как и рассмотренного ранее звукового, предполагает использование линейной ИКМ. Полоса частот, требуемая для обеспечения заданной пропускной способности, зависит от характеристик канала. В качестве примера рассмотрим кодирование сигнала в режиме линейной ИКМ на видеомагнитофон профессионального цифрового формата магнитной видеозаписи D1. Здесь сигнал яркости и оба цветоразностных сигнала имеют одинаковые полосы частот 3,375 МГц.
Частота дискретизации сигнала яркости fдY выбирается вчетверо большей верхней частоты этого сигнала и равна 43,375 МГц = 13,5 МГц. Частоты дискретизации каждого цветоразностного сигнала принимаются вдвое выше верхних частот сигналов, что соответствует 23,375 МГц = 6,75 МГц. (Согласно критерию Найквиста fд 2fв). Частоты дискретизации fд связаны с гармониками строчной частоты, что обеспечивает неподвижную ортогональную структуру отсчетов телевизионного изображения. Существенно, что величинам 13,5 и 6,75 МГц кратна как частота строчной развертки стандарта телевизионного разложения 625/50, так и стандарта 525/60. (Собственно, и выбор в качестве базовой именно частоты 3,375 МГц во многом связан с этими соображениями кратности). Указанные обстоятельства позволили ввести единый мировой стандарт цифрового кодирования компонентного видеосигнала, при котором в активной части строки содержится 720 элементов яркостного сигнала и по 360 - каждого цветоразностного. (Системы 625/50 и 525/60 различаются числом строк разложения Z и длительностью гасящих импульсов). Таким образом, соотношение частот дискретизации всех трех компонентов видеосигнала в данном случае (13,5; 6,75 и 6,75 МГц) по отношению к fв выражается как 4:2:2. Поэтому рассматриваемый формат получил название компонентного формата 4:2:2. Записываемый поток видеоинформации в формате 4:2:2 при 8 битовом квантовании составляет (13,5+26,75) МГц8 бит = 216 Мбит/с. При 10 битовом квантовании этот поток расширяется до 270 Мбит/с. (При записи телевизионных программ к нему необходимо добавить соответствующий поток аудиоинформации). Существуют и другие форматы представления компонентного сигнала в цифровом виде. Кодирование по стандарту 4:4:4 предполагает использование частоты 13,5 МГц для всех трех компонентов: R, G, B или Y, Cr, Cb. Это означает, что все компоненты передаются в полной полосе и для каждой из них в активной части кадра оцифровывается 576 строк по 720 элементов. Скорость цифрового потока при кодировании 4:4:4 и 10-битовом слове достигает 405 Мбит/с.
Итак, самый популярный студийный сигнал - цифровое видео D1 (или CCIR 601) использует систему NTSC и может кодироваться цифровым потоком в 270 Мбит/с. Пропускная способность канала рассчитывается и другим способом, исходя из растрового представления. В каждой строке растра содержится 858 точек, в кадре - 525 строк. Имеем по компоненте Y: 858 точек/строку525 строк/кадр30 кадр/с10 бит/точку 135 Мбит/с. По компонентам R-Y (Cr) и B-Y (Cb) соответственно: 429 точек/ строку525 строк /кадр30 кадр/с10 бит/точку 68 Мбит/с. Всего получим: 27 млн. точек/с 10 бит/точку = 270 Мбит/с.
Во всех рассмотренных случаях получается очень большой поток данных, который трудно как передавать, так и записывать. Рассмотрим еще один пример. Одна минута цифрового видеосигнала с разрешением SIF (сопоставимым с VHS и равным 288 358 точек) и цветопередачей в режиме true color, займет: 28835824 бита 25 кадров/с60 с = 442 Мб.
Таким образом, не только пропускная способность канала, но и ограничения на память современных носителей (компакт-диска или жесткого диска), не позволяет записать изображение в несжатом виде.
До недавнего времени магнитная лента являлась единственным средством хранения больших массивов видеоинформации. Сейчас ее успешно заменяют оптические носители, и, в первую очередь, оптические диски высокой плотности - DVD (digital versatile disk) и HD-DVD. До появления этих систем различные фирмы самостоятельно боролись с проблемой малых скоростей передачи данных и невысокой емкости носителя, пока не был сформулировано требование - обеспечить 120 мин запись с вещательным качеством. Это требование, поставленное по заказу Голливуда, и привело к появлению системы DVD, а также специальных принципов сжатия видеоинформации. Информация хранится на дорожках дисков в виде последовательности пит - бинарных элементов с разной отражательной способностью. Емкость дисков DVD доведена до 40 Гбайт, допустимая пропускная способность канала составляет 10,08Мбит/с. Заметим, что это значение существенно ниже требуемого, которое составляет для формата D1 - 216 Мбит/с. Указанное обстоятельство означает, что и DVD диски не позволяют воспроизводить видеопотоки в реальном времени. Поэтому, общепринятым решением является кодирование и сжатие изображения.
Устройства DVD используются при развитии цифровых телевизионных систем высокой четкости. Необходимая для этих систем скорость воспроизведения должна составлять 23 Мбит/с. В 2001 г. систему такого рода создала фирма Pioneer на базе голубого полупроводникового лазера с = 410 ... 450 нм и числовой апертурой оптической системы, равной 0,6. Новые технологии позволили получить и четко считывать питы длиной 0,26 мкм при шаге дорожек 0,44 мкм.
-
Форматы хранения изображений в СТЗ
После первых этапов преобразования информации в СТЗ изображение представляет собой дискретный массив точек (пикселей), расположенный либо в памяти устройства ввода, либо непосредственно в памяти СТЗ. В случае полутонового изображения каждый пиксель кодируется 1 … 2 байтами, в зависимости от разрядности АЦП. При формировании цветных изображений первоначальный объем информации, обычно раза в 3 больше. Что же касается записи движущихся объектов, то в большинстве случаев удается сохранить лишь несколько десятков секунд изображения. В СТЗ различают 4 типа изображений - монохромные, полутоновые, а также изображения в естественных цветах и палитровые.
Монохромные или двухградационные (в том числе черно-белые) изображения применяются в простых промышленных СТЗ, системах контроля и т.д., где требуется определить наличие объекта в поле зрения. Монохромное изображение является самым компактным - каждый пиксель кодируется одним битом. Однако хранить и обрабатывать изображения в таком виде неудобно и поэтому битовое представление пикселя преобразуется в байтовое. Наибольшее распространение на практике получили полутоновые изображения. Здесь пиксель также кодируется одним байтом, и его яркость может принимать значения от 0 до 255. В последнее время все чаще приходится работать с цветными изображениями, особенно в таких областях как металлургия, медицина, криминалистика. При сохранении цветного изображения в естественных цветах каждый пиксель представляется в виде RGB-тройки. Для запоминания одного элемента такого изображения требуется 3 байта, что позволяет закодировать в изображении 16,8 106 цветов и оттенков. Этот режим, получивший название True Color, применяется в системах обработки фотографий, репродукций и др. Очевидным недостатком режима True Color является значительный размер массива изображения. Для более компактного хранения цветного изображения разработано палитровое представление. В этом случае, изображению априорно придается цветовая палитра, состоящая из 16 или 256 RGB-троек, с помощью которых косвенно определяются цвета изображения. Один пиксель кодируется 4 или 8 битами, причем числовое значение не прямо определяет цвет элемента, а дает ссылку на цветовую палитру. Подобное упрощение приводит к 3 … 6 кратному уменьшению размера массива, однако в ряде операций обработки изображений возникают цвета, которых не было в исходном изображении. (Поэтому, палитровые изображения также часто приходится преобразовывать в полутоновые или естественные цвета). Палитровое представление используется в компьютерной графике. Что же касается промышленных СТЗ, то большинство из них имеют дело с полутоновым растровым изображением.
Во всех случаях изображения должны быть представлены в максимально компактной и стандартной форме - в виде графического файла. До недавнего времени многие компьютерные фирмы занимались разработкой собственных пакетов обработки изображений, и, соответственно, собственных графических форматов файлов. Сейчас в различных областях компьютерной графики применяются более сотни таких форматов. Тем не менее, несмотря на такое разнообразие форматов все они по способу представления изображений могут быть отнесены к одному из двух типов:
-
растровые (точечные);
-
векторные.
Растровое изображение представляет собой совокупность отдельных пикселей (расположенных на правильной сетке) записанную в ячейки памяти в виде таблицы (или битовой карты - bitmap). Физический размер ячейки выражается через разрешение (количество пикселей или точек на дюйм - dpi). При представлении изображения на экране монитора разрешение обычно составляет около 100 dpi, для принтера 600, для фотонаборного аппарата более 3500. Главное достоинство растрового представления изображения - простота, приведшая к тому, что практически все устройства ввода изображений поддерживают точечную графику (сканеры, видеокамеры, цифровые фотоаппараты). Существенно и то, что эти графические форматы позволяют получать реалистичные изображения (туман, дымку и т.д.). В то же время растровое представление требует значительных объемов памяти для хранения изображений. Эффективность сжатия файла зависит от сложности изображения. Так, изображение в естественных цветах и большого разрешения сжимается плохо. К недостаткам также относится невозможность трансформации изображений (поворота, масштабирования и т.д.). Поэтому растровые файлы при печати обычно не масштабируются
Исторически термин «растр» (raster) ассоциировался с ЭЛТ и указывал на то, что устройство при воспроизведении изображения на ЭЛТ создает образы строк. Изображения в растровом формате являлись набором пикселей, организованных в виде последовательностей строк развертки.
В векторной графике все изображения описываются в виде совокупности математических объектов - контуров, каждый из которых рассматривается как независимый объект, который можно перемещать и масштабировать до бесконечности. С векторными данными всегда связаны информация об атрибутах (цвете и толщине линии) и набор соглашений (или правил), позволяющий программе начертить требуемые объекты. Эти соглашения могут быть заданы как явно, так и в неявном виде. Они программно-зависимы, несмотря на то, что используются для одних и тех же целей. Векторная графика является объектно-ориентированной. К ее достоинствам относится компактность (т.к. сохраняется не все изображение, а некоторые основные данные). Кроме того, описание цветных характеристик почти не увеличивает размера файла. Однако векторному представлению изображений свойственны и недостатки. Важнейший из них связан с тем, что изображение объекта нереалистично. Кроме того, различные векторные форматы значительно отличаются друг от друга (во всяком случае, в большей степени, чем растровые), т.к. каждый из них проектировался для конкретных целей.
В 70-х годах ХХ века, когда компьютерная графика делала первые шаги, обработка изображений базировалась преимущественно на векторных данных. Векторные экраны и перьевые плоттеры были единственными легкодоступными устройствами вывода. Сегодня изображения чаще всего хранятся и отображаются в растровом виде. Это стало возможным вследствие использования высокоскоростных процессоров, недорогой оперативной и внешней памяти, а также устройств вывода-ввода с высокой разрешающей способностью. Кроме того, изображения, формируемые стандартными видеодатчиками имеют растровую форму.
Большинство существующих графических форматов, строятся на основе растрового или векторного представления изображений, а также на основе их комбинаций. Приведем некоторые примеры.
Наиболее распространенные растровые форматы - PCX, Microsoft BMP, TIFF и TGA; векторные - AutoCAD DXF и Microsoft SYLK. Форматы, содержащие векторные и растровые данные одновременно получили название метафайлов. Самым известным примером является формат Microsoft WMF.
Форматы видеоданных и анимации хранят последовательности изображений - фреймы, каждый из которых может быть как растровым, так и векторным. Самые примитивные из форматов хранят все изображения целиком, более сложные хранят только одно изображение и несколько цветовых таблиц для данного изображения. (После загрузки новой цветовой таблицы цвет изображения меняется и создается иллюзия движения объектов). Еще более сложные форматы анимации хранят только различия между двумя фреймами и изменяют только те пиксели, которые меняются при отображении данного фрейма. Иллюзия плавного движения достигается отображением 20 и более фреймов в секунду. Примерами форматов анимации могут служить TDDD и TTDDD.
Развитием принципов анимации явилось появление мультимедиа-форматов, позволяющих объединять в одном файле графическую, звуковую и видеоинформацию. Примерами служат известные форматы RIFF фирмы Microsoft, QuickTime фирмы Apple, MPEG и FLI фирмы Autodesk.
В формате трехмерного файла хранятся описание формы и цвета объемных моделей воображаемых и реальных объектов. Объемные модели обычно конструируются на основе векторного представления из многоугольников и гладких поверхностей, объединенных с описаниями соответствующих элементов цвета, текстуры, отражений и т.д. Программы визуализации, которые пользуются трехмерными данными - это, как правило, программы моделирования и анимации (например, Lightwave фирмы NewNek и 3D Studio фирмы Autodesk).
6.5.1. Структура графического файла
Графический файл состоит из двух основных частей: заголовка и собственно данных. В начале заголовка стоят несколько числовых значений, которые указывают спецификацию файла (TIF, BMP и т.д.). В англоязычной литературе их называют «магическими числами ».
Все программы обработки изображений различают форматы файлов не по расширениям, а по «магическим числам». Поэтому, в принципе, например, TIF-файлу можно дать любое название, что никак не отразится на возможности его считывания. Исключением из этого правила являются фото-CD файлы, которые не имеют ни магических чисел, ни обычного заголовка.