12. Кодирование и контроль правильности при обмене данными по последовательному цифровому каналу (1245070), страница 3
Текст из файла (страница 3)
В стек поступаетследующий символ 1, затем 1, затем 0. Сочетание 110 совпадает с правой частью правила для D (D 110).Теперь в стеке AD, заносятся следующие символы 0000 и т.д.В итоге получаем: 1 0 1 1 0 0 0 0 0 1 1 0 А D F D.Недостаток метода заключается в необходимости знать вероятности символов. Если заранее онинеизвестны, то требуется 2 прохода: на одном в передатчике подсчитываются вероятности, на другом этивероятности и сжатый поток символов передаются в приемник. Однако двухпроходность не всегда возможна.Этот недостаток устраняется в однопроходных алгоритмах адаптивного сжатия, в которых схема кодированияесть схема приспособления к текущим особенностям передаваемого потока символов.
Так как схема кодированияизвестна как кодеру, так и декодеру, сжатое сообщение будет восстановлено приемником.Обобщением этого способа является алгоритм, основанный на словаре сжатия данных. В нем происходитвыделение и запоминание в словаре повторяющихся цепочек символов, которые кодируются цепочками меньшейдлины.Интересен алгоритм “Стопка книг”, когда код символа равен его порядковому номеру в списке.Появление символа в кодируемом потоке вызывает его перемещение в начало списка. Очевидно, что частовстречающиеся символы будут тяготеть к малым номерам, а они кодируются более короткими цепочками единици нулей.Среди форматов представления текстовой информации наиболее популярными являются форматы: doc,pdf, html, xml.Алгоритм десятичной упаковки - очевидный способ сжатия числовой информации, представленной в кодеASCII, заключается в использовании сокращенного кода с 4 битами на символ вместо 8 (7), если передаетсянабор символов, включающий только 10 цифр, символы “точка”, ”запятая” и ”пробел”.
Просмотр таблицы ASCIIпоказывает, что старшие 3 бита всех кодов десятичных цифр содержат комбинацию 011. Таким образом,поместив в заголовок кадра соответствующий управляющий символ, можно существенно сократить длину кадра.0– (011 0000)2 – (30)16 – (48)101– (011 0001)2– (31)16 – (49)10………………9– (011 1001)2 – (39)16 – (57)10Из сказанного выше следует, что:а) нет алгоритма, одинаково эффективного для данных разной природы;б) приведенные алгоритмы рассчитаны на сжатие данных, в которых есть последовательностиодинаковых символов или одни символы встречаются чаще других.Алгоритмы сжатия с потерямиАлгоритмы JPEG - разработаны группой Joint Photographic Expert Group и ориентированы на сжатиенеподвижных изображений. Основаны на потере малосущественной информации (не различимые для глазаоттенки кодируются одинаково, коды могут стать короче).
Передаваемая последовательность данных делится нанепересекающиеся блоки изображений по 8х8 пикселов, в каждом блоке производится дискретное коси-нусное8преобразование (DCT) неподвижного изображения, устраняются высокие частоты, передаются коэффициентыразложения для оставшихся частот, по ним в приемнике изображение восстанавливается.Алгоритм М-JPEG – кодек М-JPEG – стандартный алгоритм сжатия потока MPEG-данных (движу-щихсяизображений), предложенный группой М-JPEG; используется для компрессии видео, в котором каждыйотдельный кадр сжимается по методу JPEG.Алгоритмы MPEG (Moving Pictures Experts Group) – представляет собой открытый (т.е. не требу-ющийоплаты за использование) стандарт на сжатие и воспроизведение движущихся изображений, разработанныйгруппой MPEG, а также формат хранения сжатого (до 1:200) файла; ориентированы на обработку видео.
Приформировании потока данных исходят из предположения о том, что 2 соседних кадра в видеопоследовательностимало отличаются. Опорные кадры сжимают по методу JPEG и передают относи-тельно редко. В основномпередаются изменения между соседними кадрами.Сжатая информация упаковывается в файлы в форматах: avi, mov, mpg, wmv и др.Методы MPEG стали мировыми стандартами для цифрового телевидения.f(t)71106101510041003210001010001tkДля представления звуковых данных в цифровой форме используется импульсно-кодовая модуляция(ИКМ). Для высококачественного воспроизведения звука выделяют полосу 20 кГц.
Следовательно, частотадискретизации должна быть не менее 40 кГц. Если каждый отсчет кодировать двумя байтами, то информационная скорость воспроизведения будет равна 640 кбит/с (1640000=640 000 бит/с) и для записи звука продолжительностью 1 мин потребуется память около 4,8 Мбайт(64000060 = 38 400 000 бит/8 = 4 800 000 байт = 4,8 Мбайт).Поэтому используются специальные алгоритмы сжатия аудиоинформации с ее представлением вформатах: mp3, wave, wma, vqf и др.В некоторых разновидностях метода ИКМ используется алгоритм относительного кодирования, когдапри передаче числовых данных с небольшими отклонениями между последовательными отсчетами (числами)осуществляется передача только этих отклонений вместе с известным опорным значением.При дифференциальной (разностной) ИКМ (ДИКМ) вместо кодирования отсчетов кодируются разностимежду соседними отсчетами (они по величине меньше самих отсчетов).Адаптивная ДИКМ (АДИКМ) - система ДИКМ с адаптацией квантователя (АЦП и ЦАП) ипредсказателя.
При АДИКМ оцифровывается не сам сигнал, а его отклонение от предсказанного значения.Т.о., к методам сжатия относят также методы разностного кодирования, так как разности амплитудотсчетов представляются меньшим числом разрядов, чем сами амплитуды.Разностное кодирование реализовано в методах дельта-модуляции и ее разновидностях,а такжепредсказывающие (предикативные) методы, которые основаны на экстраполяции значений отсчетов, и есливыполнено условие Aр - Aп > d, то отсчет должен быть передан, иначе он является избыточным; здесь Aр и Aп амплитуды реального и предсказанного отсчетов, d - допуск (допустимая погрешность представления амплитуд).На практике используют ряд алгоритмов сжатия, каждый из которых применим к определенному типуданных.
Некоторые модемы (называемые интеллектуальными) предлагают адаптивное сжатие, при котором взависимости от передаваемых данных выбирается определенный алгоритм сжатия.Многие модели коммуникационного оборудования, такие как модемы, мосты, коммутаторы и маршрутизаторы, поддерживают протоколы динамической компрессии, позволяющие обеспечить коэффициентсжатия 1:4 или 1:8.
Реальный коэффициент компрессии зависит от типа передаваемых данных, так графические итекстовые данные обычно сжимаются хорошо, а коды программ – хуже.Сжатие данных увеличивает пропускную способность линии связи. На передающем узле данныеавтоматически сжимаются, а принимающий узел их восстанавливает.9.