Прокис Дж. Цифровая связь (2000) (1151856), страница 29
Текст из файла (страница 29)
Рабинер и Шафер, 1А8). Смысл в такой 'высокой точности представления тот, что относительно малые изменения в коэффициентах предсказания ведут к большим изменениям в положении полюсов фильтра Н(з). Требования к точности могут быть ослаблены путем передачи коэффициентов отражения а„, которые имеют меньший динамический диапазон. Онн могут быть адекватно представлены 6 битами. Таким образом, для предсказателя порядка р = 10 1пять полюсов в Н(г) 1 общее число битов равно 72. С учетом квазистационарной природы сигналов речи линейная модель системы должна обновляться периодически, как правило, один раз каждые 15...30 мс. Поэтому битовая скорость кодера источника находится в диапазоне 4800...2400 бит!с. Выход Рис. 3.5.12. Всеполюсный решетчатый фильтр длл синтеза сигнала речи Если к декодеру передаются коэффициенты отражения„ нет надобности пересчитывать их в коэффициенты предсказания для того, чтобы реализовать синтезатор речи.
Синтез выполняется путем реализации лестничного фильтра, показанного на рис, 3.5.12, который использует коэффициенты отражения непосредственно и который эквивалентен линейному фильтру предсказания. Линейная модель с одними полюсами, для которой коэффициенты фильтра оцениваются посредством линейного предсказания„являются простейшей линейной моделью для источника. Более общая модель источника — линейный фильтр, который содержит и полюса,и нули. В нуль-полюсной модели выход источника х„ удовлетворяет разностному уравнению л а х, = ~а„х„„+~ Ьр„„, Фы ь=а где оь- входная возбуждающая последовательность. Задача теперь заключается в оценке параметров фильтра 1а,) и (Ь„) на основе данных х„1=0,1,..., М вЂ” 1, выдаваемых источником.
Однако критерий СКО, использованный для минимизации ошибки е„= х„— х„, где х„— 'оценка х„, сводится теперь к решению совокупности нелинейных уравнений относительно параметров (а„) и (Ь,), что выполняется громоздко и математически трудно. Чтобы избежать решения нелинейных уравнений, разработан ряд субоптимальных методов для нуль-полюсного моделирования. Обсуждение этой техники. однако, уведет нас далеко от предмета. ЛКП, описанные выше, формируют основу для более сложных модельных методов кодирования источника. Модельные методы, используемые для кодирования речи, обычно называют вокодерами (чо1се содегз). В дополнение к традиционным ЛКП вокодерам, описанным выше, разработаны другие типы вокодеров: остаточно возбужденные ЛКП (ЛКОВ), многоимпульсные ЛКП вокодеры, кодовозбуждаемый ЛКП (ЛККВ) вокодер, и 123 векторно-суммарно-возбуждаемый ЛКП (ЛКВСВ) вокодер, ЛККВ и ЛКВСВ вокодеры используют векторно-квантованные возбуждающие кодовые слова для достижения высокого качества передачи речи при низкой битовой скорости кодирования.
Перед тем как закончить этот раздел, рассмотрим использование кодирования сигналов и ЛКП для кодирования сигналов речи и сравним битовые скорости этих методов кодирования. Таблица 3.5.2. Техника кодирования, применяемая для сигналов речи Коле Ско ость пе елани. бит/с Метод коли ования Кваптователь Линейный ИКМ Лог ИКМ ДИКМ АДИКМ ДМ АДМ 12 бнт 96 000 56 000...64 000 32 000...48 000 24 000...32 000 32 000...64 000 16 000...32 000 Логарифмический Логарифмический 7...8 бнт 4...6 бнт 3...4 бит 1 бит 1 бит Адаптивный Двоичный Адаптивный двоичный ЛКП 2400...4800 С учетом качества синтеза сигнала речи в приемнике посредством двоичных последовательностей, переданных по каналу без ошибок, все методы кодирования речи (ИКМ, ДИКМ, АДИКМ, ДМ, АДМ) обеспечивают по телефону качественную речь.
Другими словами, слушателю будет затруднительно заметить разницу между цифровой речью и аналоговой формой речи. АДИКМ и АДМ являются особенно эффективной техникой кодирования. Статистическое кодирование позволяет снизить скорость передачи до 9600 бит/с с заметным искажением. Действительно, на скоростях ниже 16 000 бит/с искажения, обусловленные кодерами сигнала, возрастают существенно. Следовательно, эта техника не используется на скоростях ниже 9600 бит/с. Для скоростей ниже 9600 бит/с обычно используется техника кодирования типа ЛКП, которая базируется на линейных моделях источника.
Синтезированная речь, полученная посредством техники кодирования этого класса, понятна. Однако сигнал речи имеет синтетическое качество, и искажения заметны. 124 Методы кодирования, применяемые для речевых сигналов. Передача речевых сигналов по телефонным линиям, радиоканалам и спутниковым каналам составляет наибольшую часть наших ежедневных связей. Поэтому понятно, что за последние три десятилетия большинство исследований было направлено на кодирование речи, а не на другие типы сигналов, передающих информацию. Действительно, вся техника кодирования, описанная в этом разделе, была использована для кодирования сигналов речи. Поэтому полезно сравнить эффективность этих методов через битовую скорость, требуемую для передачи сигнала речи. Предполагается, что сигнал речи ограничен полосой частот 200...3200 Гц и стробируется с номинальной скоростью 8000 отсч./с для всех кодеров, исключая ДМ, для которой скорость стробировання /", равна битовой скорости.
Предполагается, что в ЛКП кодере используются параметры, данные в примере 3.5.1. Таблица 3.5.2 суммирует средние характеристики методов кодирования, описанные в этом разделе, и требуемые битовые скорости. 3.6. БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ И ССЫЛКИ Кодирование источника является областью интенсивной исследовательской деятельности, начиная с публикаций классических статей Шеннона в 1948 г. и статьи Хаффмена (1952). С годами были получены важные достижения в разработке высокоэффективных алгоритмов сжатия данных источника. В частности, значительными являются научные исследования универсальных кодеров источника и универсальных квантователей, опубликованные Знвом (1985), Зивом и Лемпелом (1977, 1978), Дависсоном (1973), Греем (1975), Дависоном и др.
(1981). Разработки по теории функций скорость-искажение имеются в книгах Галлагера (1968), Бергера (1971), Витерби и Омура (1979), Блейхута (1987) н Грея (1990). Много работ было выполнено за несколько последних десятилетий по методам кодирования речи. Мы дали' здесь обзор этих важных тем. Более исчерпывающая разработка дана в книгах Рабинера и Шафера (1978), Джайанта и Ноля (1984), Деллера и др.(1993). В дополнение к этим публикациям имеются специальные исследования в журнале 1ЕЕЕ Тгапвас11опз оп Сопппшпсайопл (апрель 1979 и апрель 1982) и более новые в 1ЕЕЕ )оцгпа1 оп Бе1ес1ес1 Егеаз 1п Согппзип(са(1оп (февраль 1988), посвященные кодированию речи, Мы хотим также упомянуть публикацию в 1ЕЕЕ Ргезз книги, содержащей репринты опубликованных статей по кодированию и квантованию сигналов, отредактированные Джайантом (1976).
В последнем десятилетии мы также увиделн ряд важных достижений в области векторного квантования. Наша разработка этой темы основывалась на доходчивой работе Макхоула и др,(1985), Всесторонняя разработка по векторному квантованию и сжатию сигналов имеется в книге Гершо и Грея (1992). ЗАДАЧИ 3.1. Рассмотрим совместный эксперимент из задачи 2.1 с заданной совместной вероятностью р(А,В) . Допустим, мы наблюдаем выходы А„! = 1, 2, 3, 4, экспериментА. а. Определите взаимную информацшо 1(В~;А,) для /= 1,2, 3 и 1= 1,2, 3, 4 в битах. Ь. Определите среднюю взаимную информацию !(В; А) . 3.2. Предположим, что выходы В, У = 1, 2, 3, в задаче 3.1 представляют три возможных выходных слова ДИБП.
Определите энтропию источника. 3.3. Докажите, что !па < и — 1 и продемонстрируйте законность этого неравенства, построив кривые 1пл и л — 1. 3.4. Х и у являются двумя дискретными случайными величинами с вероятностями Р(Х = х, У = у) = Р(х, у) . Покажите, что !(Х, У) > О, причбм равенство имеет место тогда, и только тогда, когдаХи г статистически независимы. [Подсказка: используйте неравенство !пи < и-1 для О < и < 1, чтобы доказать, что — 1(Х У) < 01 3.5. Выход ДИБП состоит из возможных символов хпхз,...,х„,которые появляются с вероятностями рцр,...р„соответственно. Докажите, что энтропия 0(Х) источника не превышает 1ояп. 3.6. Определите дифференциальную энтропию л(Х) равномерно распределенной случайной величины Х !а ~ (0<х<а)„ (О (вне этого интервала) для следующих трех случаев: а) а=1; Ь) а=4; с) а=!/4.
125 Обратите внимание, что нз расчетов следует, что /~Х) является не абсолютной, а только относительной мерой неопределенности. 3.7. ДИБП имеет алфавит из восьми символов х„! = 1, 2,...,8, с вероятностями 0,25; 0,2; О,!5; О,!2; 0,10; 0,08; 0,05 и 0,05. а) Используйте процедуру кодирования Хаффмена, чтобы определить двоичный код для выхода источника.
Ь) Определите среднее число 11 двоичных символов на символ источника. с) Определите энтропию источника и сравните с 11 . 3.8. ДИБП источника имеет алфавит из пяти символов у„! = 1, 2,...,5, каждый из которых появляется с вероятностью !/5 . Вычислите эффективность равномерного двоичного кода, если; а) Каждый символ кодируется отдельно в двоичную последовательность. Ь) Два символа вместе кодируются в двоичную последовательность.