Прокис Дж. - Цифровая связь (1266501), страница 29
Текст из файла (страница 29)
Ё'' символов и передайгся к приемнику. Декодирование источника или синтез сигналов речи могут быть выполнены в приемнике, как показано на рис, 3.5.10. Генератор сипила используется для создания отсчетов возбуждения 1о„~, которые масштабируются посредством й для получения необходимого входа фильтра с передаточной функцией Н(:) „ содержащей только полюсы и синтезированной по принимаемым коэффициентам отражения.
Аналоговый сигнал источника может быгь восстановлен и путем пропускания выхода Н(г) через аналоговый фильтр, который выполняет функцию интерполяции сигнала между отсчетными точками. В этой реализации синтезатора сигнала источника :;: Г возбуждающая функция и параметр усиления 1л должны быль переданы вместе с коэффициентами отражения к приемнику. Рис.
3.5.10. Блок-схема синтезатора сигнала (декодера источника) длв ЛКП системы Сит»»вл Период высоты звука 1 г» Рис. 3.5.11. Блок-схема модели генерации сигнала речи Когда выход источника стацнонарен, параметры порождающего фильтра должны быть определены лишь однажды. Однако большинство источников, встречающихся на практике, в лучшем случае квазистационарны.
В связи с этим обстоятельством необходимо периодически получать новые оценки для коэффициентов'фильтра, для усиления О, вида возбуждающей функции и передавать этн данные к приемнику. Пример 3.5.1. Блок-схема рис. 3.5.11 иллюстрирует модель источника речи. Здесь имеются две взаимоисключающе возбуждающие функции для моделирования голосовых (локализованных) и неголосовых (нсвокализованных) звуков речи. В пределах короткого: !»:- ',.;1,', интервала времени голосовая речь является периодической с основной частотой /в илн с периодом повторения 1//; (основной тон), который зависит от говорящего.
Таким образом, речь генерируется возбуждением модели (голосового тракта) фильтра с одними полюсами посредством периодической импульсной последовательности с периодом, равным требуемому периоду повторения. Невокализованные звуки генерируются путем возбуждения модели фильтра случайным шумом. Кодер речи в передатчике должен определить правильный тип возбуждающей функции, основной тон, параметр усиления 6 и коэффициенты предсказания. Эти параметры кодируются двоичными символами и передаются приемнику. Как правило, информация о типе звука (вокализованный или невокализованный) требует для передачи ) бит, период повторения основного тона адекватно представляется б битами, параметр усиления гт может быть представлсн 5 битами после того, как его динамический диапазон тггггарнфтьнчесьчг сака..
1";аэффзтхвтсч.*1чз: предсказания требуют 8...10 бит/коэфф. для адеквапзого представления (см. Рабинер и 122 Шафер, 1978). Смысл в такой высокой точности представления тот, что относительно малые изменения в коэффициентах предсказания ведут к большим изменениям в положении полюсов фильтра Н(х). Требования к точности могут быть ослаблены пут6м передачи коэффициентов отражения и., которые имеют меньший динамический диапазон.
Они могут быть адекватно представлены 6 битами. Таким образом, для предсказателя порядка р = 10 [пять полюсов в Н(я) ] общее число битов равно 72. С учетом квазистационарной природы сигналов речи линейная модель системы должна обновляться периодически, как правило, один раз каждые 15...30 мс. Поэтому битовая скорость кодера источника находится в диапазоне 4800...2400 бит/с. Выход Рис. 3.5.12. Всепалюсный решетчатый фильтр для синтеза сигнала речи Если к декодеру передаются коэффициенты отражения, нет надобности пересчитывать их в коэффициенты предсказания для того, чтобы реализовать синтезатор речи, Синтез выполняется путем реализации лестничного фильтра, показанного на рис. 3.5.12, который использует коэффициенты отражения непосредственно и который эквивалентен линейному фильтру предсказания.
Линейная модель с одними полюсами, для которой коэффициенты фильтра оцениваются посредством линейного предсказания, являются простейшей линейной моделью для источника. Более общая модель источника — линейный фильтр, который содержит и полюса. и нули. В нуль-полюсной модели выход источника х„удовлетворяет разностному уравнению л а х, =~~~ а,хе а+~~1 Ь,оя „, а=1 т=е где оя — входная возбуждающая последовательность. Задача теперь заключается в оценке параметров фильтра (а,) и (Ь,) на основе данных х,, 1=0, 1,..., Ьг-1, выдаваемых источником.
Однако критерий СКО, использованный для минимизации ошибки гя =х„— х„, где х„— оценка х„, сводится теперь к решению совокупности нелинейных уравнений относительно параметров (а„) и (Ь„), что выполняется громоздко и математически трудно. Чтобы избежать решения нелинейных уравнений, разработан ряд субоптимальных методов для нуль-полюсного моделирования. Обсуждение этой техники, однако, уведет нас далеко от предмета. ЛКП, описанные выше, формируют основу для более сложных модельных методов кодирования источника. Модельные методы, используемые для кодирования речи, обычно называют вокодерами (чо1се сог)егз).
В дополнение к традиционным ЛКП вокодерам, описанным выше, разработаны другие типы вокодеров: остаточно возбужденные ЛКП 1ЛКОВ), многоимпульсные ЛКП вокодеры, кодовозбуждаемый ЛКП (ЛККВ) вокодер, и 122 векторно-суммарно-возбуждаемый ЛКП (ЛКВСВ) вокодер. ЛККВ и ЛКВСВ вокодеры используют векторно-квантов анные возбуждающие кодовые слова для достижения высокого качества передачи речи при низкой битовой скорости кодирования. Перед тем как закончить этот раздел, рассмотрим использование кодирования сигналов и ЛКП для кодирования' сигналов речи и сравним битовые скорости этих методов кодирования.
Таблица 3.52. Техника кодирования, применяемая для сигналов речи Ско ость пе едачи, бит/с Квантователь Линейный Коде !2 бит Метод коди оввния '96 000 56 000...64 000 32 000...48 000 24 000...32 000 32 000...64 000 16 000...32 000 ИКМ Лог икм ДИКМ АДИКМ ДМ АДМ Логарифмический Логарифмический 7...8 бит 4...6 бит 3...4 бит Адаптивный Двоичный Адаптивный двоичный ! бит ! бит 2400...4800 /!КП С учйтом качества синтеза сигнала речи в приемнике посредством двоичных последовательностей, переданных по каналу без ошибок, все методы кодирования речи !ИКМ, ДИКМ, АДИКМ, ДМ, АДЩ обеспечивают по телефону качественную речь Другими словами, слуша.
гелю будет затруднительно заметить разницу между цифровой речью и аналоговой формой речи. АДИКМ и АДМ являются особенно эффективной техникой кодирования. Статистическое кодирование позволяет снизить скорость передачи до 9600 бит/с с заметным искажением. Действительно, на скоростях ниже !6000 бит/с искажения, обусловленные кодерами сигнала, возрастают существенно. Следовательно, эта техника не используется на скоростях ниже 9600 бит/с. Для скоростей ниже 9600 бит/с обычно используется техника кодирования типа ЛКП, которая базируется на линейных моделях источника.
Синтезированная речь, полученная цосрсдством техники кодирования этого класса, понятна. Однако сигнал речи имеет синтетическое качество, и искажения заметны. Методы кодирования, применяемые для речевых сигналов. Передача речевых сигналов по телефонным линиям, радиоканалам и спутниковым каналам составляет наибольшую часть наших ежедневных связей. Поэтому понятно, что за последние три десятилетия большинство исследований бььчо направлено па кодирование речи, а не на другие типы сигналов, передающих информацию. Действительно, вся техника кодирования, описанная в этом разделе, была использована для кодирования сигналов речи. Поэтому полезно сравнить эффективность этих методов через битовую скорость, требуемую для передачи сигнала речи.
Предполагается, что сигнал речи ограничен полосой частот 200...3200 Гц и стробируется с цоминальной скоростью 8000 отеч./с для всех кодеров, исключая ДМ, для которой скорость стробирования / равна битовой скорости, Предполагается. что в ЛКП кодере используются параметры, данные в примере 3.5.!. Таблипа 3.5.2 суммирует средние характеристики методов кодирования, описанйые в этом разделе, и требуемые битовые скорости.
3.6„БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ И ССЫЛКИ Кодирование источника является областью интенсивной исследовательской деятельности, начиная с публикаций классических статей Шеннона в 1948 г. и статьи Хаффмена (1952). С годами были получены важные достижения в разработке высокоэффективных алгоритмов сжатия данных источника. В частности, значительными являются научные исследования универсальных кодеров источника и универсальных квантователей, опубликованные Зивом (1985), Зивом и Лемпелом (1977, 1978), Дависсоном (1973), Греем (1975), Дависоном и др.
(1981). Разработки по теории функций скорость-искажение имеются в книгах Галлагера (1968), Бергера (1971), Витерби и Омура (1979), Блейхута (1987) и Грея (1990). Много работ было выполнено за несколько последних десятилетий по методам кодирования речи. Мы дали здесь обзор этих важных тем. Более исчерпывающая разработка дана в книгах Рабинера и Шафера (1978), Джайанта и Ноля (1984), Деллера и др.(1993).
В дополнение к этим публикациям имеются специальные исследования в мгурнале 1ЕЕЕ Тгапзасг)опз оп Сон!гнпп(са11опз (апрель 1979 и апрель 1982) и более новые в 1ЕЕЕ 1опгпа1 оп Яе1ессег) Егеаз )п Соппппгйсайоп (февраль 1988), посвященные кодированию речи. Мы хотим также упомянуть публикацию в 1ЕЕЕ Ргезз книги, содержащей репринты опубликованных статей по кодированию и квантованию сигналов, отредактированные Джайантом (1976). В последнем десятилетии мы также увидели ряд важных достижений в области векторного квантования. Наша разработка этой темы основывалась на доходчивой работе Макхоула и др.(1985).
Всесторонняя разработка по векторному квантованию и сжатию сигналов имеется в книге Гершо и Грея (1992). ЗАДАЧИ 3.1. Рассмотрим совместный эксперимент из залачи 2.1 с заданной совместной вероятностью Р(А,В). Допустим, мы наблюдаем выходы А„1 = 1, 2, 3, 4, эксперимент А. а. Определите взаимную информацию ~(В;А)'лля 7 = 1,2,3 и 1=1,2,3,4 в битах. Ь. Определите среднюю взаимную информацюо 7(В; А) . 3.2. Предположим, что выходы Вэ У = 1, 2, 3, в задаче 3.1 представляют три возможных выходных слова ДИБП. Определите энтропию источника. 3.3. Докажите, что 1п и < п -1 и продемонстрируйте законность этого неравенства„построив кривые !пи и п-1 3.4. Х и г' являются двумя дискретными случайными величинами с вероятностями Р(Х =х,у.=у) = Р(х,у).