Прокис Дж. Цифровая связь (2000) (1151856), страница 28
Текст из файла (страница 28)
Затем нижняя полоса снова расщепляется на нижнюю (0...800 Гц) н верхнюю (800...1600 Гц) полосы путем использования другой пары КЗФ. Третье деление другой парой КЗФ может расщепить полосу 0...800 Гц на низкую (0...400 Гц) и высокую (400...800 Гц). Таким образом, тремя парами КЗФ мы получаем сигналы в часто>пых полосах 0...400, 400...800, 800...1600 и 1600...3200 Гц Временной сигнал в каждой полосе может теперь кодироваться с различной точностью.
На трактике для кодирования сигнала в каждой подполоске используется адаптивная ИКМ, Адаптивное преобразующее кодирование. При адаптивном преобразующем кодировании (АПК) сигнал источника стробируется и делится на группы из Л', отсчетов. Данные каждой группы преобразуются в спек гральную область для кодирования и передачи. В декодере источника каждая группа спектральных отсчетов преобразуется обратно во временную область и пропускается через цифро-аналоговый преобразователь. Для достижения эффективного кодирования предусматривают больше бит для более важных спектральных коэффициентов и меньше бит для менее важных спектральных коэффициентов.
Дополнительно при проектировании адаптивного распределения общего числа битов для спектральных коэффициентов мьг можем адаптироваться к возможной меняющейся статистике сигнала источника. Целью выбора преобразования из временной области в частотную область является полученис некоррелированных спектральных отсчетов. В этом смысле преобразование Карунена-"!оэва (ПКЛ) является оптимальным, поскольку оно дает некоррелированные спектральные значения. Но ПКЛ в общем случае трудно выполнить (см.
Винц, 1973). Дискретное преобразование Фурье (ДПФ) и дискретное касииус — г>реобразоваиие ДКП являются приемлемыми альтернативами, хотя они субоптимальны. Из них ДКП дает хорошую рабочую характеристику, сравнимую с ПКЛ, и оно обычно используется' на практике (см. Кампанелла н 1'обинсон, 1971; Зелинский и Ноль, 1977). При кодировании речи 'с использованием АПК возможно получить качествсш>ую передачу при скорости передачи около 9000 бит'с. 3.5.3. Модельное кодирование источника В отличие от методов кодирования сигналов, описанных выше, мг>дельное кодирование источника основано па совершенно ином подходе. В нем источник люделируется линейным порождающим фильтром, который при возбуждении подходящим входным сигналом выдает наблюдаемый выход реального источника.
Вместо передачи отсчетов реальных сигналов к приемнику передаются параметры порождающего фильтра вместе с подходящим возбуждающим сигналом. Если число параметров достаточно мало, методы модельного кодирования обеспечивают большое сжатие данных. Наиболее широко используется метод кодирования источника, который называют линейным кодированием с предсказанием (ЛКП). В нем стробированная последовательность, обозначенная (х„), и =- О, 1,..., А> — 1, предполагается выходом порождающего фильтра с дискретным временем и с передаточной функцией, имек>щей только полюсы (всеполюсный фильтр): О(г) = б (3.5.18) 1-~~> а а е ~м Подходящими возбуждающими функциями для порождающего фильтра явля>отса: импульс, последовательность импульсов или последовательность отсчетов белого гауссовского шума с единичной дисперсией.
В любом случае предположим, что входная ыо последовательность обозначается и„, л = О, 1,.... Тогда выходная последовательность Ф порождающего фильтра удовлетворяет разностному уравнению /1 х„= ~ а„х„„+ б!э„п = О, 1, 2,, (3.5.19) е ! Р х„=,г а„х„„, л>0. (3.5.20) Разность между х„и х„, а именно е е„=х„— х„=х„— ~ а„х„„, А=! (3.5.21) определяет ошибку между наблюдаемым х„и его оценкой х„. !Рильтровые коэффициенты (а,) можно выбрать так, чтобы минимизировать средний квадрат этой ошибки. Предположим, что входом (!э„) является последовательность отсчетов белого центрированного шума с единичной дисперсией. Тогда выход фильтра х„является случайной последовательностью и такой же является разность е„= х„— х„. Средний по ансамблю квадрат ошибки равен р л е =Е(е, )=Е[(х„— ~а,х„„„) )=ф(0) — 2Ч~ а,фЯ+ > ~~ а,а„,фЯ вЂ” и), (3.5.22) е=! й=! !=! а=! где ф(т) — автокорреляционная функция последовательности (х„), п = О, 1,..., У -1.
Но 8'„ идентична. СКО„определенной (3.5.8) для предсказателя, используемого в ДИКМ. Следовательно, минимизация 8' в (3.5,22) дает систему линейных уравнений, данных ранее формулой (3.5.9). Для полного описания системной функции фильтра Н(х) мы должны определить помимо (а„) коэффициент усиления фильтра 6. Из (3.5.19) и (3.5.21) имеем /3 Е((6'о,')) = 6'Е(!э„) = 6' = Е((х„—,Г а,х„„)') = 0' „(3.5.23) где 0'„— минимальная (остаточная) среднеквадратическая ошибка (СКО) предсказания, получаемая из (3.5.22) путем подстановки оптимальных предсказанных коэффициентов, которые следуют из решения (3.5.9). С помощью этой подстановки выражение для ~,'„и, следовательно, для 6 упрощается: 2 И', =Ст' =ф(0) — ~ а„ф(Уг).
(3.5.24) На практике мы не знаем точно априори действительную автокорреляционную функцию выхода источника. Следовательно, вместо ф(!л) мы подставим оценки ф(а!), даваемые (3.5.10), которые получены из ряда отсчетов х„, и =О, 1,...,Ж вЂ” 1, выдаваемых источником. Как указано ранее, алгоритм Левинсона-Дурбина, приведенный в приложении А, можно ислользовать для итеративного определения коэффициентов предсказания (а„), 120 В общем, реально наблюдаемый выход источника х„, л = О, 1,..., Ф -1 не удовлетворяет разностному уравнению (3.5.19), удовлетворяет этому уравнению только модель.
Если вход является последовательностью отсчетов белого центрированного гауссовского шума, мы можем из (3.5.19) формировать оценку х„при помощи взвешенной линейной комбинации начиная с предсказания первого порядка и выполняя итерацию до порядка предсказания!>.
Рекуррентные уравнения для 1а,) можно выразить следующим образом: ф(!) — ~~> а,,ф(! — 1г) !-! 1< /с <!' — 1, а, =а,„-а„а, „,, (3.5.25) где а,„, к =1, 2,...,>, — коэффициенты предсказателя >-го порядка. Определяемые коэффициенты для предсказателя порядка р равны а, ма „/с=1, 2, ...,р, (3.5.26) и остаточная СКО равна Р Р 'в = а' =ф(О) — !> а ф(1г) = ф(О)®1 —,',). > 1 ! ! (3.5.27) Заметим, что рекуррентные соотношения (3.5.25) дают нам не только коэффициенты предсказателя порядка р, но также коэффициенты предсказателя всех порядков, меньших р.
Остаточная С КО Е;, ! = 1, 2,..., р, формирует монотонно убывающую последовательность, т.е. 6 < б~ ! < ... сч! < >го и коэффициенты предсказания а„ удовлетворяют условию (а,,~<1, >=1,2,..., р. (3.5.28) 121 Это условие необходимо и достаточно для того, чтобы все полюсы передаточной функции Н(з) находились внутри единичной окружности с центром в начале координат.
Таким образом„условие (3,5.28) обеспечивает и устойчивость модели. ЛКП успешно используется при моделировании источников речи. В этом случае коэффициенты а„, !".=1,2,, р, названы коэффициентами отражения вследствие нх соответствия коэффициентам отражения в акустической трубной модели голосового тракта (см. Рабинер и Шафер, 1978; Деллер и др., 1993). Когда коэффициенты порождающего фильтра и усиление 0 оценены по выходам источника (х„), каждый из этих параметров кодируется последовательностью двоичных символов и передается к приемнику.
Декодирование источника нли синтез сигналов речи могут бьггь выполнены в приемнике, как показано на рис. 3.5.10. Генератор сигнала используется для создания отсчетов возбуждения 1>>„~, которые масштабируются посредством О' для получения необходимого входа фильтра с передаточной функцией Н( ), содержащей только полюсы и синтезированной по принимаемым коэффициентам отражения. Аналоговый сигнал источника может быть восстановлен и путем пропускания выхода Н(г) через аналоговый фильтр, который выполняет функцию интерполяции сигнала между отсчетными точками. В этой реализации синтезатора сигнала источника возбуждающая функция и параметр усиления 6 должны быть переданы вместе с коэффициентами отражения к приемнику.
Рис. 3.5.10. Блок-схема синтезатора сигнала (декодера источника) для ЛКП системы Сигнав речи Г!ернол высоты звука! Д; Рис. 3.5.11. Блок-схема модели генерации сигнала речи Когда выход источника стацнонарен, параметры порождающего фильтра должны быть определены лишь однажды. Однако большинство источников, встречающихся на практике, в лучшем случае квазистационарны. В связи с этим обстоятельством необходимо периодически получать новые оценки для коэффициентов фильтра, для усиления О, вида возбуждающей функции и передавать эти данные к приемнику. Пример 3.5.1. Блок-схема рис. 3.5.11 иллюстрирует модель источника речи.
Здесь имеются две взаимоисключающе возбуждающие функции для моделирования голосовых (вокализованных) и неголосовых (невокализованных) звуков речи. В пределах короткого интервала времени голосовая речь является периодической с основной частотой ~, нлн с периодом повторения 1~Де (основной тон), который зависит от говорящего. Таким образом, речь генерируется возбуждением модели (голосового тракта) фильтра с одними полюсами посредством периодической импульсной последовательности с периодом, равным требуемому периоду повторения. Невокализованные звуки генерируются путем возбуждения модели фильтра случайным шумом.
Кодер речи в передатчике должен определить правильный тип возбуждающей функции, основной тон, параметр усиления б и коэффициенты предсказания. Этн параметры кодируются двоичными символами и передаются приемнику. Как правило, информация о типе звука (вокализованный илн невокализованный) требует для передачи 1 бит, период повторения основного тона адекватно представляется б битами, параметр усиления 6 может быть представлен 5 битами после того, как его динамический диапазон логарифмически сжат. Коэффициенты предсказания требуют 8...10 бит/коэфф. для адекватного представления (см.