Прокис Дж. - Цифровая связь (1266501), страница 28
Текст из файла (страница 28)
Кодирование подполосок. При кодировании подполосок (КПП) сигналов речи и изображения суммарный сигнал разделяется на небольшое число частотных подполосок, а в каждой из них сигнал кодируется раздельно. При кодировании речи, например, низкочастотные полосы сигнала содержат большую часть спектральной энергии. В дополнение к этому шум квантования более заметен на слух в низкочастотной области.
Следовательно, для представления сигнала в низкочастотных полосах надо использовать больше бит, а в высокочастотных — меньше. Расчет фи~йьтров особенно важен для достижения хорошей рабочей характеристики КПП. На практике обычно используются квадратурно-зеркальные фильтры (КЗФ), так как они имеют наилучшую характеристику, определенную их совершенными конструктивными свойствами (см.
Вайданатен, 1993). Используя КЗФ для КПП, низкочастотную полосу сигнала неоднократно делят пополам, что создает октавио-полосных фильтров. Выход каждого КЗФ подвергается децимации с коэффициентом 2 для уменьшения частоты стробирования. Например, предположим, что полоса частот сигнала речи простирается до П8 3200 Гц. Первая пара КЗФ перекрывает спектр в нижней полосе (О... !600 Гц) и верхней полосе (1600...3200 Гц). Затем нижняя полоса снова расщепляется на нижнюю (0„.800 Гц) и верхнюю (800...1600 Гц) полосы путем использования другой пары КЗФ, '1ретье деление другой парой КЗФ может расщепить полосу О., 800 Гц па низкую (0...400 Гц) и высокую (400...800 Гц). 1аким образом, тремя парами КЗФ мы получаем сигналы в чаглотных полосах 0...400, 400...800, 800...1600 и 1600...3200 Гц. Временной сигнал в каждой полосе может теперь кодироваться с различной точностью.
На практике для кодирования сигнала в каждой подполоске используется адаптивная ИКМ. Адаптивное преобразующее коднровщпнь При адаптивном преобразующем кодировании (АПК) сигнал источника стробпруется и делится на группы из 77 отсчетов. / Данные кахсдой группы преобразуются в спектральнузо область для кодирования и передачи. В декодере источника каждая г!эуппа спектральных отсчетов преобразуется обратно во временную область и пропускается чепез цнфро-аналоговый преобразователь, Для достижения эффективного кодирования предусматривают больше бнт для более ), важных спектральных коэффициентов и мспьпю бит для менее важных снекграшных !,:::. коэффициентов.
Дополнительно прп проектировании адаптивного распределения общего числа битов для спектральных коэффициентов мы моэкем адаптироваться к возможной ыспнющсйся статистике сигнала источника. Целью выбора преобразования из временной области в частотную область является получспис пекоррслированных спек гральных отсчетов.
В этом смысле преобразование Карунена — Лоэва (ПКЛ) является оптимальным, поскольку оно дает некоррелированные спектральные значения. По ПКЛ в общем случае трудно выполнить (см. Вннц, 1973). Дискретное преобразование Фурье (ДПФ) и дискретное косинус — иреоб7эазоааиие ДКП являются приемлемыми альтернативами, хотя онн субоптимальны. Из них ДКП даег хорошу1о рабочую харакгеристнку, сравннмучо с ПКЛ, н оно обычно используется на практике (см. Кампанелла и Робинсон. !9?1, Зелинский и 11оль, 1977). При кодировании рсчи 'с использованием АПК возможно получить качественную передачу при скорости псредачи около 9000 бнт/с. 3.5З. Модельное кодирование источника В отличие от методов кодирования сигналов.
описгпшых выше, модельное кодирование источника основано на совершенно ином подходе. В неги источник моделируется линейным порождающим фильтром, который при возбуждении подходящим входным сигналом выдайт наблюдаемый выход реального источника. Вместо передачи отсчетов реальных сигналов к приемнику передьчотся параметры порождающего фильтра вместе с подходящим возбуждающим сигналом. Если число параметров достаточно мало, методы модельного кодирования обеспечивают большое сжатие данных. Наиболее широко используется метод кодирования источника, который называют, линейным кодированием с предсказанием (ЛКП).
В нем стробированная последовательность, обозначенная (л;,), п = О, 1,..., М вЂ” 1, предполагается выходом порождающего фильтра с дискретным временем и с передаточной функцией, имеющей только полюсы (всеполюсный фильтр): П(я) =- 6 (3.5.! 8) 1 — ~~> а„г ! 1 Подходящими возбуждающими функциями для порождающего филыра являются: .импульс, последовательность импульсов или последовательность отсчетов белого гауссовского шума с единичной дисперсией. Б любом случае предположим, что входшэя последовательность обозначается о„, и=0,1,.... Тогда выходная последовательность порождающего фильтра удовлетворяет рязностному уравнению я х„=,'1 а„х„+ Оо„, и = О, 1, 2, ...
(3.5.19) 1=1 Р х„= ~~> а, х„„и > О. (3.5.20) Разность между х„и х„, а именно Р е„= х„— х„= х„— > а„х„,, й=! (3.5.21) определяет ошибку между наблюдаемым х„и его оценкой х„. Фильтровые коэффициенты (а„) можно выбрать так, чтобы минимизировать средний квадрат этой ошибки. Предположим, что входом (о„) является последовательность отсчетов белого центрированного шума с единичной дисперсией. Тогда выход фильтра х„является случайной последовательностью и такой же является разность е„=х„— х„.
Средний по ансамблю квадрат ошибки равен Р е я ~', = Е(г„) = Е((х„-~а„х.,)') = ф(0)-2~~> а„ф(1г)+ ~ ~1 а„а„,ф(й — т), (3.5 22) !=! !!=! !!:! а где ф(т) — автокорреляционная функция последовательности (х„), и = О, 1,..., Л! -1. Но г' идентична СКО, определенной (3.5.8) для предсказателя, используемого в ДИКМ. Следовательно, минимизация ~*„в (3.5.22) дает систему линейных уравнений, данных ранее формулой (3.5.9). Для полного описания системной функции фильтра Н(я) мы должны определить помимо (а„) коэффициент усиления фильтра О. Из (3.5.19) и (3.5.21) имеем Р Е((0'о„)) = 0'Е(о„з) = б' = Е((х„— ~ а„х„, )') = ~„„(3.5.23) ! ! где Жр,— минимальная (остаточная) среднеквадратическая ошибка (СКО) предсказания, получаемая из (3.5.22) путем подстановки оптимальных предсказанных коэффициентов, которые следуют из решения (3.5.9). С помощью этой подстановки выражение для И'„, и, следовательно, для 0 упрощается: 2 ~~, = б' = ф(0) — ~ а„ф(/г) .
(3.5.24) На практике мы не знаем точно априори действительную автокорреляционную функцию выхода источника. Следовательно, вместо ф(т) мы подставим оценки ф(т), даваемые (35.10)„которые получены из ряда отсчетов х„, и=0,1,...,М-1, выдаваемых источником. Как указано ранее, алгоритм Левинсона — Дурбина, приведенный в приложении А, можно использовать для итеративного определения коэффициентов предсказания (а„), !20 В общем, реально наблюдаемый выход источника х„, и = О, 1,..., М вЂ” 1 не удовлетворяет разностному уравнению (3.5.19), удовлетворяет этому уравнению только модель. Если вход является последовательностью отсчетов белого центрированного гауссовского шума„мы можем из (3.5.19) формировать оценку х„при помощи взвешенной линейной комбинации начиная с предсказания первого порядка и выполняя итерацию до порядка предсказания р.
Рекуррентные уравнения для (а„) можно выразить следующим образом: 1-) Ф(1)-,'» а,,ф('-~) 1=2,3, ..., р„ 1</с <1 — 1, а,„=а, „-а„а, „„ (3.5.25) ~1 а )1;- а == 4=Ф(О), ф(1) ф(0) ' 1-го порядка. Определяемые где а,„, 1 = 1, 2,...,г, — коэффициенты предсказателя коэффициенты для предсказателя порядка р равны а, ма,„, к=1,2,...,р, (3.5.26) и остаточная СКО равна л в = а' = ф(О) — ~ а„ф(7~) = ф(О)П(» — а,',).
/см ~м (3.5.27) Заметим, что рекуррентные соотношения (3.5.25) дают нам не только коэффициенты предсказателя порядка р, но также коэффициенты предсказателя всех порядков, меньших р. Остаточная СКО с„1 =- 1, 2,..., р, формирует монотонно убывающую последовательность, т.е. Ф < 6„', < ... 8; < 8; и коэффициенты предсказания а„ 'в — 'л-1 — " ч — 'о удовлетворяют условию ~а,,~<1, 1=1,2,..., р (3.5.28) 12~ Это условие необходимо и достаточно для того, чтобы все полюсы передаточной функции Н(я) находились внутри единичной окружности с центром в начале координат. Таким образом, условие (3.5.28) обеспечивает и устойчивость модели. ЛКП успешно используется при моделировании источников речи.
В этом случае коэффициенты а„., 1=1,2, ..., р, названы коэффициентами отражении вследствие их ' соответствия коэффициентам отражения в акустической трубной модели голосового тракта (см. Рабинер и Шафер, 1978; Деллер и др„1993). Когда коэффициенты порождающего фильтра и усиление (л оценены по выходам источника (х„), каждый из этих параметров кодируется последовательностью двоичных -:,:;.