Маковеева М.М., Шинаков Ю.С. Системы связи с подвижными объектами (2002) (1151874), страница 13
Текст из файла (страница 13)
Эти алгоритмы нашли широкое применение в беспроводных системах стандартов СТ2 и ь)ЕСТ. Кодирование речевого сигнала в частотной области. Кодирование в частотной области позволяет'учесть особенности восприятия речи человеком и также приводит к эффективным алгоритмам кодирования. В кодерах этого класса речевой сигнал подвергается полосной фильтрации несколькими узкополосными фильтрами, которые выделяют несколько частотных компонентов; затем зти компоненты квантуются и кодируются отдельно с учетом некоторых критериев восприятия сигналов каждой полосы.
Достоинством такой схемы кодирования является возможность динамического изменения числа используемых битов и их перераспределения между разными частотными компонентами при их кодировании Квантование является нелинейной операцией, сопровождаемой возникновением широкополосной помехи. Ухо человека неодинаково воспринимает различные участки спектра помехи квантования, имея зкспоненциально убывающую чувствительность с ростом частоты. Поэтому можно существенно повысить качество кодирования в узких полосах частот.
При полосовом кодировании спектр речевого сигнала делится на 4 или 8 полос с помощью набора фильтров, сигнал каждой полосы переносится на нулевую частоту, дискретизируется по времени в соответствии с теоремой отсчетов 68 Котельникова (частота дискретизации при атом намного ниже частоты дискретизации исходного сигнала) и кодируется с различной точностью в соответствии с принятым критерием восприятия. Способы деления спектра сигнала на полосы могут быть разными. Например, полосы выбираются так, чтобы обеспечить равные вкпады в значение критерия разборчивости. Этот критерий приводит к депению попосы, указанному в табл. 2.1 (4).
Таблица 2.1 Другой способ разбиения состоит в том, чтобы выбрать все полосы равными и сигнал каждой полосы кодировать с разным числом битов, пропорционапьным значимости соответствующей полосы для восприятия речи. Часто испопьзуется октавный ряд полос, наилучшим образом соответствующий свойствам восприятия уха человека. Применяются различные апгоритмы обработки частотных компонентов речевого сигнала. Один из очевидных способов состоит в том, чтобы спектр каждого узкополосного сигнала путем преобразования частоты перенести к нулевой частоте, как зто обычно делается при одногюпосной модуляции.
Такое преобразование позвопяет понизить частоту дискретизации и реапизовать другие преимущества кодирования низкочастотных сигналов. На рис 2.12 представлен пример возможной реализации кодирования речевого сигнала в частотной области. Входной сигнал з(() фильтруется набором Фильтров, имеющих полосы пропускания лй„с нижней и верхней частотами среза соответственно ьзм и гзм. Сигнап з„(Г) с выхода фипьтра с номером п умножается на гармонический сигнал соз(в,„(); попучающееся копебание падается на вход фильтра низкой частоты с полосой пропускания (О, йй„). Сигнал г„(г) на выходе этого фильтра является низкочастотной версией сигнала з„(Г) и может быть представлен в спедующем виде: г„(г) = (з,(г)гоз(м,„г))Ох 6„(г), (2.32) где знак Ю обозначает операцию свертки. чл Преобразователь Г -В частоты вниз -)ь р -и Кодирование дтз, гаот Преобразователь Дискретизаоиа наскоки вниз Кодирование 3 т зтта декодирование -)и Интердодечне В» т Преобразоеатеоь 'ястоти Вверх т зит> декодирование -В Интероодачиа нЗь Преормаикмтмь иастсти вверх Рис.
2.12. Функциональная схема многополосного кодека речевого сигнала Сигнал г,(() дискретизируется с частотой дискретизации 2т)()„, кодируется и путем мультиплексирования с другими аналогичным образом закодированными узкополосными сигналами вставляется в общий цифровой поток. В приемнике этот поток демультиплексируется в отдельные каналы, сигналы которых декодируются и переносятся в соответствующие полосы частот, в результате чего формируется оценка сигнала г„()) канала с номером п.
Пример. Рассмотрим схему многолопосного кодирования, в которой полоса частот речевого сигнала разбивается на четыре полосы с граничными частотами, указанными в табл. 2.1. После переноса кюхдой полосы частот к нулевой частом сигналы нв выходе низкочастотных фильтров днскретизнруются в соответствии с теоремой отсчетов со следующими чвстотвмн: для подполосы 1 2.(700 — 200) = 1000 отсчвтпк для подполосы 2 2-(1310- 700) = 1220 отсчет/с: для подполосы 3 2 (2020 — 1310) = 1420 отсчет)с; для подполосы 4 2.(3200-2020) = 2360 отсчетгс. В соответствии с табл. 2.1 отсчеты разных подполос кодируются с разным числом битов нв один отсчет. В результате общая скорость кодирования равна 1000 4 + 1220 3+1420 2+ 2360 1 = 12660 бнт/с.
Кодирование речевого сигнала на основе линейного предсказания. Этот способ кодирования предусматривает обработку сигнала аа временной области и характеризуется двумя особенно- к Н(г)=б 1+~6„г кы (2.33) где Π— коэффициент усиления фильтра; з ' представляет собой операцию задержки на один такт. При моделировании речевого сигнала возбуждением этого фильтра является либо последовательность импульсов с частотой следования, равной частоте основного тона сегмента сигнала, либо белый шум, в зависимости от того, представляет ли обрабатываемый сегмент вокализованный или невокалиэованный звук.
Значения коэффициентов этого фильтра вычисляются для каждого передаваемого сегмента сигнала по алгоритму, который мы поясним ниже, При обработке используется линейное предсказание аналогично тому, как это делается при АДИКМ. Однако, в отличие от последней, вместо передачи по каналу связи квантованных значений ошибки предсказания в данном случае передаются только специальным образом выбранные статистические параметры этой ошибки. К таким параметрам обычно относят коэффициент усиления, частоту основного тона, тип сегмента (вокализованный или невокализованный звук). Зная значения этих параметров, можно сформировать в приемнике достаточно хорошую оценку сигнала возбуждения фильтра синтеза речевого сигнала.
Синтезирующий фильтр также имеет вид (2.33), а в качестве значений его коэффициентов при синтезе очередного сегмента сигнала подставляются оценки этих коэффициентов, вычисленные в кодере и переданные по каналу связи. Соответствующая функциональная схема кодера на основе линейного предсказания представлена на рис.2.13. Линейное предсказание текущего значения сигнала з„основывается на предположении, что зто значение может быть представлено стями. Во-первых, соответствующие алгоритмы кодирования оказываются достаточно сложными в вычислительном отношении, поскольку используется адаптивное предсказание будущих значений сигнала.
Во-вторых, дпя передачи речевого сигнала по каналу связи при предварительной обработке из отсчетов сигнала выделяются существенные признаки речевого сигнала, которые в значительной мере определяют его разборчивость и идентифицируемость при восстановлении в приемнике. Этот способ наиболее популярен и часто используется в современных системах связи с подвижными абонентами, поскольку обеспечивает приемлемое качество передачи речевого сигнала при очень низких скоростях. Система кодирования на основе линейного предсказания моделирует голосовой тракт человека с помощью фильтра низкой частоты со следующей передаточной функцией: Рис.
2.13. Функциональная схема кодирования речевого сигнала на основе линейного предсказания эп = Ха«ел-к+ел «=1 (2.34) здесь к„- ошибка предсказания. Оценки коэффициентов в этом выражении вычисляются по конечной выборке наблюдаемых значений речевого сигнала в каждом сегменте и выбираются так, чтобы минимизировать значение суммы квадратов ошибок: н и(п О = Хай= 'Ц"„,а«э. к~, и-~ п=1 «-о (2.35) где следует положить ао "- — 1. Обычно эта ошибка вычисляется для сегментов длиной 10 мс, а значение И оказывается равным 80...
100. Для получения минимального значения П необходимо приравнять нулю частные производные этой функции по переменным а: И И гО к-~ Р 2« -их~» а«эп-« = 2',анх~~~зп-гпзл-« са п=к «=о к=о л=1 (2.36) Значения внутренней суммы зависят только от наблюдаемых значений отсчетов сигнала, и их можно рассматривать как сценки ненормированных коэффициентов корреляции Я „речевого сиг- 72 с небольшой ошибкой как линейная комбинация р предшествующих его значений, где р обычно выбирают из интервала от 10 до 15: нала дпя данного сегмента, т = 1,...,р.