Ратынский М.В. Основы сотовой связи (1998) (1151876), страница 20
Текст из файла (страница 20)
Поэтому фактически граница между двумя классическими методами кодирования — кодирования формы сигнала и кодирования источника сигнала — до некоторой степени стирается. Перейдем непосредственно к кодерам речи, применяемым в сотовой связи, и рассмотрим следующие вопросы: принцип построения кодеров речи на основе метода линейного предсказания; сущность метода линейного предсказания; типы фильтров линейного предсказания, используемые в кодеках; практические схемы кодеков стандартов 0-АМРЯ и СВМ; методы оценки качества кодирования, позволяющие сопоставлять различные типы и варианты кодеков; перспективы развития методов кодирования.
Суть кодирования речи на основе метода линейного предсказания ()зпеаг Ргегйсбме Сог))по — ) РС) заключается в том, что по линии связи передаются не параметры речевого сигнала, как такового, а параметры некоторого фильтра, в известном смысле эквивалентного голосовому тракту, и параметры сигнала возбуждения этого Фильтра. В качестве такого фильтра используется Фильтр линейного предсказания.
Задача кодирования на передающем конце линии связи заключается в оценке параметров фильтра и параметров сигнала возбуждения, а задача декодирования на приемном конце — в пропускании сигнала возбуждения через фильтр, на выходе которого получается восстановленный сигнал речи. Различные варианты алгоритмов кодирования отличаются один от Принннпы построения и технические проблемы 89 другого набором передаваемых параметров фильтра, методом формирования сигнала возбуждения и тому подобными деталями. Метод линейного предсказания заключается в том, что очередная выборка речевого сигнала Я„с некоторой степенью точности предсказывается линейной комбинацией М предшествующих выборок: м Я, =2.аЯ... -1 где а, — коэффициенты линейного предсказания, М вЂ” порядок предсказания. Разность между истинным и предсказанным значениями выборки определяет ошибку предсказания (остаток предсказания): м е, = Я, - Я„ = Я, — 2 а Я„, ~-1 В результате з-преобразования этого разностного уравнения по- лучаем Е(з) = Я(г) — 2 а,Я(г)г ' = Я(г)А(з), где функция А(г) м А(г) =1 — ',> а,г ' интерпретируется как передаточная характеристика некоторого фильтра (инверсного фильтра ипи фильтра-анализатора), частотная характеристика которого обратна по отношению к частотной характеристике голосового тракта.
При подаче речевого сигнала на вход инверсного фильтра на выходе фильтра получается сигнал возбуждения, подобный (с точностью до ошибок, определяемых конечностью порядка предсказания М и погрешностью оценки коэффициентов предсказания) сигналу возбуждения на входе фильтра голосового тракта. Полученное выражение для А(г) соответствует структуре трансверсального фильтра (рис. 2.35). Порядок предсказания выбирается из условия компромисса между качеством передачи речи и пропускной способностью линии связи; практически М берется порядка 10. Значения коэффициентов предсказания, постоянные на интервале кодируемого сегмента речи (на практике длительность сегмента составляет 20 мс), находятся из условия минимизации среднеквадратического значения остатка предсказания на интервале сегмента.
90 Глява 2 е„ Рис.2.35. Анализирующий трансверсзльный фильтр при порядке предсказания М = 3 8 Рис 2 35 Анализирующий решетчатый филюр при порядке предсказания М = 3 (е~ и е остатки предсказания вперед и назад) для это~о частные производные 3(2.е,з)~да, приравниваются к нулю, что приводит к системе М линейных уравнений с /И неизвестными коэффициентами а,. Матрица системы и метод ее решения оказываются несколько различными в зависимости от того, какими свойствами наделяется речевой сигнал на интервале преобразуемого сегмента речи.
Если речевой сигнал на этом интервале считается стационарным случайным процессом (автокорреляционный метод оценки коэффициентов предсказания), то матрица системы теплицева, 91 Приипипы построения н технические проблемы система решается с помощью итерационной процедуры алгоритма Дарбина, и фильтр-синтезатор получается заведомо устойчивым. Если речевой сигнал считается нестационарным процессом (ковариационный метод оценки коэффициентов предсказания), то матрица системы симметрична, но не теплицева, система решается с использованием разложения Холецкого, а для обеспечения устойчивости фильтра-синтезатора ковариационный метод приходится соответствующим образом модифицировать. В обоих случаях (как в автокорреляционном методе, так и в ковариационном) в качестве побочного результата решения получаются значения так называемых коэффициентов отражения, или коэффициентов частичной корреляции (раг((а! согге(а((ол сое(((с(еп(з, или РАР(СО(т сое(((с(еп(э) )со (=1,...М, число которых равно числу коэффициентов линейного предсказания а, и которые связаны с коэффициентами а, взаимно однозначными нелинейными функциональными соотношениями.
Коэффициенты отражения непосредственно связаны с другой формой фильтра линейного предсказания — так называемым решетчатым, или лестничным ()а(((се), фильтром (рис. 2,36). Коэффициенты отражения )т, более удобны, чем коэффициенты линейного предсказания ао для передачи по линии связи, так как в силу своих статистических характеристик в меньшей степени могут приводить к потере устойчивости фильтра при квантовании. Иначе говоря, они требуют меньшего числа разрядов при квантовании, т.е. приводят к более экономичному использованию линии связи, Иногда используются также функции от коэффициентов отражения — логарифмические отношения пло!цадей (~од-Агеа Вайо — сАЯ): г, =!од 1 — !т, 1+ )с, название которых связано с моделью голосового тракта в виде набора акустических труб различных сечений.
Вернемся к выражению для А(г), определяющему передаточную характеристику фильтра-анализатора. Передаточная характеристика фильтра-синтезатора Н(г) обратна ей с точностью до скалярного коэффициента усиления 0 . (т(г! = 6 / А(г) . Синтезирующий фильтр имеет ту же структуру, что и анализирующий (инверсный), и определяется тем же набором параметров (коэффициентов предсказания ао или коэффициентов отражения (со или логарифмических отношений площадей г,), но входы и выходы в анализирующем и синтезирующем фильтрах меняются местами. Если на вход синтезирующего фильтра подать сигнал возбуждения, то на его выходе будет получен речевой сигнал с тем качеством, которое обеспечивается фильтром при принятом порядке предсказания, используемом числе дискретов для кванто- Глава 2 92 Кодер речи Цифровой сигнал речи ( с выхода АЦП метры .
ьтра ! ! ! ) ! ! ! ! ! ! +"— в озбуждения (остаток предсказания Параметры фильтра 1 фильтр- н(т] 1 Сигнал Декодер речи ( возбуждения (остаток предсказания) Восстановленный цифровой сигнал речи Рис.2.37. Работа кодека речи выезде линейного предсказания вания параметров фильтра и прочих ограничениях и погрешностях того же характера. Таким образом, процедура кодирования речи в методе линейного предсказания сводится к следующему (рис.2.37); оцифрованный сигнал речи нарезается на сегменты длительностью 20 мс (!80 выборок по 8 бит в каждом сегменте); для каждого сегмента оцениваются параметры фильтра линейного предсказания и параметры сигнала возбуждения; в качестве сигнала возбуждения в простейшем (по идее) случае может выступать остаток предсказания, получаемый при пропускании сегмента речи через фильтр линейного предсказания с параметрами, полученными из оценки для данного сегмента; параметры фильтра и параметры сигнала возбуждения кодируются по определенному закону и передаются в канал связи.
93 Дриииииы построения и технические проблемы Процедура декодирования речи заключается в пропускании принятого сигнала возбуждения через синтезирующий фильтр известной структуры, параметры которого переданы одновременно с сигналом возбуждения. Подчеркнем, что как анализирующий, так и синтезирующий фильтры являются цифровыми и процедуры кодирования и декодирования речи реализуются в соответствующих вычислителях (процессорах).
Си~пал на вход анализирующего фильтра поступает непосредственно с выхода АЦП, а выходной сигнал синтезирующего фильтра попадает на вход ЦАП (рис. 2.6). Приведенное описание процессов кодирования и декодирования речи не является исчерпывающим, она объясняет лишь принцип действия кодека. Практические схемы заметно сложнее, и это связано в основном со следующими двумя моментами. Во-первых, описанная выше схема линейного предсказания — кратковременное предсказание ($Ьогт-Теггп Ргеглсбоп — ЯТР )— не обеспечивает достаточной степени устранения избыточности речи. Поэтому, в дополнение к кратковременному предсказанию, используется еще долговременное предсказание ((.опд-Тегт Ргегбсбоп — (.ТР ), в значительной мере устраняющее остаточную избыточность и приближающее остаток предсказания по своим статистическим характеристикам к белому шуму.
Во-вторых, использование остатка предсказания в качестве сигнала возбуждения оказывается недостаточно эффективным, так как требует для кодирования слишком большого числа бит. Поэтому практическое применение находят более экономичные (по загрузке канала связи, но отнюдь не по вычислительным затратам) методы формирования сигнала возбуждения.
В ранних кодеках линейного предсказания для формирования сигнала возбуждения передавались сигнал тон/шум (двоичный признак, указывающий, является ли передаваемый сегмент речи вокализованным, т.е. тональным, или невокализованным, т.е, шумовым), период основного тона и амплитуда сигнала, В начале 80-х годов была предложена модель многоимпульсного возбуждения, не использующая классификацию сегментов речи по признаку вокапизованный/не вокализованный. С этой моделью связано значительное улучшение качества кодексе линейного предсказания, и в настоящее время используются исключительно различные варианты многоимпульсного возбуждения. Остановимся на указанных двух моментах несколько подробнее.