Параметрическое компандирование речи
Параметрическое компандирование (сжатие ) речи.
Речевой сигнал можно описать рядом параметров, изменяющихся во времени значительно медленнее, чем сам сигнал (с периодом 50-100 мс). Передаются параметры синтезатора речи, с ошибкой формирования текущего отсчета или без нее, а также параметры сигнала, возбуждающего синтезатор. Для упрощения алгоритмов сжатия параметры синтезатора обновляются через 20 мс. В частности, применяются:
- Кодек с импульсным возбуждением и линейным предсказанием. Pulse excited linear predictive codec. PELP. В модификации кодера PRE (regular-pulse excited) фильтр активизируется регулярными импульсами. Кодер применяется в сотовой связи GSM.
- Кодек с линейным предсказанием, возбуждаемый кодом. Code exited linear predictive coding. CELP. После вычисления с периодом 20 мс коэффициентов фильтра -синтезатора, с учетом характеристик звука, оцениваемых с периодом 5 мс, подбираются по «кодовой книге» параметры сигнала активизации фильтра, минимизирующие ошибку предсказания. Параметры синтезатора, представленные кодовой комбинацией в 192 бита, передаются через 20 мс (со скоростью 9,6 кбит/c). Кодер применяется в сотовой системе с кодовым разделением каналов по стандарту IS-95.
- Вокодер с векторным квантованием и субполосным кодированием. Vector quantization, subband vocoder. VQ.
Информация в лекции "Эмоции" поможет Вам.
Принцип работы «канального» кодера речи - вокодера
ПФ – узкополосный фильтр, АМ – амплитудный модулятор
Вокодер передает значения медленно меняющихся амплитуд спектральных составляющих звукового сигнала, определенных в ряде субдиапазонов и преобразованных в цифровую форму малоразрядным АЦП (слух человека к фазам гармоник не восприимчив). В зависимости от требований к качеству звука число частотных субдиапазонов и ширина полосы могут меняться.
При частоте дискретизации 50 Гц, 16 субдиапазонах по 200 Гц (полоса 3200 Гц) и разрядности АЦП в 3 бита скорость передачи 50*16*3 = 2,4 кбит/c.
Минимальная скорость передачи, при которой речь правильно воспринимается, составляет 1 кбит/c.