Методы сжатия звука и речи
Методы «сжатия» звука и речи
При импульсно-кодовой модуляции (ИКМ) цифровое значение отсчета передается в виде двоичного числа без каких-либо преобразований.
Дельта – модуляция (ДМ) является одноразрядным вариантом ИКМ. С постоянной частотой, существенно превосходящей частоту Найквиста, выдается только один бит, означающий увеличение или уменьшение числа на один шаг в зависимости от разности текущего значения передаваемой величины и ее предыдущего отсчета. В телефонном канале используется частота 32 кГц вместо 64 кГц (8 кГц частота опросов, 8 бит на опрос). Существуют методы адаптивного изменения шага.
При дифференциальной импульсно-кодовой модуляции (ДИКМ), в простейшем ее варианте, вместо текущего отсчета передается разность между фактическим и предсказанным значением звукового сигнала, вычисляемая «N-отводным предсказателем» (кодером с памятью) как линейная комбинация N предыдущих значений сигнала:
Рекомендация для Вас - 10 Клиническая картина и характеристика ЭЭГ в процессе заболевания.
Ошибка предсказания минимальна, если коэффициенты ai определяются в результате анализа характеристик звука с использованием его автокорреляционной функции. Предсказатель есть в передатчике и в приемнике, их алгоритмы работы одинаковы. Скорость передачи речи 32 кбит/c.
В адаптивном кодере с дифференциальной импульсно-кодовой модуляцией, кроме ошибки предсказания, передается «побочная» информация (side information): вычисляемые периодически значения параметров аi N – отводного предсказателя.
N = 10-12. Скорость передачи речи 16 кбит/c.
При достаточно частом определении оптимальных параметров аi ошибка предсказания практически отсутствует. Передачу речи можно заменить передачей параметров синтезатора речи и сигналов его активизации, которые изменяются медленнее, чем сам сигнал. Соответствующие методы называют параметрическим компандированием речи.