Оппенгейм - Применение цифровой обработки сигналов (1044221), страница 39
Текст из файла (страница 39)
= 1, 2. ° ° ., р, 1г=! (3.43) л Ет =Я (0) — о'(0) — '~~~~ а Я(й) й — 1 (3.44) Обшепринято и вполне логично определять масштабный мно житель 6 в формуле (3.34) так, чтобы полные энергии сигналов, пРошедших через фильтр с характерисикой о(п), и фильтр с импульсной характеристикой, имеющей только полюсы, были равны. Пусть Й(п) — импульсная характеристика фильтра, соответствующего формуле (3.34), а Я1,(й) — ее корреляционная функция, причем коэффициенты а~ в формуле (3.34) найдены решением систе- чаще.
Одним из главных его преимуществ является то, что матрица коэффициентов ~ри, является теплицевой, т. е. все элементы матрицы, расположенные на одной диагонали, равны между собой ~65]. Таким образом, при вычислении элементов матрицы достаточно найти одну ее строку. Кроме того, как будет показано ниже, существуют эффективные методы для решения получающейся системы уравнений (т.
е. для обращения матрицы Теплица). Дополнительно отметим, что матрицы Теплица никогда не являются сингулярными и при отсутствии ошибок вычисления искомое рец1ение для фильтра только с полюсами оказывается устойчивым. Автоковариационный метод таких гарантий не дает. Главное достоинство автоковариационного метода состоит в том, что он в некотором смысле более точен. В частности, если последовательность можно точно промоделировать импульсной характеристикой фильтра, имеющего только полюсы, и имеется лишь конечный отрезок последовательности, то при использовании автоковариационного метода выходной сигнал фильтра только с полюсами полностью совпадет с исходной последовательностью, а при использовании автокорреляционного метода этого не произойдет. Однако такое различие при анализе речи методом линейного предсказания, по-видимому, можно отнести на второй план, потому что практически никогда сигнал точно не совпадает с колебанием на выходе фильтра только с полюсами.
С другой стороны, очевидны практические достоинства метода, при использовании которого В о. не появляются сингулярные системы и неустойчивые реш ния. е оставшейся части раздела будет применяться только автокорреляционный метод. Обозначим коэффициенты автокорреляции последовательности о (и) через й (й) и выразим соотношения (3.40) и (3.41) через Я(lг): 175 Цифровая обработка речевых сигналов 174 Глава 8 Ь (и) = ~ а,1< (и — й) + 6 ~ (и).
А 1 (3.45) ;Р адан(1 — ~) =~а Р). й 1 (3.46) Поскольку 6 выбрано так, что ~' ~- '(и) =- ~~~~~ Й'(т1) п=О и О (3.51а) Е; а~'1 = — Й,, Е,.=(1 — И)Е,. „ (3.51б) (3. 51в) (3.51г) (3.48) 62=Я(0) — ~ а Я(я). (3.49) (3.50) мы уравнений (3.43). Тогда й(п) удовлетворяет разностному урав- нению Умножив обе части уравнения (3.45) на й(и — т). 1)0, и просуммпровав по а, получим [т. е.
так, что й~(0) =й(0)], то из сравнения формул (3.46) и (3.43) следует, что Л Р) =Л„Р), ~=0, 1,..., р. (3.47) Таким образом, при моделировании методом линейного предсказания с моделью в виде фильтра только с полюсами первые р+1 коэффициентов автокорреляции импульсной характеристики фильтра приравниваются к соответствующим коэффициентам автокорреляции исходных данных. Умножив обе части уравнения (3.45) на й(п), просуммировав по и и учитывая, что й(0) =6, получим Р Я„(0) = ~ аф„(Й) +6-'. Наконец, преобразуя (3.48) с применением равенства (3.47), будем иметь Итак, если прогнозирующие коэффициенты а~ найдены, то масштабный множитель 6 очевидным образом определяется по формуле (3.49) . Сравнивая, наконец, соотношения (3.44) и (3.49), можно заметить, что полная средняя квадратическая ошибка Ет и масштабный коэффициент 6 связаны соотношением Ет =6' — и2 (О).
Важным достоинством метода линейного предсказания является наличие эффективных приемов решения системы уравнений (3.43). 3 автоковариационном методе матрица коэффициентов не явля,ется теплицевой, однако ее можно обратить с помощью одного из нескольких сравнительно эффективных методов [81, 82]. При автокорреляционном методе можно воспользоваться очень эффективными итеративными алгоритмами, первоначально предложенными Левинсоном [64] и усовершенствованными Дэрбином [66, 57]. По методу Дэрбина, коэффициенты, получаемые при решении разностного уравнения 1-го порядка вида (3.43), рекуррентно выражаются через решения разностного уравнения вида (3.43) порядка 1 — 1. Эти соотношения имеют вид 1 — 1 ~ а.' Д(к — )) — Д(с) где .а®, 1=1, 2, ..., 1, являются коэффициентами предсказывающего устройства 1-го порядка.
Коэффициент Е; связан соотношением Етп) =,Е; — о'(О) с полной средней квадратической ошибкой ,Е<'>, получающейся в предсказывающем устройстве 1'-го порядка. Система уравнений решается последовательно для 1=1, 2, ..., р, исходя первоначально из соотношения ЕО=К(0). Окончательное решение получается при условии а; = а~1'>, 1= 1, 2,..., р. (3.52) Поскольку при каждой итерации вычисляется Е;, имеется возможность исследовать поведение ошибки с увеличением порядка предсказывающего устройства. Вспомогательные параметры й1, называемые козффиииентами отражения, фактически являются коэффициентами отражения на границах соседних отрезков акустической трубки, когда отрезки имеют одинаковую длину и различные сечения. Линейное предсказание при анализе речевых сигналов обычно используется в двух основных направлениях. Одно из них — проведение кратковременного спектрального анализа речи в спектрографах и спектроанализаторах.
Второе направление — построение систем анализа — синтеза. Спектральный анализ речевых сигналов при использовании параметров, вычисляемых в процессе линейного предсказания, выполняется довольно эффективно. Если параметры найдены, то значения спектра Н(е~") на дискретном множестве частот можно вычислить с помощью соотношения 113.33). Дополнительно можно заметить, что для ~равноотстоящих 177 Глава 8 Цифровая обработка рс1ввы.'с сигналов 176 1 при и=О, — а„при п=1, 2,..., р, О в остальных случаях. Ь '(и) = 0 Р1Г2 Р3 Р4 Р5 5 нlй Г1 =0,720тг/г~' Г2 =1,250ж~ ~' Р 3 = 2,700 л./7~' Р 4 = 3,400 о /й' Г5 = 4,300 т/гг 12 — 359 точек единичной окружности отсчеты полинома, стоящего в зна- менателе дроби (3.33), можно получить, если применить алгоритм БПФ к конечной последовательности Ь '(и), имеющей вид Эта последовательность фактически является импульсной характеристикой фильтра, обратного к фильтру только с полюсами, т.
е. Ь (и) . Ь ' (и) = б о (и), где б(п) — единичный импульс. Если требуется получить /у' отсчетов Н(г) в равноотстоящих точках единичной окружности, то последовательность Й 1(и), содержащую р+1 отсчетов, следует дополнить И вЂ” р — 1 отсчетами, равными нулю. В силу тесной связи со спектральным анализом [74, 83] линейное предсказание позволяет получать хорошие аппроксимации огибающих спектров. На рис.
3.23 изображены спектр импульсной характеристики фильтра только с полюсами, полученный методом линейного предсказания, и преобразование Фурье соответствующего взвешенного речевого сигнала. На рис. 3.24 сравниваются результаты спектрального анализа речевого сигнала, полученные с помощью кратковременного преобразования Фурье, гомоморфного анализа и линейного предсказания. Исследовался отрезок синтезированного гласного звука с известными частотами формант.
Первые два спектра соответствуют преобразованию Фурье от речевого сигнала, взвешенного по Хеммингу при длине «окна» 51,2 и 12,8 мс соответственно. Как было показано в разд. 3.4, такая операция по существу является анализом сигнала с помощью гребенки фильтров. На рис, 3.24, а приведены результаты анализа сигнала с высоким разрешением по частоте, что подтверждается наличием отчетливо видной тонкой структуры спектра, связанной с возбуждающим сигналом. На рис. 3.24, б эффективная ширина полосы фильтров больше, о чем свидетельствует форма спектра, в котором отсутствует хорошо разрешенная тонкая структура сигнала.
Максимумы огибающей спектра сигнала, соответствующие формантам, в общем заметны. но несколько расширены за счет взвешивания сигнала. На рис. 3.24, в представлена огибающая спектра, полученная гомоморфной фильтрацией речевого сигнала. Хорошо видны формакты и отсутствие тонкой структуры спектра. Наконец, на рис. 3.24,г приведен спектр, полученный при анализе сигнала методом линейного предсказания с 12 коэффициентами. Этот спектр имеет наиболее ровный характер с отчетливо выделяющимися формантами. Плавный характер спектра при линейном предсказании объясняется тем, что при моделировании спектра применялся / ~ .7 г .т б' 7 Ю У /~7 Час/ттптта, к/гг Рис 323.
СпектРальный анализ Речевого сигнала методом линейного пРедсказания с 28 полюсами. Спектр, полученный при линейном предсказании, изображен на фоне преобразования Фурье от взвешенного речевого сигнала (по Макхоулу). Рис. 3.24. Спектральный анализ синтезированной гласной. 4 — преобразование фурье отрезка сигнала длительностью 51,2 мс, взвешенного по Хеммингу; б — преобразование фурье отрезка сигнала длительностью 12,8 мс, взвешенного по Хеммиигу; в — огибающая спектра, полученная гомоиорфной фильтрацией отрезка длительностью 30 мс; г — огибающая спектра, полученная при анализе методом линейного предсказания Сс 12 параметрами). 178 Глава 3 Цифровая обработка речевых сигналов 179 полипом 12-го порядка, в силу чего в спектре не может быть более шести максимумов.