47370 (665778), страница 4

Файл №665778 47370 (Кодеры речи) 4 страница47370 (665778) страница 42016-07-31СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 4)

Во всех случаях параметры синтезатора непрерывно обновляются при смене анализируемых кадров речи. Чтобы избежать эффектов, связанных со скачками значений параметров, необходимо плавно изменять параметры с помощью интерполяции при переходе от одного участка речи к другому. При прямой форме синтеза может возникать ситуация, соответствующая неустойчивому фильтру, хотя исходные значения относились к устойчивому фильтру. В каскадной структуре устойчивость обеспечивается проще.Определение параметров возбу­ждающего сигнала в системе анализа-синтеза с линейным предсказанием, как правило, основывается на иссле­довании сигнала ошибки, получаемого пропусканием исходного речевого сиг­нала через фильтр с характеристикой, обратной той характеристике, которая аппроксимирует передаточную функ­цию голосового тракта. Полученный сигнал ошибки является аппроксима­цией сигнала, возбуждающего речевое колебание. Для определения параме­тров возбуждающего сигнала можно применить один из известных алгорит­мов различения звонкой и глухой ре­чи, а также оценки периода основного тона, например на основе рассмотрен­ного выше корреляционного анализа сигналов во временной области.

    1. Кодирование речи методами анализа через синтез (AbS)

При классификации методов ко­дирования речи на скоростях 4,8... ...16 кбит/с выделяют две основные группы — методы анализа и синтеза (AaS — Analysis-and-Synthesis) и ме­тоды анализа через синтез (AbS – Analysis-by-Synthesis). Хотя такие схе­мы AaS, как RELP, АРС, АТС и SBC успешно работают на скоростях 9,6... 16 кбит/с, при скоростях ниже 9,6 кбит/с они не могут обеспечивать хорошее качество речи. Это объясняется двумя причинами: 1) кодируе­мая речь не анализируется на предмет эффективности, т.е. не производится коррекция искажений в восстановлен­ной речи; 2) ошибки, накопленные в предыдущих фреймах, не учитывают­ся в момент анализа текущего фрейма и беспрепятственно переходят в следу­ющие фреймы. В схемах AbS, особенно в AbS-LPC, эти факторы, как правило, учтены. В этих схемах используется процедура оптимизации типа «замкну­тая петля» для нахождения возбужда­ющего сигнала, который при возбужде­нии моделирующего фильтра создает оптимальный речевой сигнал. Это по­зволяет схемам AbS более успешно ра­ботать на скоростях 4,8.. .9,6 кбит/с.

Методы AbS подходят не только для кодирования речи, но могут так­же использоваться для оценки и идентификации. Основная идея AbS такова. Во-первых, допускается, что сигнал можно исследовать и представить в какой-либо форме, например в виде временных или частотных доменов. Затем созданная модель сигнала подвергается оптимизации (подгонке), как показано на рис. 2.6.

Модель имеет несколько параметров, изменение которых приводит к изменению формы моделируемого сигнала. Для нахождения модели сигнала, которая имеет ту же форму, что и модель истинного сигнала, используют процедуры минимизации ошибки. Путем изменении параметров модели находят такой их набор, при котором синтезированный сигнал с минимальной погрешностью совпадает с реальным. Следовательно, когда достигнуто такое совпадение, параметры модели принимаются за параметры истинного сигнала.

Базовая структура системы кодирования AbS-LPC представлена на рис. 2.7. В этой модели есть три компонента, которые можно изменять, добиваясь максимального подобия синтезированного сигнала с исходным:

1) нестационарный фильтр;

2) возбуждающий сигнал;

3) процедура минимизации, основанная на восприятии.

Так как эта модель требует ча­стого обновления параметров для по­лучения хорошего совпадения с исход­ным сигналом, процедура анализа вы­полняется поблочно, т.е. входной рече­вой сигнал разбивается на блоки вы­борок. Длина анализируемых блоков (фреймов) и периодичность их обно­вления определяют скорость передачи (емкость) схемы кодирования. Алго­ритм работы AbS-LPC следующий:

1. Инициализировать LPC и то­нальный фильтры (нестационарные фильтры), т.е. установить уровень ну­ля или минимального случайного шу­ма;

2. Фрейм выборок речи заносится в буфер и на основании LPC-анализа вычисляется набор LPC-коэффициентов;

3. Используя вычисленные LPC-коэффициенты, формируется инверс­ный LPC-фильтр для вычисления пер­вого восстановленного после квантова­ния остатка. Если для поиска подхо­дящего тона используется «замкнутая петля», надобность в этом шаге отпа­дает.

4. Так как LPC фрейм обычно слишком велик для эффективного ана­лиза, при определении возбуждения фрейм разделяется на целое число подфреймов;

5. Для каждого подфрейма:

а) рассчитываются параметры тонального фильтра (долгосрочного предсказателя), такие, как задержка и связанный с ней коэффициент мас­штабирования;

б) тональный фильтра вместе с LPC-фильтром образуют каскадный фильтр, с помощью которого опре­деляется наилучшее вторичное возбу­ждение, т.е. такое, которое минимизи­рует разницу между синтезированной и исходной речью.

6. Окончательно синтезирован­ная речь получается при пропускании оптимального вторичного возбуждения через каскадный фильтр, параметры которого остались от синтеза предыду­щего подфрейма.

7. Повторение шагов 2-6 для сле­дующего фрейма последовательности.

Таким образом, и на стороне коде­ра, и на стороне декодера синтезирует­ся речь, что необходимо для обновле­ния содержимого памяти нестационар­ных фильтров. В результате и кодер, и декодер имеют идентичное содержа­ние памяти. В противном случае для общей синхронности содержимое памя­ти пришлось бы передавать на деко­дер. Действительно, главный вопрос в схемах AbS-LPC — как сохранить это одинаковое состояние в кодере и деко­дере, когда средства передачи несовер­шенны, например, в системах подвиж­ной радиосвязи, где очень высока доля ошибок.

Может показаться, что схема AbS-LPC не является полноценной схемой «анализа через синтез». Это связа­но с тем, что в действительности про­цедуры последовательны, т.е. сначала вычисляются параметры фильтра, ко­торые фиксируются, и только затем следует вычисление методом «анали­за через синтез» вторичного возбужде­ния. Хотя вторичное возбуждение вы­полняется по исходному сигналу, оно ограничено оптимальностью использу­емых фильтров. Поэтому, в идеале, требуется наилучшая комбинация как возбуждения, так и фильтров, которая означает одновременную оптимизацию всех параметров. Эта процедура очень сложна, насыщена вычислениями, по­этому ее обычно разбивают на после­довательные этапы.

Главное отличие классических во­кодеров от кодеров AbS-LPC состоит в том, что в классических вокодерах воз­буждение разделяется на вокализован­ные (импульсное возбуждение) и не­вокализованные (возбуждение случай­ным шумом), что является первопри­чиной точности модели. В AbS-LPC такое деление не явно, и поэтому воз­буждающий сигнал может носить лю­бой характер — от псевдоимпульсного до шумоподобного, что позволяет син­тезировать речь более высокого каче­ства.

    1. Векторное квантование и кодовые книги

Когда набор значений амплитуд, дискретизированных по времени, кван­туется совместно как единичный век­тор, такой процесс называется век­торным квантованием (VQ – vector quantisation), известный также как блочное квантование.

Будем считать, что N-мерный вектор с дей­ствительными значениями («т» озна­чает транспонирование); – случайным образом меняющий­ся компонент с непрерывной амплиту­дой. При векторном квантовании век­тору ставится в соответствие другой N-размерный вектор , имеющий дей­ствительные значения и дискретную амплитуду. Таким образом, кванту­ется как . Другими словами, ис­пользуется для представления .

Обычно выбирается из конечного набора значений , где – размер кодовой книги, а – набор векторов кодовой книги. Набор Y называется кодовой книгой или шаблоном.

Размер кодовой книги можно счи­тать равным числу уровней скалярных квантователей. Для создания подоб­ной кодовой книги N-размерное про­странство разделяется на L областей или ячеек , и вектор однозначно связывается с ячейкой . Квантователь обозначается вектором кодовой книги , если находит­ся в :

, если .

Процесс создания кодовой книги известен также как «обучение» или «настройка» кодовой книги. В каче­стве примера на рис. 2.9 иллюстриру­ется разделение двумерного простран­ства (N = 2) для целей векторно­го квантования. Область, обведенная жирной линией, — ячейка . При векторном квантовании любой входной вектор , лежащий в ячейке , кван­туется как . Другие векторы кодовой книги, соответствующие другим ячей­кам, показаны точками.

Если размер вектора , век­торное квантование трансформируется в скалярное квантование. Скалярное квантование имеет особое свойство, за­ключающееся в том, что хотя ячейки могут иметь разные размеры (размеры ступеней), все они имеют одинаковую форму. Однако при векторном кванто­вании ячейки в двух измерениях могут иметь разные формы, что дает векторному квантованию преимущество над скалярным квантованием.Equation Chapter (Next) Section 3

Гибридные кодеры

Чтобы избавиться от недостатков кодеров формы и вокодеров, был раз­работан гибридный метод кодирова­ния, объединяющий преимущества обоих методов. По виду анализа гибрид­ные кодеры подразделяются на два класса: с частотным разделением и временным разделением.

    1. Гибридные кодеры с частотным разбиением

Главная концепция кодирования с частотным разбиением состоит в раз­делении речевого спектра на частот­ные полосы или компоненты. Со­ответственно могут использоваться либо набор фильтров, либо блок-преобразователь. После кодирования и декодирования эти составляющие ис­пользуются для точного воспроизве­дения модели входного сигнала путем суммирования сигналов, полученных на выходе фильтров, или инверсных значений, полученных после преобра­зования. Главное допущение при ко­дировании с частотным разбиением со­стоит в том, что сигнал, подвергаемый кодированию, очень медленно изменя­ется во времени и может быть описан мгновенным спектром. Это связано с тем, что в большинстве систем, а осо­бенно в системах реального времени, в текущий момент доступен только крат­ковременный сегмент входного сигна­ла.

В случае использования набора фильтров частота ω фиксирована, так что , а сигнал частотного доме­на представляет собой сигнал на выходе постоянного во времени ли­нейного фильтра с импульсной харак­теристикой , возбуждаемого моду­лированным сигналом :

31\* MERGEFORMAT (.)

где определяет ширину полосы ре­чевого сигнала вокруг централь­ной частоты и является импульс­ной характеристикой анализирующе­го фильтра; знак означает свертку функций.

Характеристики

Тип файла
Документ
Размер
9,1 Mb
Материал
Тип материала
Учебное заведение
Неизвестно

Список файлов реферата

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6629
Авторов
на СтудИзбе
294
Средний доход
с одного платного файла
Обучение Подробнее