47370 (665778), страница 9

Файл №665778 47370 (Кодеры речи) 9 страница47370 (665778) страница 92016-07-31СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 9)

Главное отличие речевых традиционных вокодеров от модели МВЕ состоит в сигнале возбуждения. В обычных речевых моделях для каждого речевого сегмента используется единственное решение вокал/невокал. В отличие от этого речевая модель МВЕ разделяет сигнал возбуждения на несколько неперекрывающихся частотных полос и принимает решение вокал/невокал для каждой частотной полосы. Это позволяет представить сигнал возбуждения для определенного речевого сегмента в виде смеси периодической (вокализованной) энергии и шумоподобной (невокализованной) энергии. Из-за этих множественных определений вокал/невокал эта модель называется моделью с многополосным возбуждением. Такая речевая модель позволяет синтезировать речь с более качеством, чем традиционные модели. Кроме того, речевая модель МВЕ более устойчива к фоновому шуму.

В речевой модели MBE сигнал возбуждения формируется из сигнала основного тона (или основной частоты) и решений вокал/невокал. Для вокализованной речи сигнал возбуждения является периодической импульсной последовательностью, в которой расстояние между импульсами определяется периодом основного тона . Для невокализованной речи сигнал возбуждения представляет собой белый шум. Периодический спектр создается из взвешенной периодической последовательности импульсов, которая полностью определяется окном взвешивания и периодом основного тона. Его спектр формируется из взвешенной последовательности случайного шума.

Обычно алгоритмы для оценки параметров возбуждения и алгоритмы для оценки параметров огибающей спектра работают независимо. Эти параметры оцениваются на основе нескольких критериев без ясных оснований, насколько синтезированная речь должна быть близка к исходной. Это может проявиться в том, что синтезированный спектр будет слегка отличаться от исходного.

В речевом IMBE-кодере параметры возбуждения и огибающей спектра оцениваются одновременно так, что синтезированный спектр является самым близким к исходному речевому спектру.

Блок-схема алгоритма анализа показана на рис. 5.7.

Рисунок 5.7

Параметры МВЕ модели речи, которые должны быть оценены для каждого речевого фрейма следующие:

период основного тона (или основная частота);

решение вокал/невокал;

спектральные амплитуды, харак­теризующие огибающую спектра.

В декодере вокализированная и невокализированная компоненты син­тезируются отдельно и на заключи­тельной стадии объединяются для по­лучения полного речевого сигнала. Алгоритмы, которые используются для синтеза вокализированных и невокализированных частей речи, осно­ваны на двух различных способах.

Невокализованная часть речи ге­нерируется из гармоник, которые объ­явлены невокализованными. Для ка­ждого фрейма речи блок случайно­го шума взвешивается и преобразует­ся с помощью быстрого преобразова­ния Фурье. Области спектра, которые соответствуют вокализованным гармо­никам, принимаются равными нулю.

Так как вокализованная речь мо­делируется ее индивидуальными гар­мониками в частотной области, на сто­роне декодера она восстанавливается как совокупный сигнал регулируемых генераторов. Каждой гармонике вокализованной области фрейма поставлен в соответствие генератор, который характеризуется частотой и фазой. Однако из-за того, что вокализованная часть речи не является периодической на интервалах, состоящих нескольких фреймов анализа, отклонения от ожидаемых параметров соседних фреймов могут вызвать скачки по концам фреймов, что приведет к значительному ухудшению качества речи. Для разрешения этой проблемы во время синтеза проверяются параметры текущего и предыдущего фреймов для уверенности, что на границе фреймов происходит плавный переход. Это делается для того, чтобы на границах фреймов вокализированная речь была непрерывной. Для обеспечения непрерывности в начале и конце фрейма речи функция амплитуды линейно интерполируется между значениями оценок для текущего и предыдущего фреймов.

Синтез речи в IMBE-декодере требует информации об основной частоте, решении вокал/невокал, величине спектральных составляющих и фазе вокализованных гармоник. Так как фазы вокализованных гармоник можно предсказать, информация о фазе не передается между кодером и декодером. Основная частота (основой тон) квантуется с половинной точностью выборки во временной области, причем возможный диапазон тона перекрывается восемью битами. Peшение вокал/невокал является двоичным числом и не требует квантования. Об­щее распределение бит для каждого фрейма приведено в табл. 5.4.

Таблица 5.4.

Распределение бит IMBE-кодера в системе АРСО 25

Параметр

Число бит

Основная частота

8

Информация вокал/невокал

b

Спектральные амплитуды

79 – b

Синхронизация

1

Число полос, на которые разбива­ется речевой фрейм в частотной обла­сти, зависит от основного тона фрейма, но не превышает 12.

Таким образом, в кодере IMBE фрейм речи имеет длительность 20 мс, содержит 144 бита, из которых 56 ис­пользуются для канального кодирова­ния, 88 – для кодирования параме­тров речевой модели. Кодер работает на скорости 4,4 кбит/с. Скорость пере­дачи в канале – 7,2 кбит/с.

    1. Кодирование речи в системе INMARSAT-M

Для системы мобильной спутни­ковой связи INMARSAT была выбра­на улучшенная версия речевого коде­ра МВЕ, описанного в предыдущем параграфе как вер­сия стандарта на скорости 6,4 кбит/с для наземных систем подвижной свя­зи. Размер фрейма кодера 20 мс. При этом обеспечивается кодирование ис­точника и канала с помощью 128 бит на каждый фрейм. Из этих 128 бит 45 (2,25 кбит/с) зарезервированы для коррекции ошибок, а оставшиеся 83 би­та (4,15 кбит/с) разделены между раз­личными параметрами речи, как пока­зано в табл. 5.5.

Таблица 5.5

Распределение бит в системе INMARSAT-M

Параметр

Число бит

Основная частота

8

Информация вокал/невокал

b

Спектральные амплитуды

75 – b

Синтез речи в МВЕ декодере тре­бует информации об основной частоте, решении вокал/невокал, спектраль­ных величинах и фазах вокализиро­ванных гармоник. Так как фазы вока­лизированных гармоник можно пред­сказать, информация о фазе не пере­дается от кодера к декодеру. Основная частота (основной тон) обычно кван­туется с половинной точностью вы­борки во временной области, причем возможный диапазон тона перекры­вается восемью битами. Решение во­кал/невокал является двоичным чи­слом и не требует квантования. Набор спектральных величин требует большей точности и эффективности кван­тования. Общее распределение бит для каждого фрейма следующее:

1) восемь бит для точного кванто­вания тона;

2) b бит для решения вокал/не­вокал, где b – число полос принятия решения вокал/невокал;

3) оставшиеся биты для квантова­ния гармоник.

Так как число гармоник зависит от основного тона, который изменя­ется, число бит, присваиваемых для решения вокал/невокал, может так­же изменяться. Типичное число вокализированных/невокализированных полос равно 12 (4), что означает, что максимальное число бит для описания вокал/невокал равно 12. Общее чи­сло бит для квантования гармоник определяется формулой

где максимум b равен 12; – общее число бит для фрейма.

Рассмотрим способ квантования, ис­пользуемый в системе INMARSAT-M.

Квантование основной часто­ты. Основная частота квантуется при преобразовании ее в эквивалентный период основного тона . Значения периода основного тона обычно ограни­чены диапазоном . В си­стеме МВЕ, предназначенной для ра­боты на скорости 6,4 кбит/с, этот пара­метр равномерно квантуется с исполь­зованием 8 бит при размере шага 0,5, что дает возможность обеспечить поло­винную точность выборки.

Кодирование решений во­кал/невокал. b решений вокал/не­вокал являются двоичными числами, поэтому могут быть закодированы с использованием одного бита для ка­ждой полосы решения. Система на скорости передачи 2,4 кбит/с исполь­зует максимум 12 полос, каждая с ши­риной Гармоники вне b полос во­кал/невокал приняты невокализированными.

Квантование спектральных величин. Перед квантованием спек­тральных величин для уменьшения их изменения используется этап предска­зания.

Остатки предсказания группиру­ются в шесть последовательных бло­ков, содержащих остаточных выборок каждый. Каждый блок преобразуется по частоте с использованием дискретного косинусоидального преобразования (ДКП) размером .

Постоянные составляющие L шести ДКП-блоков (первые коэффициенты) группируются как вектор и квантуются с использованием кодовой книги шестибитового скалярного усиления и десятибитового вектора формы. Коэффициенты более высокого порядка М квантуются с использованием скалярных квантователей, где в процессе присвоения бит распределяются оставшиеся биты в соответствии с важностью для субъективного восприятия каждой величины. Блок-схема общей процесса квантования величин показана на рис. 5.8.

Рисунок 5.8

После правильного восстановления спектральных величин МВЕ-кодер пытается улучшить качество восприятия синтезированной речи с использованием усилителя. Усиление спектральных величин выполняется генерированием набора спектральных ве­сов из принятых параметров текущего фрейма.

В типичном МВЕ-кодере большая часть бит выделена для квантования спектральных величин. В случае си­стемы INMARSAT-M, где кодер источ­ника работает на скорости 4,15 кбит/с при скорости фреймов 50 Гц, только 20 (8+ 12) бит используются для форми­рования информации об основном пе­риоде и информации «вокал/невокал». Остальные биты используются для квантования спектральных величин. Таким образом, для успешного синте­за речи необходимо точно знать основ­ной период. Для покрытия речевого спектра 4 кГц достаточно 12 полос во­кал/невокал. В результате общая ско­рость кодера может быть уменьшена за счет более эффективного квантова­ния величин. В системе INMARSAT-M все спектральные величины, кроме ше­сти, проквантованы с использованием скалярных квантователей. Сокраще­ние скорости можно добиться также за счет векторного квантования всех величин. Однако, так как число спек­тральных величин может изменяться от 9 до более чем 60 в зависимости от основной частоты, векторную кодо­вую книгу, учитывающую эти измене­ниями, создать очень сложно. Поэто­му целесообразно векторное квантова­ние использовать только для основной формы спектра, которая может быть принята независимой от основной ча­стоты.

  1. Перспективы кодирования речи.

В данной главе будут коротко рассмотрены перспективы использования различных речевых кодеков в сетях связи общего пользования.

Рассмотрим некоторые параметры наиболее распространенных кодеков сетей общего пользования.

Однако, кроме кодеков ИКМ по G.711, на ССОП в настоящее время при­меняются аналого-цифровые преобра­зователи других типов, использующие те или иные способы компрессии речи и поэтому имеющие меньшую скорость передачи цифрового сигнала по срав­нению со стандартным кодеком ИКМ. Основные области применения низкоскоростных кодеков: • системы подвижной связи (в част­ности, цифровые сотовые и транкинговые системы); • аппаратура DCME (в небольшом количестве используется на сети ОАО «Ростелеком»); • абонентские компьютерные и мультимедийные терминалы, аппара­ты IP-телефонии;

• цифровые беспроводные телефоны.

Характеристики

Тип файла
Документ
Размер
9,1 Mb
Материал
Тип материала
Учебное заведение
Неизвестно

Список файлов реферата

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6629
Авторов
на СтудИзбе
294
Средний доход
с одного платного файла
Обучение Подробнее