Лекции - Технологии Мультимедиа, страница 13
Описание файла
PDF-файл из архива "Лекции - Технологии Мультимедиа", который расположен в категории "". Всё это находится в предмете "технологии мультимедиа" из 6 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "технологии мультимедиа" в общих файлах.
Просмотр PDF-файла онлайн
Текст 13 страницы из PDF
Однако, пропорционально увеличению частоты возрастают:а) интенсивность потока цифровых данных, а пропускные возможности интерфейсовне безграничны, особенно если записывается/воспроизводится одновременно несколько каналов;б) вычислительная нагрузка на цифровые процессоры эффектов, а их вычислительныевозможности также ограничены;в) объем памяти, необходимой для хранения цифрового сигнала.Очевидно, что необходим компромисс. От выбора частоты дискретизации зависит частотный диапазон полученного цифрового звука или максимальная частота аналогового сиг-69нала, правильно представленная в цифровом.
Считается, что диапазон частот, которые слышит человек, составляет от 20 до 20000 Гц. Согласно известной теореме Котельникова, длятого, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановитьпо его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 Гц до 20кГц, то частота дискретизации такого сигнала должна быть не меньше, чем 40 кГц. Сегоднясамыми распространенными частотами дискретизации являются 44,1 кГц и 48 кГц. Впрочем, в последнее время идет немало разговоров о том, что обертоны, расположенные свыше20 кГц, вносят немалый вклад в звучание и в результате появляются преобразователи, использующие частоты дискретизации 96 кГц и 192 кГц.Второй этап - это квантование амплитуды дискретных отсчетов, полученных на первом этапе.Процесс квантования амплитуд отсчетов фактически заключается в измерении их величин по отношению к некоторому опорному источнику напряжения, обычно имеющемусявнутри корпуса микросхемы АЦП, и выражении этих величин в виде чисел, состоящих изконечного числа бит.
Причем числа могут быть не только целые, например 16-, 18-, 20-, 24битные, но и 24- или 32-битные с плавающей запятой или с другой кодировкой (например, вкодах с исправлением ошибок), зависящей от конкретной реализации устройства АЦП. Довольно часто используется все же кодирование результатов измерения амплитуд отсчетов ввиде целых чисел.Методы шумоочисткиВсе без исключения методы очистки речи от шумов в той или иной степени разработаны с учетом либо особенностей образования речевого сигнала, либо параметров удаляемыхпомех, либо и того и другого вместе. Немаловажную роль при оценке эффективности методов играет критерий качества очистки, роль которого, в общем случае, играет разборчивость(то есть понимание слушателем того, что произносится).
Однако часто для оценки качестваочистки используются и формальные параметры, например, соотношение сигнал/помеха,комфортность прослушивания и т.д.Для описания речевого сигнала, как правило, используется следующая модель. Речьобразуется путем возбуждения акустического резонатора (речевого тракта) импульсами воздуха, проходящими через голосовые связки для звонких и турбулентными потоками воздухадля глухих звуков. С математической точки зрения такая модель может быть описана в виделинейной системы, возбуждаемой периодической функцией для звонких звуков или широко-70полосным шумом для глухих.
С учетом физиологических особенностей образования речиматематически речевой сигнал можно представить в виде отклика линейной системы с медленно меняющимися параметрами. На коротком интервале времени ее передаточная функция характеризуется набором резонансных частот, называемых формантами. Для звонкихзвуков на таком интервале времени речевой сигнал имеет гармоническую структуру, (периодсигнала в этом случае называется периодом основного тона), для глухих - шумоподобную.Подобная модель, хоть и достаточно упрощенно описывает реальные процедуры речеобразования, с успехом применяется в различных системах коррекции.Более сложен вопрос описания модели шумов. При учете всех возможных типов реальных шумов математический аппарат описания процедур коррекции оказывается достаточно громоздким. По этой причине большинство методов шумоочистки разрабатываются впредположении, что шумы носят только аддитивный характер и никак не связаны с исходным речевым сигналом, то есть между шумами и речью отсутствует корреляция.
Другимисловами, подлежащий коррекции сигнал представляется в виде суммы двух компонентов:речевого сигнала и шума.Очень важную роль играют особенности восприятия речи человеком. Например, известно, что согласные звуки хотя и маломощны, но весьма существенны для понимания речи. Неравноценный вклад в обеспечение разборчивости речи вносят и форманты. Перваяформанта, обычно лежащая в диапазоне от 250 до 800 Гц, менее существенна для восприятия, чем вторая и последующие. Хорошее воспроизведение кратковременного амплитудногоспектра речевого сигнала является важным фактором, тогда как фазовый спектр имеет существенно меньшее значение. Важная особенность слухового восприятия: маскировка речи.Так, например, после громких звуков тихие некоторое время не воспринимаются; рядом ссильными спектральными пиками на слух не различимы более слабые частотные компоненты и т.д.Теперь, разобравшись в самых общих теоретических вопросах образования речи иособенностей ее восприятия, рассмотрим конкретные методы шумоочистки, часто применяемые на практике.Простые методыПростейшим способом повышения разборчивости речи является ее полосовая фильтрация.
Фильтр верхних частот удаляет из сигнала часто встречающиеся низкочастотныешумы. Уменьшение мощности первой форманты при этом, как мы уже говорили, не ведет ксерьезному ухудшению разборчивости речи. Фильтр нижних частот с частотой среза порядка4 кГц удаляет высокочастотные шумовые составляющие. Данный метод эффективен дляослабления шумов, которые лежат вне диапазона частот, существенного для восприятия ре-71чи, и фактически непригоден, когда спектры полезного сигнала и шума находятся в однойчастотной области. В случае когда помеха занимает сравнительно узкий участок или участкиспектра полезного сигнала, применяют многополосную фильтрацию (эквалайзинг).В случае воздействия на речь достаточно широкополосного шума разборчивость речиможно улучшить, дополняя полосовую фильтрацию сигнала операцией нормализации (клиппирования).
В основу этого метода положен тот факт, что нормализация увеличивает относительную амплитуду важных для разборчивости, но слабых по мощности согласных звуков,тем самым уменьшая их маскирование более громкими гласными звуками или шумом.Методы, основанные на вычитании спектровСуть данных методов состоит в следующем. При аддитивном шуме обрабатываемыйсигнал можно представить в виде следующего выражения: y(t)=s(t)+n(t), где s(t) — исходныйречевой сигнал, n(t) — шум. В этом случае спектр зашумленного речевого сигнала также является суммой спектров сигнала и шума. Получить спектр исходного сигнала можно путемвычитания спектра шума из спектра наблюдаемого сигнала.Следует отметить, что методы, основанные на вычитании спектра, в настоящее времянаиболее широко используются на практике. Их можно применять для подавления практически любых (кроме импульсных) помех, находящихся в полосе сигнала.Методы, основанные на винеровской фильтрации сигналаВ этих методах первоначально по зашумленному речевому сигналу y(t) оцениваетсяпередаточная характеристика “оптимального” фильтра.
Далее этот фильтр применяется вовременной или частотной области. В результате фильтрации находится оценка неискаженного речевого сигнала.Методы коррекции и сглаживания спектра речевых сигналовОсновная энергия речевого сигнала сосредоточена на определенных частотах, называемых формантами, а энергия шума, вообще говоря, может быть распределена по всему диапазону звуковых частот. Таким образом, используя соответствующий фильтр, реализованный во временной или спектральной области и точно настроенный на формантные частоты,можно уменьшать шум, сохраняя при этом полезный сигнал.
Однако поскольку значенияформант остаются постоянными только на коротких интервалах времени, то при обработкеразных участков речи требуется постоянная адаптивная подстройка фильтра. Это не всегдалегко реализуется на практике. Например, такая фильтрация совершенно неприемлема в случае воздействия на сигнал суммы гармонических помех.Методы сглаживания спектра предназначены для удаления в нем нехарактерных дляречи резких перепадов и выравнивания динамического диапазона среднего спектра с цельюкомпенсации амплитудно-частотных искажений сигнала в канале связи или звукозаписи.72Методы адаптивного подавления помехГруппа методов, называемых методами адаптивного подавления (или фильтрации)помех, основана на совместной обработке искаженного сигнала y(t)=s(t)+n(t) и опорного сигнала r(t), некоррелированного с исходным речевым сигналом s(t), но коррелированного cшумом n(t) (либо, наоборот, коррелированного с речью, но некоррелированного c помехой).В процессе адаптивной фильтрации сигнала r(t) формируется оценка коррелированного с r(t)компонента, который вычитается из y(t).Существуют два типа систем, реализующих принцип адаптивного подавления помех.Различаются они по способу получения опорного сигнала.