Оппенгейм - Применение цифровой обработки сигналов (1044221), страница 14
Текст из файла (страница 14)
Это отличие определяет показатель, который часто применяют для оценки качества речевых систем. Можно, например, задать вопрос: чему равна скорость создания информации в преобразователе, идеально согласованном с человеческой слуховой системой? Этот вопрос можно рассматривать как относительно всех звуковых сигналов, полностью перекрывающих динамический и частотный диапазоны слуха, так и применительно к более узкому кругу сигналов, называемых обычной музыкой. В обоих случаях оптимальным будет преобразователь, который создает минимум ошибок, замечаемых человеком.
Музыка представляет собой класс ограниченных звуковых сигналов, поскольку она создается при возбуждении механических резонансов или имеет вид ограниченных во времени ударных звуков. Преобразователь, предназначенный для широкого класса всех звуковых сигналов, даст, конечно, более универсальные результаты, но при проектировании звуковоспроизводящих систем широкого назначения обычно стараются сохранить их стоимость в разумных пределах. Оптимальным является преобразователь, у которого скорость создания информации уменьшена до такого минимального значения, при котором различие между квантованным и неквантован- ным сигналами не воспринимается на слух. Для достижения этой цели необходимо глубокое понимание психоакустических эффектов, создаваемых различными видами ошибок преобразования. К сожалению, полной модели слухового восприятия не существует, а есть лишь обширная литература по этим вопросам, где описываются различные явления.
При изучении кодирования звуковых сигналов наиболее полезными являются исследования, посвященные обнаружению сигналов в различных условиях ~16, 82]. Вообще для каждой частоты акустического сигнала существует определенный уровень, ниже которого он не слышен. В присутствии другого сигнала этот порог значительно повышается. В первом случае (без мешающего сигнала) определяется такой абсолютный порог слышимости, что звук заданной частоты с уровнем, не превышающим этого порога, совершенно не слышен. На рис.
2.6 показаны пороговые уровни для людей с нормальным слухом ~124]. Из приведенных кривых видно, что область наибольшей чувствительности слуха занимает диапазон от 1 до 5 кГц. На более высоких частотах чувствительность слуха уменьшается, и на частоте 15 кГц она на 20 дБ меньше максимальной. Аналогично возрастает порог чувствительности на низких частотах. Во втором случае имеет место маскировка сигнала, когда присутствие одного звука затрудняет восприятие другого звука. При этом происходит сдвиг порога восприятия. Если звучат длинные периодические сигналы, то звук с данной частотой маскирует сигналы на соседних частотах и делает их совершенно неслышными.
Кратковременные ударные звуки заглушают сигналы, звучащие до и после соответствующего переходного процесса. В обоих случаях звуковой сигнал может полностью заглушить как шум квантования, так и другие звуковые сигналы Это позволяет при разработке АЦП игнорировать те сигналы, которые будут замаскированы, а также не обращать внимания на шум квантования, возникающий в АЦП, если он не будет слышен на фоне полезного сигнала. На рис.
2.7 приведены результаты экспериментов по маскировке сигналов в частотной области ~18]. Группе людей давали. возможность слушать звуковой сигнал на фоне синусоидального колебания частоты 1200 Гц с уровнем звукового давления (УЗД), равным 80 дБ, Частота и амплитуда контрольного тона изменялись, чтобы найти область, в которой он не воспринимается. На графике эта область отмечена словами столько помеха». В ней. происходит полная маскировка и слышен только звук с частотой 1200 Гц. Вне этой области контрольный сигнал прослушивается как отдельный тон или в виде биений. Если маскирующий тон заменяется на узкополосный шум [19], то получается несколько иной результат (рис. 2.8).
Для музыки такой вид сигнала более характерен, чем одночастотный чистыйтон. Из представленных на рис. 2.8 кривых видно, что область' Глава 2 цифровая обработка звуковых сигналов „, ~го ~ (ОО '~~ 60 'ь 60 .ь 40 и фго гО ЮО ЮОО Ю ООО Йипгапи, Ги Рис. 2.6. Линии одинаковой громкости. !Каждая кривая соединяет уровни синусоидальных сигналов, воспринимаемые иа слух как одинаковые по громкости. Нижняя кривая является порогом слышимости (по ФлетчеРУ и Мансоиу). ~~ 00 ~ во У авель ламехи Омеаь лтакаа мерь ; з, лтакае Ф 70 Цю ~ ~ъ50 ~ 40 лалае ф;лемеха,хепч4 0амеха, кельт еьн , .гЪтеха,какл ,лалькяиню ти итирМивс юи чаеегаегы атал раекас нею чаита- иагакрае ~ каелтлай чаелтаью амеха, и ртаа 'рианасшнай чапптлы 77амеха и ктппрапь- кий клал Тальк амах 20 ~~ 10 400 600 000 1000 1200 У600 2000 2400 3200 4000 Уиелталта катпрппькага мака Рис.
2.7. Маскировка контрольного синусоидального сигнала (с переменной амплитудой и частотой) синусоидальной помехой частоты 1200 Гц с уровнем звукового давления 80 дБ выше порога слышимости. Есля контрольный тон опускается в обла "ть, лежащую ниже сплошной линни, то он не вляяет на сльппимость помехи. Выше сплошной линии контрольный тон создает сложные эффекты, которые воспринимаются нли как биения, или как смесь тонов, нли как то и друтое вместе.
[Из работ Ликлайдера (1981), Флетчера (1929)), Уэгела и Лэйиа 1!8]. Воспроизведено с разрешеняя зоЬп %!1еу апд Зопз, 1пс., Гэ. Чап Ыоз1гапд Сошрапу, Ве!1 Те!ерЬопе 1.аЬога(ог!ез.] спектра, в которой наблюдается маскировка, в сильной степени. зависит от амплитуды заглушающего сигнала. Чем больше его амплитуда, тем шире диапазон маскировки.
Обширные сведения о маскировке при различных сочетаниях свойств заглушающего (маскирующего) и контрольного сигналов приведены в работе ~82]. Другим важным явлением является маскировка во временной ' области. В этом случае помехи могут помешать восприятию более слабого сигнала, звучащего примерно в это же время. Если гром'кий звук маскирует следующий за ним слабый звук, то явление называется маскировкой вперед; оно может продолжаться до 250 мс. Границы областей маскировки (рис. 2.9) в логарифмическом масштабе изображаются линиями, близкими к прямым [17]. Громкий звук может также маскировать звук, воспроизводимый до него; это явление называется маскировкой назад, его длительность составляет 20 мс ~125].
Из вышеприведенных результатов следует, что для узкополосных сигналов необходимое отношение сигнал/шум 5/№, составляет лишь 30 дБ. Предположим, например, что входной сигнал пропущен через гребенку полосовых фильтров и верхний сигнал каждого фильтра преобразован в цифровую форму. Требования к 5/№, и, следовательно, число разрядов, необходимое в каждом АЦП, определяются условиями различимости шума, находящегося в полосе каждого фильтра.
Из рис. 2.8 видно, что в присутствии сигнала с уровнем 80 дБ в такой узкой полосе будет полностью заглушен любой сигнал или шум с уровнем, не превышающим 50 дБ. Поэтому для достижения заданного отношения 5/№, в. принципе требуется только шесть разрядов. Проблему обеспечения динамического диапазона в каждой из частотных полос можно решить с помощью какой-либо методики преобразования с поблочно плавающей запятой, описанной ранее. Длительность отклика системы с плавающей запятой определяется временем маски- 1 ровки вперед, которое сравнительно велико.
Поэтому условие по- лУчениЯ большого 5/Убс не очень влиЯет на выбоР скоРости создания информации. Ширина этих частотных поддиапазонов, называемых критическими полосами, увеличивается с ростом частоты [87]. Критические полосы имеют ширину 100 Гц на частотах до 1 кГц и расширяются постепенно до 2 кГц на частоте 10 кГц. Поведение сигналов в критических полосах довольно сложное, но анализ имеющихся данных приводит к выводу, что сигнальные составляющие, попадающие в одну полосу, проще исследовать, чем набор таких составляющих в различных полосах. Описанная система отличается от системы с поблочно плавающей запятой только тем, что сигналы в каждой из частотных полос обрабатываются независимо друг от друга.
Недостатком обычной системы является то, что (при сжатии характеристики АСТАП ь(ля всего диапазона) отношение 5/№„равное 60 дБ, не гарантк- Цифровая обработка звуковых сигналов .64 Глава 2 УО 'Рис. 2.8. Области маскировки сигналов узкополосной шумовой помехой на частоте 410 Гц с полосой 90 Гц при различных мощностях помехи.
Контрольный сигнал, лежащий ниже кривой, ие слышен. Полоса глушения расширяется с увеличением мощности помехи. (Воспроизведено из работы [19] с разрешения Американского акустического общества.) 5О го юоо гого Интереап лгаеиираеии, .ма У00 50 Рис. 2.9. Маскировка вперед и назад контрольного тона белым шумом. Звучал короткий отрезок шумового сигнала, а восле него (маскировка вперед) или перед иим (маскировка назад) включался контрольный тои с меньшим уровнем. Показана зависимость сдвига порога обнаружимости контрольного тона от интервала между тоном и по-мехой. Маскировка проявляется еще сильнее. если помеха имеет не широкополосный шумо1вой, а гармонический характер.
(Воспроизведено с разрешения Американского акустического общества из его журнала, том 34, № 8, 1982.) ~.5О ~~4 '-з,7 г ~ УО ф "~ 50 '1 ц ч(0 ~ 30 го 0$ Юо гоо 300 400 500700 1000 2000 3000 5000 10000 ~ааа7аа7а, I и рует отсутствия слышимых шумов. Сильный сигнал, сосредоточениый в одном конце диапазона, не повлияет на слышимость широкополосных шумов.