А.И. Куприянов - Основы защиты информации (1022813), страница 42
Текст из файла (страница 42)
Наиболее простой способ сокращения частотного диапазона речи — это ограничение его сверху и снизу. Неоднократно предлагался метод сужения частотного диапазона речи путем равномерного деления его на ряд полос и передачи части каждой из них. Этот метод, как не учитывающий распределение речевой информации по частотному диапазону, приводит лишь к тому, что теряется информация и снижается помехозащищенность передачи. При временном компандировании на передающей стороне линии из речи исключаются некоторые временные интервалы.
Вследствие такой дискретизации в передаче образуются паузы, которые могут быть заполнены другой передачей. На приемной стороне интервалы в передаче заполняются предшествующим паузе отрывком речи. Иногда после исключения из речи временных интервалов остающиеся отрывки речи растягиваются на весь интервал до следующего отрывка. Вследствие этого понижаются частоты колебаний и весь частотный диапазон речи соответственно сжимается.
Таким образом, временное компандирование превращается в частотное. Сначала было предложено делить речевой сигнал по времени на равные интервалы и затем исключить их так, чтобы оставались речевые отрывки одинаковой длины и на равных интервалах. Но и этот метод оказался неэффективным, так как длительные звуки сохраняют большую избыточность, а короткие исчезают, В дальнейшем этот метод был усовершенствован с учетом того, что главным признаком распознавания звуков речи являются временные изменения форматных частот.
Соответственно этому принципу нет смысла в полной передаче установившихся значений формантных образов, а передавать следует только те временные участки звуков речи, в которых содержатся изменения формантных частот. Поскольку гласные звуки и ряд согласных имеют длительный период, в течение которого формантные изменения не происходят, то такие участки передачи могут быть без ущерба для речи почти исключены из передачи в компрессирующем устройстве. На приеме они могут быть легко восстановлены по предыдущим отрывкам и вставлены в паузы между отрывками звуков речи. Анализ участков речи, имеющих постоянные формантные частоты, показал, что совершенно свободно„без сколько-нибудь заметного снижения разборчивости и качества звучания речи, может быть исключено примерно 54% всей длительности передачи. Таким образом, двухкратная временная компрессия речи не дол- 198 -':жна вносить искажений при передаче.
Была проведена экспери',ментальная проверка зависимости разборчивости речи от величи-,ны временной компрессии и ее периода разделения (период раз:деления — это промежуток времени, занимаемый оставляемым и -выбрасываемым отрывками речи). За коэффициент компрессии ;::.принимается отношение паузы между отрывками к периоду раз-деления. Измеряется слоговая разборчивость для фонетически сба'".:лансированных, но бессмысленных слогов, которые собираются :: в специальные тестовые таблицы. Коэффициент компрессии изменялся в пределах 0,4...0,9, величина пауз — 0,01...0,24 с. 6.4.2.
Дискретные методы передачи и обработки речевого сигнала Наиболее естественным и, видимо, исторически самым ранним способом перевода речевых сигналов в цифровую форму яв::; ляется импульсно-кодовая модуляция 1211, при которой речевой ;:: сигнал л(г) подвергается дискретизации по времени и квантова- нию по уровню, Такие преобразования приводят к возникнове- ,:: нию шумов дискретизации и квантования, т.е. снижению отно":: шения сигнал-шум. В соответствии с рекомендациями МККТТ - 1101 для стандартного телефонного канала принято, что частота .: дискретизации должна составлять 8 кГц, квантование должно :::производиться по квазилогарифмическому закону, а кодирова':: ние — с восемью двоичными символами.
При этом требуется = обеспечить скорость передачи оцифрованной речи по каналу связи б4 Кбит/с, тогда как практически допустимые скорости передачи данных по каналу ТЧ обычно не превосходят 2,4 Кбит/с (по вы- :: деленным каналам 4,8 или 9,б Кбит/с).
Другим, хорошо известным способом скалярного кодирования ., речи является дельта-модуляция (ДМ) со всеми ее разновиднос:,-. тями. При ДМ по каналу связи передаются не сами квантованные : значения сигнала, а только их приращения. Передача речи при помощи дельта-модуляции сопровождается искажениями двух видов.
Это частотные ограничения (перегрузка по крутизне) и дробление. Частотные ограничения обусловлены тем, что приращения преобразуемого сигнала всегда фиксируются с запаздыванием, и зто запаздывание тем больше, чем быстрее изменяется сигнал. Умень- шить искажения этого вида можно за счет увеличения частоты дискретизации. Дробления проявляются на тех временных интервалах, где сигнал либо постоянен, либо изменяется очень медленно. Эффект дробления уменьшается при использовании логической обработки и нелинейной шкалы квантования, т.е. адаптации параметров модуляции к характеристикам преобразуемого сигнала. 199 При использовании всех мер борьбы с искажениями качество передачи речи по каналам с дельта-модуляцией удовлетворяет требованиям МККТТ при частоте дискретизации порядка 40 ...
50 кГц. Расчеты значений отношения сигнала к шуму для адаптивной дельта-модуляции (АДМ) показали, что при скорости передачи информации больше 40 Кбит/с предпочтительнее использовать ИКМ, а при меньше 40 Кбит/с эффективнее оказывается АДМ. При использовании способов векторного анализа и синтеза речевых сигналов используется расчленение сигналов на тональные и шумовые интервалы, соответствующие произнесению тональных (вокализованных) и глухих (шумовых) звуков речи. Этот процесс эквивалентен определению сигналов тон — шум ~р®, которые вычисляют через некоторые временные интервалы, длиной 10 ...25 мсек: ср(~,), ср(Ц, ....
Здесь <р(~) = 1 или О, если в окрестности точки ~; был произнесен тональный или шумовой звук. Одновременно переключательная функция ~р(1;) на тональных участках речи определяет значения частоты основного тона /,'(~;). Это основная частота колебаний голосовых связок. Частоты основного тона /'(9 и сигналы ~р(~;) особо важную роль играют при синтезе речи.
Спектрально-полосные методы кодирования речи. На их основе строятся полосные вокодеры. Спектр речевого сигнала на передающем конце разделяется узкополосными фильтрами на частотные полосы (спектральные каналы). В каждом канале путем детектирования и сглаживания фильтрами нижних частот определяются огибающая и средняя интенсивность сигнала.
Информация об этих величинах передается в аналоговой или цифровой форме по каналу связи. Кроме того, передаются сигналы тон — шум и значения частоты основного тона. На приемной стороне ~р(~;) управляет подключением генератора шума или генератора импульсов, частота которых определяется частотой Я~;).
С помощью этих генераторов создается широкополосный сигнал, который, как и на передающем конце, разделяется на частотные полосы с помощью фильтров. Колебания с выходов фильтров умножаются на значения огибающих канальных сигналов и суммируются друг с другом.
Полученный синтезированный сигнал приближенно отображает исходный естественный речевой ситнал, преобразованный на передающей стороне. Число спектральных каналов обычно варьируется от 7 до 20. Причем с увеличением числа каналов повышаются разборчивость и качество синтезированной речи, но возрастают и требования к пропускной способности канала связи. Согласно экспериментальным данным, для передачи огибающей сигнала на выходе каждого канала достаточно провести ее дискретизацию с частотой 50 Гц и квантование с помощью трех- разрядного двоичного кода, а для частоты основного тона соот- 200" М,"(~) = ~ К(~,У) Ю, МЯ(~) = ~/К (~,~)/3~, Л А или Мо'~(~) =г~~'К(1,~)ц, (6.5) Л ;: где интегрирование ведется по первой, второй или третьей фор'.
мантным областям. При реальных вычислениях, конечно, интег- 201 :;~ютственно 100 Гц и пятиразрядного кода. Следовательно, для 12- ,.канального полосного вокодера потребуется передавать по каналу :,'связи 2300 бит/с, а для 20-канального вокодера — 3500 бит/с. Основным недостатком полосных вокодеров является техни',:.ческая сложность и громоздкость реализации, обусловленная боль::;~пим количеством используемых фильтров. Качество восстанавли;:.::ааемой речи может снижаться из-за того, что в полосе пропуска:::ния фильтра на тональных звуках может оказаться несколько гармоник основного тона и число таких гармоник может меняться во '::,времени.
Кроме того, снижение качества обуславливают возмож'ные ошибки при определении Р~(Т) и сро(Т). Вместо значений частот основного тона можно использовать : так называемый основной канал: передавать естественную речь, :, взятую в частотной полосе, например 250...750 Гц.
При этом ка":-чество речи, как правило, улучшается, однако скорость передачи увеличивается до 10 Кбит/с. Поскольку передается не только пре,:::образованная речь, в этом случае говорят о полосном полувокодере. Формаптпые вокодеры. В них спектральная огибающая речевого :::.сигнала аппроксимируется комбинацией нескольких простых ре: зонансных кривых. Принципы построения формантного вокодера :: во многом аналогичны принципам естественного речеобразова: ния и восприятия речи. Поскольку речевой тракт представляет :::. собой комплекс резонаторов, резонансные частоты и добротнос'ти которых изменяются во времени в соответствии с управляю' щими сигналами, то и в формантном вокодере происходит выде.;: ление из речи управляющих сигналов, которые на приеме воздей, ствуют на резонансные контуры и приближенно воспроизводят :. передаваемую огибаюшую спектра.
Такими управляющими сигна:, лами могут быть: частоты формант /;(~), где ю' — номер форманты, ' Ы 1: У; амплитуды формант а;(е); ширина их спектра на уровне : 3 дБ — ЬДЯ. Существует много способов выделения формантных частот. Не: которые из них зависят даже от различных априорных определе' ний понятия «формантная частотак Для глухих звуков речи вместо форматных функций использу:.
ются меняющиеся во времени нулевой, первый и второй момен:: ты частотного спектра (1= 1, 2, 3): рирование заменяется суммированием и МИ(г) вычисляется с некоторым шагом по г. Момент МОИ (г, ) представляет собой интенсивность звука в !-и М(0(г) частотной области для заданного момента времени ~о, М~~О(г,) среднюю частоту !-й части спектра, а величина МИ(,,) МИ(,,) ' (6.6) Ми(г) М~О(г,) характеризует дисперсию !'-й части спектра. Приведенные функции от моментов заменяют для глухих звуков формантные функции и в дальнейшем формально будут обозначаться, как а,Я, Я(г) и !.'!Д(г).
Таким образом, при использовании формантного вокодера по каналу связи нужно передать дискретизированные по времени и квантованные по амплитуде величины: сигналы тон-шум, значения частоты основного тона и девять функций а!(г), Я, (г), ф;(г) (ю= 1,2,3). Учитывая плавность изменения во времени выше перечисленных сигнальных параметров параметров, дискретизацию можно проводить с частотой 40 Гц, квантование а;(г), /! (г), ЬЯ(г) в среднем 16 уровнями (4 бита), а частоты основного тона— 128 уровнями (7 бит), что в сумме потребует канала связи с пропускной способностью, равной 1700 бит/с.