Айфичер Э., Джервис Б. Цифровая обработка сигналов, практический подход (2-е изд., 2004), страница 9
Описание файла
DJVU-файл из архива "Айфичер Э., Джервис Б. Цифровая обработка сигналов, практический подход (2-е изд., 2004)", который расположен в категории "". Всё это находится в предмете "микропроцессорные системы (мпс)" из 8 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "микропроцессорные системы" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 9 - страница
Микросхема синтезатора действует в тесной связи с 4-битовым микропроцессором и двумя 128-килобитовыми ПЗУ, которые вместе вмешают словарь из приблизительно 300 слов и фраз (рис. 1.!О). Информация о речи хранится в ПЗУ в форме кадров !содержащих 25 мс речи), каждый кадр характеризуется набором из ! 0 или 12 параметров ЬРС. Параметры кадра сообщаются синтезатору каждые 25 мс и используются для обновления коэффициентов цифрового фильтра и выбора источника возбуждения и его уровня энергии. Выход цифрового фильтра преобразуется в аналоговый и подается на громкоговоритель для создания требуемого звука с определенным тоном, амплитудой 1.а Применение ЦОС при записи и воспроизведении звука 43 параметре фиямра рсчсвато «ааааа информация о тоне Рис. 1.9.
Линейное кодирование речи с иредсказанием Рнс. 1.10. Структура иособии Яреай аий Брел 1.6.2.2. Распознавание речи Под распознаванием голоса подразумевается, что информация вводится в компьютер с помощью человеческого голоса, а компьютер слушает и распознает человеческую речь. Распознавание голоса все еще активно изучается, так как поставленные задачи намного сложнее, чем те, которые возникают при синтезе речи. Поэтому успешные коммерческие системы распознавания речи немногочисленны и встречаются редко. Самыми удачными из них оказались настроенные на диктора системы распознавания изолированных слов.
Такие системы работают в одном из двух режимов. В режиме обучения пользователь обучает систему распознавать его или ее голос, произнося каждое слово, подлежащее распознанию, в микрофон. Система оцифровывает и создает эталон и гармоническим содержанием. Для сглаживания переходов в речевом спектре каждые 3 мс синтезатор обновляет параметры ЕРС, проводя интерполяцию между параметрами предыдущего и следующего кадра. В первом режиме операции ребенка просят сказать слово по буквам. Ребенок вводит слово по одной букве с помощью клавиатуры. Если написание верно, то при нажатии клавиши <Еп1ег> программа отвечает "Правильно" или "Верно". Если слово написано неверно, программа говорит "Неправильно, попробуй еше раз". Если же и следующая попытка неверна, она указывает: "Это неправильно" н добавляет "Правильно это слово пишется так: ...
". Глава 1. Введение [Уатрайатв~ вывода Рис. П11. Боои.сиама систсмы расиовиаааиия речи каждого слова, сохраняя его в памяти. В режиме распознавания каждое произнесенное слово снова оцифровывается, н его эталон сравнивается с эталонами из памяти. Если есть соответствие, значит, слово распознано, и система сообшает об этом пользователю или выполняет каюе-то действие. Работа таких систем зависит ог того, делает ли говорящий достаточно длинные паузы перед каждым словом, существует ли некий шумовой фон и оттого, насколько четко и ясно произносятся слова. Двумя самыми важными операциями ЦОС при распознавании являются извлечение параметров, когда из сказанного слова получаются отдельные образцы и создаются эталоны, и подбор по образцу, когда эталоны сравниваются с записями, которые хранятся в памяти (см.
рис. 1.11). Для большинства людей разговор — это самая естественная форма общения, ведь говорить намного быстрее, чем писать или печатать. Поэтому сейчас в офисах есть системы, которые позволяют управлять программами не нажатием клавиш, а произнесением команд. Разрабатываются системы, которые позволят создавать и отправлять с помощью голоса обычные офисные документы, такие как письма и служебные записки. Системы распознавания слов встречаются в товарах широкого потребления, таких как системы набора телефонного номера с речевым управлением, и в управляемых голосом предметах домашнего обихода для инвалидов с ограниченной способностью передвижения.
Это делает таких людей более независимыми, позволяет самостоятельно выполнять некоторые простые действия, например, включать или выключать свет, радио или телевизор. Конечно, существует еще множество возможных применений распознавания речи. Впрочем, дальнейшее развитие в этой области зависит, главным образом, от технологий искусственного интеллекта, поскольку машины должны не только распознавать, но и понимать человеческую речь. .'::.');6,3;: Цифровая аудиосистема воспроизведения компакт-дисков Многим читателям знакомы неприятные звуки, доносящиеся нз проигрывателя, если пластинка повреждена либо на ней есть царапины, грязь или отпечатки пальцев.
Компакт-диск — это современная аудиосистема, у которой уже нет недостатков долгоиграющих пластинок. Основные характеристики пластинок и компакт-дисков сравниваются в табл. 1.2 (согласно 14)). На компакт-дисках информация записывается в цифровой форме в виде спиральной дорожки, юторая состоит из последовательности впадин (рис. 1.12) 15). Каждый бит, записанный на компакт-диске, занимает площадь всего лишь 1 мкмз, т.е. 1Ое бит на квадратный миллиметр, что обеспечивает очень высокую плотность хранения информации. Табзицв 1.2. Сравнение характеристик долгоиграющей пластинки и компакт-диска гяолгоигРиюитил пластинка Харикимрист яки Коипикт-диск От 30 Гц до 20 кГц (ж 3 дБ) 70 дБ (при! кГц) 60 дБ 1-2 % 25-30 лБ 0,03 % Вызывает шум Высокочастотная характеристика при проигрывании ухудшается 500-600 ч 40-45 мин.
(обе стороны) Почти бесконечна 50-75 мин. (или больше) Время жизни иглы Длительность звучания Рне. 1.12. Вьоюкенные лазером еоалнны иа компакт-диске. Ширина каждой впадины— 0,5 мкм, алина — 0,8-3,5 мкм, а глубина — 0,11 мкм Расстояние межлу порожками составляет 1,б мкм (Перепечатано с разрешения журнала Ра Лрг Тесятси1 Яемеж 40(б), 1982) Упрощенная блок-схема обработки звукового сигнала на компакт-диске во время записи изображена на рис. 1.13.
Аналоговый звуковой сигнал в каждом стереоканале дискретизуется с частотой 44,1 кГц и оцифровывается. Каждая выборка представляется 16-битовым кодом, множество всех кодов образует динамический диапазон 90 дБ. Таким обрззом, в каждый момент дискретизации получается 32 бит, по 16 бит с левого и правого звуковых каналов. Цифровые выборки кодируются с помощью двухуровневого кода Рида-Соломона, что даст возможность обнаруживать и исправлять или скрывать ошибки при воспроизведении звукового сигнала. Для контроля и отображения информации для слушателей добавляются дополнительные биты.
Затем полученные потоки битов модулируются для преобразования в форму, более удобную для хранения на диске. С помощью ЕРМ-модуляции (преобразования 8-разрядного кода в 14-разрзщный) каждый байт потока данных преобразуется в 14-разрядный код. Полученный поток битов в канале после дальнейшей обработки используется для управления лазерным 1.б. Применение ЦОС при записи и воспроизведении звука Частотная характеристика Динамический диапазон Соотношение сигнал-шум 1армоническое искажение разделение стереоканалов коэффициент детонации Действие пыли, царапин и отпечатков пальцев Долговечность носителей От 20 Гц до 20 кГц (ат О, б ло -1 дБ) > 90 дБ > 90 дБ 0,004 % > 90 дБ Не регистрируется Приводит к исправимым или маскируемым ошибкам Почти вечные 46 Глава 1.
Введение то мз га Рис. 1.13. Упрощенная блок-схема обработки аудиосигнала и записи его на компакт-диск Гр «за Рнс. 1.14. Воспронзясдснне заукоеого сигнала с компакт-диска пучком, который записывает цифровую информацию на светочувствительный слой вращающегося стеклянного диска. С помощью процесса проявки создается узор из впадин на мастер-диске, с которого впоследствии делаются пользовательские компакт-диски. Во время воспроизведения записи на проигрывателе компакт-дисков дорожки на диске оптически сканируются с постоянной скоростью 1,2 мгс, в то время как диск вращается со скоростью от 8 об.(с до приблизительно 3,5 обре, и таким образом считывается записанная информация (рис.
!.14). Прежде всего, цифровой сигнал с диска демодулируется, детектируется, и по возможности в нем исправляются ошибки. Ошибки могут возникнуть вследствие производственных дефектов, повреждений, наличия отпечатков пальцев или пыли на поверхности диска. Если ошибки неисправимы, они либо маскируются посредством замены неправильного элемента выборки новым, полученным путем интерполяции между соседними элементами, либо, если ошибка обнаружена более чем в одном элементе, обнуляются (приглушаются). В результате полученные данные представляют собой ряды из 16-битовых слов, каждое из которых является элементом выборки звукового сигнала.
Эти элементы могут непосредственно направляться в 16-битовый цифроаналоговый преобразователь, а затем в аналоговый фильтр нижних частот. Однако для этого понадобились бы аналоговые фильтры с весьма строгими спецификациями. В частности, уровень частот, лежащих за 20 кГц, должен быть хотя бы на 50 дБ меньше максимального, а фильтр должен 1.6. Применение Цл)С при записи и воспроизведении звука 47 Рис. 145. Печатная плата лелодирушшея схемы проигрывателя компакт-дисков фирмы Рьйра, (Перепечатано с разрешения журнала Ряигрс Гссдтсаг лелем, 4016), 1982) иметь линейную фазовую характеристику во избежание ухудшения звукового сигнала.