ЛекцииММ2 (Курс электронных лекций), страница 10
Описание файла
Файл "ЛекцииММ2" внутри архива находится в папке "Курс электронных лекций". Документ из архива "Курс электронных лекций", который расположен в категории "". Всё это находится в предмете "технологии мультимедиа" из 6 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "технологии мультимедиа" в общих файлах.
Онлайн просмотр документа "ЛекцииММ2"
Текст 10 страницы из документа "ЛекцииММ2"
Возможность создания анимированной графики, предоставляемая форматом GIF, позволяет разработчикам Web-сайтов оживить страницы и привлечь к ним внимание. Рассмотрим средства, которые предлагают производители графического программного обеспечения для создания анимации.
Одним из них служит пакет Paint Shop Pro 5 фирмы Jasc Software. Это не только графический редактор, предоставляющий широкий выбор кистей для рисования, средства ретуширования изображения, более 25 стандартных фильтров для его обработки, базовый набор стандартных эффектов и возможность подключения фильтров пакета Photoshop. В его состав также включен Animation Shop - программа для создания анимационных
GIF-файлов, которые можно использовать в Интернете или в собственных мультимедиа-приложениях. В ней к одному или нескольким статическим изображениям можно применить различные эффекты и переходы для создания мультипликации. Встроенные мастера позволяют быстро создать анимацию, подобрать цвета и сохранить файл. Анимация сохраняется в GIF-файле (.gif) или собственном формате программы Animation files (.mng).
На предварительном этапе в графическом редакторе Paint Shop Pro создают изображения
заданного размера в соответствии с числом объектов будущей анимации. Как правило,
размер выбирается небольшим, так как от этого зависит скорость загрузки Web-страницы с анимацией. Количество кадров изображения также должно быть невелико и обычно не превышает трех-четырех. Объект, который будет анимирован, должен быть нарисован или уже сохранен в отдельном файле. Если требуется изобразить несколько фаз движения, то каждая из них должна сохраняться в отдельном файле. При наложении объектов друг на друга задается прозрачный фон изображения.
ЗВУК
Звук является одним из самых выразительных средств мультимедиа. Умение использовать звук определяет уровень разработки проекта. Это и смысловая речь, и музыка, и специальные звуковые эффекты.
Звуковая волна – это процесс распространения в атмосфере объёмных деформаций сжатия – разряжения.
Изучением звука занимается акустика. Звуковые волны распространяются со скоростью 330 метров в секунду (1 Мах) над уровнем моря. Уровень звукового давления измеряется в децибелах (дБ). Децибел – это логарифм отношения интенсивности (или звукового давления) данного звука к интенсивности звука на пороге слышимости:
Увеличение мощности в 100 раз приводит к увеличению звука на 20 дицебел. Интенсивность показывает, какая энергия переносится звуковой волной через единицу площади.
дБ | Вт | Пример |
170 | 100000 | Турбореактивный двигатель |
120 | 1 | Молот |
90 | 0.001 | Электричка в метро |
70 | 0.00001 | Беседа |
30 | 0.000000001 | Шёпот |
Исследования показали, что шум на уровне 45 дБ не беспокоит соседей, 45-55 дБ вызывает редкие жалобы, 50-60 дБ – частые жалобы соседей, 55-65 дБ – вызывают угрозы,
а при более 65 дБ начинаются активные действия.
Чаёстота колебаний измеряется в Герцах (Гц). Человек воспринимает звук в интервале 16 – 20000 Гц.
MIDI
Musical Instrument Digital Interface - цифровой интерфейс музыкальных инструментов. Создан в 1982 году ведущими производителями электронных музыкальных инструментов - Yamaha, Roland, Korg, E-mu и дp. Изначально был предназначен для замены принятого в то время управления музыкальными инструментами при помощи аналоговых сигналов управлением при помощи информационных сообщений, передаваемых по цифровому интерфейсу. Впоследствии стал стандаpтом де-факто в области электpонных музыкальных инстpументов и компьютеpных модулей синтеза. MIDI пpедставляет собой так называемый событийно - оpиентиpованный пpотокол связи между инстpументами. Всякий pаз, когда исполнитель пpоизводит какое-либо воздействие на оpганы упpавления (нажатие/отпускание клавиш, педалей, изменение положений pегулятоpов и т.п.), инстpумент фоpмиpует соответствующее MIDI-сообщение, в тот же момент посылаемое по интеpфейсу. Дpугие инстpументы, получая сообщения, отpабатывают их так же, как и пpи воздействии на их собственные оpганы упpавления. Таким обpазом, поток MIDI-сообщений пpедставляет собой как бы слепок с действий исполнителя, сохpаняя пpисущий ему стиль исполнения - динамику, технические пpиемы и т.п. Пpи записи на устpойства хpанения инфоpмации MIDI-сообщения снабжаются вpеменными метками, обpазуя своеобpазный способ пpедставления паpтитуpы. Пpи воспpоизведении по этим меткам полностью и однозначно восстанавливается исходный MIDI - поток.
Спецификация MIDI состоит из аппаpатной спецификации самого интеpфейса и спецификации фоpмата данных - описания системы пеpедаваемых сообщений. Соответственно, pазличается аппаpатный MIDI - интеpфейс и фоpмат MIDI - данных (так называемая MIDI - паpтитуpа); интеpфейс используется для физического соединения источника и пpиемника сообщений, фоpмат данных - для создания, хpанения и пеpедачи MIDI сообщений. В настоящее вpемя эти понятия стали самостоятельными и обычно используются отдельно дpуг от дpуга - по MIDI-интеpфейсу могут пеpедаваться данные любого дpугого фоpмата, а MIDI - фоpмат может использоваться только для обpаботки паpтитуp, без вывода на устpойство синтеза.
Методы шумоочистки
Все без исключения методы очистки речи от шумов в той или иной степени разработаны с учетом либо особенностей образования речевого сигнала, либо параметров удаляемых помех, либо и того и другого вместе. Немаловажную роль при оценке эффективности методов играет критерий качества очистки, роль которого, в общем случае, играет разборчивость (то есть понимание слушателем того, что произносится). Однако часто для оценки качества очистки используются и формальные параметры, например, соотношение сигнал/помеха, комфортность прослушивания и т.д.
Для описания речевого сигнала, как правило, используется следующая модель. Речь образуется путем возбуждения акустического резонатора (речевого тракта) импульсами воздуха, проходящими через голосовые связки для звонких и турбулентными потоками воздуха для глухих звуков. С математической точки зрения такая модель может быть описана в виде линейной системы, возбуждаемой периодической функцией для звонких звуков или широкополосным шумом для глухих. С учетом физиологических особенностей образования речи математически речевой сигнал можно представить в виде отклика линейной системы с медленно меняющимися параметрами. На коротком интервале времени ее передаточная функция характеризуется набором резонансных частот, называемых формантами. Для звонких звуков на таком интервале времени речевой сигнал имеет гармоническую структуру, (период сигнала в этом случае называется периодом основного тона), для глухих - шумоподобную. Подобная модель, хоть и достаточно упрощенно описывает реальные процедуры речеобразования, с успехом применяется в различных системах коррекции.
Более сложен вопрос описания модели шумов. При учете всех возможных типов реальных шумов математический аппарат описания процедур коррекции оказывается достаточно громоздким. По этой причине большинство методов шумоочистки разрабатываются в предположении, что шумы носят только аддитивный характер и никак не связаны с исходным речевым сигналом, то есть между шумами и речью отсутствует корреляция. Другими словами, подлежащий коррекции сигнал представляется в виде суммы двух компонентов: речевого сигнала и шума.
Очень важную роль играют особенности восприятия речи человеком. Например, известно, что согласные звуки хотя и маломощны, но весьма существенны для понимания речи. Неравноценный вклад в обеспечение разборчивости речи вносят и форманты. Первая форманта, обычно лежащая в диапазоне от 250 до 800 Гц, менее существенна для восприятия, чем вторая и последующие. Хорошее воспроизведение кратковременного амплитудного спектра речевого сигнала является важным фактором, тогда как фазовый спектр имеет существенно меньшее значение. Важная особенность слухового восприятия: маскировка речи. Так, например, после громких звуков тихие некоторое время не воспринимаются; рядом с сильными спектральными пиками на слух не различимы более слабые частотные компоненты и т.д.
Теперь, разобравшись в самых общих теоретических вопросах образования речи и особенностей ее восприятия, рассмотрим конкретные методы шумоочистки, часто применяемые на практике.
Простые методы
Простейшим способом повышения разборчивости речи является ее полосовая фильтрация. Фильтр верхних частот удаляет из сигнала часто встречающиеся низкочастотные шумы. Уменьшение мощности первой форманты при этом, как мы уже говорили, не ведет к серьезному ухудшению разборчивости речи. Фильтр нижних частот с частотой среза порядка 4 кГц удаляет высокочастотные шумовые составляющие. Данный метод эффективен для ослабления шумов, которые лежат вне диапазона частот, существенного для восприятия речи, и фактически непригоден, когда спектры полезного сигнала и шума находятся в одной частотной области. В случае когда помеха занимает сравнительно узкий участок или участки спектра полезного сигнала, применяют многополосную фильтрацию (эквалайзинг).
В случае воздействия на речь достаточно широкополосного шума разборчивость речи можно улучшить, дополняя полосовую фильтрацию сигнала операцией нормализации (клиппирования). В основу этого метода положен тот факт, что нормализация увеличивает относительную амплитуду важных для разборчивости, но слабых по мощности согласных звуков, тем самым уменьшая их маскирование более громкими гласными звуками или шумом.
Методы, основанные на вычитании спектров
Суть данных методов состоит в следующем. При аддитивном шуме обрабатываемый сигнал можно представить в виде следующего выражения: y(t)=s(t)+n(t), где s(t) — исходный речевой сигнал, n(t) — шум. В этом случае спектр зашумленного речевого сигнала также является суммой спектров сигнала и шума. Получить спектр исходного сигнала можно путем вычитания спектра шума из спектра наблюдаемого сигнала.
Следует отметить, что методы, основанные на вычитании спектра, в настоящее время наиболее широко используются на практике. Их можно применять для подавления практически любых (кроме импульсных) помех, находящихся в полосе сигнала.
Методы, основанные на винеровской фильтрации сигнала
В этих методах первоначально по зашумленному речевому сигналу y(t) оценивается передаточная характеристика “оптимального” фильтра. Далее этот фильтр применяется во временной или частотной области. В результате фильтрации находится оценка неискаженного речевого сигнала.
Методы коррекции и сглаживания спектра речевых сигналов
Основная энергия речевого сигнала сосредоточена на определенных частотах, называемых формантами, а энергия шума, вообще говоря, может быть распределена по всему диапазону звуковых частот. Таким образом, используя соответствующий фильтр, реализованный во временной или спектральной области и точно настроенный на формантные частоты, можно уменьшать шум, сохраняя при этом полезный сигнал. Однако поскольку значения формант остаются постоянными только на коротких интервалах времени, то при обработке разных участков речи требуется постоянная адаптивная подстройка фильтра. Это не всегда легко реализуется на практике. Например, такая фильтрация совершенно неприемлема в случае воздействия на сигнал суммы гармонических помех.
Методы сглаживания спектра предназначены для удаления в нем нехарактерных для речи резких перепадов и выравнивания динамического диапазона среднего спектра с целью компенсации амплитудно-частотных искажений сигнала в канале связи или звукозаписи.
Методы адаптивного подавления помех
Группа методов, называемых методами адаптивного подавления (или фильтрации) помех, основана на совместной обработке искаженного сигнала y(t)=s(t)+n(t) и опорного сигнала r(t), некоррелированного с исходным речевым сигналом s(t), но коррелированного c шумом n(t) (либо, наоборот, коррелированного с речью, но некоррелированного c помехой). В процессе адаптивной фильтрации сигнала r(t) формируется оценка коррелированного с r(t) компонента, который вычитается из y(t).
Существуют два типа систем, реализующих принцип адаптивного подавления помех. Различаются они по способу получения опорного сигнала. В первой из них опорный сигнал формируют из зашумленного путем тех или иных преобразований последнего. Иногда такие системы называют одноканальными.
Двухканальные системы основаны на использовании двух, как правило, слабо коррелированных между собой источников получения обрабатываемой смеси речевого сигнала и помех. Например, такой метод может быть реализован в режиме “стереозаписи” при использовании двух разнесенных в пространстве направленных микрофонов, которые по-разному ориентированы на источники полезного сигнала и помехи. Достоинством данного метода является способность в некоторых случаях восстанавливать разборчивость даже самых зашумленных сигналов. Недостаток очевиден — режим “стереозаписи” не всегда может быть реализован на практике.