Главная » Просмотр файлов » Автореферат

Автореферат (1149824)

Файл №1149824 Автореферат (Моделирование речи на основе гармонического звукоряда для воспроизведения на разных скоростях с сохранением тембра)Автореферат (1149824)2019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла

На правах рукописиМорозов Петр ДмитриевичМоделирование речи на основе гармонического звукорядадля воспроизведения на разных скоростях с сохранением тембраСпециальность 05.13.18 —«Математическое моделирование, численные методы и комплексы программ»Автореферат диссертации на соискание ученой степеникандидата физико-математических наукСанкт–Петербург2017Работа выполнена в Санкт–Петербургском государственном университете.Научный руководитель:доктор физ.–мат. наук, доцентМихеев Сергей ЕвгеньевичОфициальные оппоненты:Ерохин Владимир Иванович,доктор физико-математических наук, профессор,Военно-космическая академия имени А.Ф.

Можайского,старший научный сотрудникРыбин Сергей Витальевич,кандидат физико-математических наук,Национальный исследовательский университетинформационных технологий, механики и оптики,доцент кафедры речевых информационных системВедущая организация:Федеральный исследовательский центр“Информатика и управление”Российской академии наукЗащита состоится “29” ноября 2017 г. в 15 часов на заседании диссертационного совета Д212.232.50 на базе Санкт-Петербургского государственного университета по адресу: СанктПетербург, Петергоф, Университетский проспект, 35, ауд. 327.С диссертацией можно ознакомиться в Научной библиотеке им.

М. Горького Санкт–Петербургского государственного университета по адресу: 199034, Санкт–Петербург, Университетская наб., д. 7/9 и на сайте https://disser.spbu.ru/disser/soiskatelyu-uchjonoj-stepeni/dislist/details/14/1306.html .Автореферат разослан “”2017 года.Ученый секретарь диссертационного советадоктор физико-математических наук, профессорКурбатова Г. И.ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫАктуальность темы исследования. Управление темпом воспроизведения записанного звука позволяет потребителю подстроить общую длительность звучания аудиоматериалапод свои нужды. Оно было возможным еще с момента появления аналоговой звукозаписи. Так,темп воспроизведения в фонографе регулировала скорость вращения рукоятки. На граммофонах и патефонах устанавливались стабилизаторы скорости вращения пластинок, на магнитофонах — стабилизаторы скорости лентопротяжки.

Стабилизаторы имели несколько стандартных режимов скоростей, выбираемых пользователем. Помимо этого, пользователь мог внестиизменения в стабилизаторы и получить стандарты, не предусмотренные производителем.Таким образом, изменения в воспроизведении аналоговой звукозаписи делались посредством механического вмешательства. Однако при таким подходе искажается тембр записанногоголоса, вплоть до неузнаваемости последнего на больших отклонениях темпа воспроизведенияот темпа записи. Поэтому такое непосредственное значительное ускорение/замедление темпавоспроизведения чаще применялось именно для изменения тембра голоса.С наступлением компьютеризации на смену аналоговому звуку пришел цифровой и появились новые, программные возможности обработки звукозаписи.

Цифровые аудиосигналына сегодняшний день имеют обширные области применения. В частности, в радиовещании, присоставлении аудиокниг и аудиословарей.Одной из актуальных на сегодня задач в области цифровых сигналов является изменение темпа воспроизведения цифровой речи с сохранением исходного тембра. Предложено многоалгоритмов решения этой задачи, воплощенных в программных комплексах, но полученная поним выходная цифровая речь часто содержит такие дефекты, как быстрое вибрато (тремоляция) при ускорении и “дырявость” при замедлении. В диссертационной работе рассматриваетсяалгоритм решения поставленной задачи, при котором данные дефекты не возникают.Степень разработанности. Эра цифрового звука открыла большие возможности дляманипуляции со звуком.

Сложные звуковые эффекты оказалось возможным достичь программными средствами. Комплексы таких программ от одной фирмы-производителя, объединенных интерфейсом, именуются звуковыми редакторами. Наиболее известные из них — AcidMusic Studio, Adobe Audition, AudaCity, Audio Speed Changer Pro, Cakewalk Sonar, Logic Pro,Music Construction Set, Nero WaveEditor, PaulStretch, PhotoSounder, Pro Tools, PropellerheadReason, REAPER, Sound Forge, VocalRemover. Не во всех них реализована возможность ускорения/замедления входного аудиофайла с сохранением исходной тональности звука. Даннаяреализация была обнаружена в конвертере PhotoSounder, онлайн-сервисе VocalRemover, про-3граммах AudaCity, Audio Speed Changer Pro, PaulStretch, Adobe Audition, REAPER. Во всехних при воспроизведении ускоренной/замедленной речи имеется дефект тремоляции и/или“дырявости” и иногда снижение качества выходного результата по отношению к оригиналу.Целью и задачей диссертации являются создание математического аппарата, который позволяет решить задачу изменения темпа воспроизведения цифровой речи с сохранениемисходного тембра, и разработка на основе этого аппарата программного комплекса.Научная новизна.

В ходе диссертационного исследования был разработан новый алгоритм решения задачи изменения темпа воспроизведения цифровой речи с сохранением исходного тембра. Выполнена оригинальная методика синтеза речевого сигнала с измененнымтемпом воспроизведения.Теоретическая значимость работы связана с построением адекватной математической модели цифрового звука, а также в формализации самой задачи построения. Приведенысоответствующие формулы и алгоритмы.Практическая значимость.

Увеличение темпа речи — востребованный прием, используемый при трансляции рекламы и подгонки воспроизведения аудиофайла к выделенному окну в эфирном времени. Замедление темпа речи может быть полезно изучающим иностранныйязык. Или пожилым людям: с возрастом понижаются острота слуха и скорость восприятия.Методы исследования. В диссертационной работе используются математическое программирование, методы дискретной оптимизации и создание ортогональной системы функцийпробников.Положения, выносимые на защиту:1. Математическая модель речи на основе гармонического звукоряда.2.

Численный метод последовательной оптимизации в определении фундаментальнойчастоты и амплитуд обертонов оцифрованной речи.3. Алгоритм повышения уровня гладкости при интерполяции квазиэрмитовыми кубическими сплайнами и его реализация в программном комплексе.4. Алгоритм ускорения с помощью изменения частоты дискретизации и его реализацияв программном комплексе.5. Моделирование функциональной зависимости спектра аудиосигнала от времени с помощью системы ортогональных пробников, которые, в отличие от вейвлетов, имеют переменные носители, отличающиеся от пробника к пробнику.Положения соответствуют пунктам 1, 2, 4, 7, 8 раздела “Области исследований” паспортаспециальности 05.13.18.Достоверность научных результатов обеспечивается строгостью доказательств, со4гласованностью с уже имеющимися результатами в данной и смежной областях и экспериментальной проверкой в компьютерном моделировании.Апробация работы.

Результаты, изложенные в диссертации, были представленына международной научной конференции “Процессы управления и устойчивость” (СанктПетербург, 2011 г., 2012 г. и 2013 г.), всероссийской конференции, посвященной 80-летию содня рождения В.И. Зубова “Устойчивость и процессы управления” (Санкт-Петербург, 2015г.), “Семинаре по конструктивному негладкому анализу и недифференцируемой оптимизации”(факультет ПМ-ПУ СПбГУ, 2016 г.).Публикации. По теме диссертации опубликовано 11 работ, в том числе три статьи вжурналах, входящих в перечень изданий, рекомендованных ВАК.Работы [5], [6], [8], [2], [3], [10] написаны в соавторстве.

В работе [5] автору принадлежаталгоритмы интерполяций, Михееву В.С. — алгоритм расшифровки WAV-файла. В работе [6]автору принадлежат алгоритмы модуляций, Михееву В.С. — алгоритм расшифровки WAVфайла. В работе [8] автору принадлежат экспериментальная часть и алгоритмы модуляций,Михееву В.С. — алгоритм расшифровки WAV-файла. В работе [2] автору принадлежат теоретическая часть и алгоритмы интерполяций, Михееву С.Е.

— общая постановка задачи. В работе[3] автору принадлежат доказательства основных результатов, Михееву В.С. — алгоритм расшифровки WAV-файла. В работе [10] автору принадлежат разработки частотного детектора икритерия качества, Михееву С.Е. — общая постановка задачи.Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения, списка условных обозначений и списка литературы. Определения, леммы, теоремы,следствия, примеры нумеруются в соответствии с главой, в которой они находятся. Объемработы составляет 122 страницы, не включая объем приложения, равный 12 страницам.

Количество таблиц: 7. Количество рисунков: 45. Список литературы включает 57 наименований.СОДЕРЖАНИЕ РАБОТЫВо введении приводится исторический обзор по теме исследования, обосновываютсяее актуальность, теоретическая и практическая значимость, научная новизна, формулируется цель, ставятся задачи работы, выдвигаются основные идеи по программному ускорению изамедлению воспроизведения цифрового звука с сохранением тональности.В главе 1 приводятся основные сведения, относящиеся к формированию акустическойречи, ее особенностям, слуховым особенностям человеческого восприятия.Частотно-амплитудный анализ речи основывается на представлении ее звукового давле-5нияW (t) = a0 (t) +P∑ai (t) cos(Ωi (t)t + Φi (t)) + bi (t) sin(Ωi (t)t + Φi (t)),(1)i=1где t ∈ [0, T], а функции ai (t), bi (t), Φi (t) имеют относительную скорость изменения значительно меньшую, чем частоты ȧ0 (t) a0 (t) ≪ Ω1 (t),гармоник: ȧi (t) ai (t) ≪ Ωi (t), ḃ (t) i ≪ Ωi (t), bi (t) Φ̇i (t) ≪ Ωi (t).(2)Звуковой файл формата WAV состоит из квантованных значений W , измеренных в дискретные моменты (отсечки) времени t ∈ {1, ..., N }.Представление (1) с ограничениями (2) располагает к выбору в качестве аппроксиматоравходного звукового потока на интервале [t, t + T ] ∋ t + ∆t сумму гармонических колебаний:f (t, ∆t) = x0 (t) +P∑xi (t) cos(ωi (t)∆t) + yi (t) sin(ωi (t)∆t),(3)i=1где T — фиксированное число из {1, ..., N −1}, величины xi (t), yi (t), ωi (t) подлежат определениюдля каждого t ∈ {1, ..., N −T }, P — количество гармоник.

Характеристики

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов диссертации

Моделирование речи на основе гармонического звукоряда для воспроизведения на разных скоростях с сохранением тембра
Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6540
Авторов
на СтудИзбе
301
Средний доход
с одного платного файла
Обучение Подробнее