49966 (609796), страница 2

Файл №609796 49966 (Створення синтезатора мови) 2 страница49966 (609796) страница 22016-07-30СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 2)

Перш ніж приступити до синтезування мови, необхідно визначити які фонеми, де і в якому порядку повинні відтворюється. Для цього спочатку текст розбивається на окремі слова, а слова потім на фонеми. Коли ми маємо список фонем, між фонемами приголосна-голосна вставляється згенерованих послідовність. Метод генерації описаний в пункті 3.2. Потім все слово згладжується, для придушення клацань, які виникають при різких перепадах значення сигналу. Метод згладжування описаний в пункті 3.3. Повна схема алгоритму наведена у додатку А.

3.2 Генерація проміжків між фонемами

Для генерації послідовності береться остання частина лівої фонеми довго рівний періоду повторення схожих ділянок у звуці. А так само початок правою за тим же принципом. Потім генеруються п'ять ділянок, які плавно перетікають з лівої фонеми в праву. Тобто перший ділянка дуже схожий на ліву фонему, третій щось середнє між лівою і правою, а п'ятий дуже схожий на праву. Фактично фонеми частково накладаються один на одного. На малюнках 3.1, 3.2, 3.3 відображує графічне представлення цих звуків. Як видно з малюнка 3.3, згенерованих частина сильно виділяється різкими переходами, що призводить до клацанням під час відтворення звуку.

Рисунок 3.1 – Фонема “Р_”

Рисунок 3.2 – Початок фонеми “А”

Рисунок 3.3 – Згенерований проміжок між фонемами “Р_” і “А”

3.3 Згладжування звуку

Після злиття фонем та згенерованих ділянок, може утворитися місця різкого перепаду сигналу, що веде за собою клацання, на кожному такому перепаді. Що в середньому складає по півтора клацання на кожну букву в слові. Це призводить до постійного клацання, для усунення якого був використаний усереднюються фільтр за трьома точками.

Рисунок 3.4 - Згенерований проміжок між фонемами "Р_" і "А" із застосуванням усереднює фільтра.

3.4 Обробка вихідного звуку

Перед відтворенням звук ще два рази зазнає обробці. При першій його гучність коригується залежно від установок користувача. Для чого значення сигналу множиться на коефіцієнт гучності, який варіюється від нуля і до 1.5. На малюнках 3.5 - 3.8 зображена фонема "Р" при різних рівнях гучності.

Рисунок 3.5 – Фонема "Г" при гучності 100%

Як видно з малюнка 3.8, при гучності 250% фонема "Г" значно спотворюється і перетворюється на шум. Для різних фонем максимальна гучність різна, тому було прийнято рішення обмежити користувача максимальним рівнем 150%. Даних рівень підходить для всіх використовуваних фонем.

Рисунок 3.6 – Фонема “Г” при гучності 40%

Рисунок 3.7 – Фонема “Г” при гучності 150%

Потім відрегульований по гучності звук приводиться до необхідної швидкості. Для цього він розтягується на заданий користувачем коефіцієнт. Фактично для звуку змінюється частота дискретизації за часом. Коефіцієнт варіюється від 0.5 до 5. Але при підвищенні швидкості за позначку 2.0, мова перестає бути розбірливим. На малюнку 3.5 зображена фонема "Г" при швидкості 100%. На малюнках 3.9 - 3.11 наведена вона ж, але на різних швидкостях. За зовнішнім виглядом вони здаються однаковими, але з тимчасової шкалою помітно відмінність. На малюнку 3.11 також помітно що графік стає грубим через дуже малої частоти дискретизації.

Рисунок 3.8 – Фонема “Г” при гучності 250%

Рисунок 3.9 – Фонема “Г” при швидкості 50%

Рисунок 3.10 – Фонема “Г” при швидкості 200%

Рисунок 3.11 – Фонема “Г” при швидкості 500%

3.5 Аналіз результатів синтезування

Для аналізу якості синтезування звуків, найкращим методом буде порівняння синтезованої мови з оригінальною. Для цього візьмемо пару слів, запишемо їх і синтезуємо. Потім порівняємо графіки. В якості тестових слів візьмемо "Мурка" і "кактуси". Їхні зображення наведені на малюнках 3.12 - 3.15.

Рисунок 3.12 – Слово "мурка" (оригінал)

Рисунок 3.13 – Слово "мурка" (синтезоване)

Як видно з малюнків 3.12 і 3.13, графіки досить схожі, за винятком того, що в оригіналі, пере звуком "до", знаходиться пауза. Тривалість паузи приблизно 50 мкс. З'єднання "до" і "а" практично ідентичні, лише за винятком того, що звук "а" в оригіналі голосніше. Звуки "ма" в синтезованому слові є монолітними, тобто записаними відразу разом.

Щодо слова "кактуси" (Мал. 3.14 і 3.15) простежуються ті ж тенденції. Помічені 50 мілісекундного проміжки перед і після звуку "т". Отже між вибуховими звуками можна спробувати вставляти пази, що можливо призведе до поліпшення звучання.

Рисунок 3.14 – Слово "кактусы" (синтезоване)

Рисунок 3.15 – Слово "кактусы" (оригінал)

4. ІНСТРУКЦІЯ КОРИСТУВАЧА

4.1 Опис головного вікна програми

Інтерфейс користувача являє собою вікно програми зображене на малюнку 4.1. Вся робота ведеться саме в ньому. У верхній частині вікна знаходиться головне меню (1), а під ним панель інструментів (2), яка повністю дублює меню. Ще нижче знаходиться панель модифікаторів (3). Частину, що залишилася вікна займає текстове поле, для введення тексту, який буде проговорюватися (4).

Рисунок 4.1 – Головне вікно програми

4.2 Відтворення мови

Для відтворення мови, потрібно в текстове поле ввести текст, або відкрити файл, вибравши в меню Файл-> Відкрити. У вікні вказати потрібний файл. На поточний момент підтримуються формати. Txt і. Rtf. Для відтворення звуку необхідно вибрати пункт меню Програвач-> Говорити. Для припинення, необхідно натиснути в тому ж пункті вибрати пункт Пауза, а для зупинки Стоп. Усі ці пункти продубльовані в панелі інструментів. Якщо необхідно відтворити не весь текст, а його частина, то можна виділити частину тексту запустити програвання, як вказано на малюнку 4.2.

Рисунок 4.2 – Відтворення виділеного тексту

4.3 Модифікація мови

На панелі модифікаторів знаходяться повзунки швидкості і гучності. При їх пересування змінюються відповідні параметри мови. Всі зміни застосовуються динамічно, тобто не непотрібно перезапускати відтворення.

4.4 Збереження мови

Для збереження мови в файл, необхідно вибрати пункт меню Файл-> Зберегти. У вікні, вказати місце збереження і зберегти. На даний момент доступний тільки формат. Wav. Звук зберігається з урахуванням положення повзунків.

СИСТЕМНІ ВИМОГИ

Операційна система Windows XP/Vista/7.

Необхідна версія Framework 3.5/4.0

Пристрій виведення звуку.

Для установки програми необхідно 1Мб вільного місця на жорсткому диску.

ВИСНОВОК

Створення синтезатора мови є досить трудомісткою роботою. А створення синтезатора розбірливим мови, ще більш складним завданням. Створити ж синтезатор, голос якого можна було б відрізнити від справжнього, вимагає великої кількості досліджень. Так само його доцільно створювати з допомогою синтезу за правилами, а не готовими фонемами. У даній же курсової роботі була здійснена спроба створення синтезатора, який хоча би задовольняв вимогам чіткість. Для створення повноцінного синтезатора необхідна величезна база слів, хоча б для того, що б у словах відтворювати наголосу, а також врахування особливостей вимови деяких слів. Але деякі особливості мови не піддаються алгоритмізації ні якими шляхами. Приміром наголосу деяких слів залежить від контексту їх використання. Одним з таких слів є замок.

Створений у цій курсової роботі синтезатор, є дуже наближеною моделлю того, яким повинен бути справжній синтезатор мови. Але для розробки дійсно стоїть синтезатора потрібно значний проміжок часу і велика кількість досліджень.

СПИСОК ЛІТЕРАТУРИ

  1. Синтез мови - http://ru.wikipedia.org/wiki/

  2. Винцюк Т.К. - Анализ, распознавание и интерпретация речевых сигналов, 1987, Киев - Наукова Думка

  3. Фланаган Дж.Л. - Анализ, синтез и восприятие речи, 1968, Связь – Москва

  4. Сорокин - Синтез речи, 1992, Связь – Москва

  5. Кучеров, Лобанов -Синтезированная речь в СМО, 1983, Киев - Наукова Думка.

Характеристики

Тип файла
Документ
Размер
10,8 Mb
Тип материала
Учебное заведение
Неизвестно

Список файлов курсовой работы

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее