Главная » Просмотр файлов » Диссертация

Диссертация (1101009), страница 17

Файл №1101009 Диссертация (Оценка качества селективного синтеза речи - методы и результаты) 17 страницаДиссертация (1101009) страница 172019-03-13СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 17)

Прямо передо мной внизу – // пестрый узор из крыш городских домов, // авдалеке, // на краю горизонта, // тянется серебряная цепь снеговых вершин...(Анна – 3 аудитора отметили ошибку)2. Минуты две-три ищу в шкафу /*T/ электрическую схему, // привезеннуюфранцузским коллегой. (Tatyana – 3 аудитора отметили ошибку)3. Останавливаюсь в начале мостика у ограды, // чтобы полюбоватьсярельефными склонами горных хребтов, // всматриваюсь в речную рябь.(Анна – 3 аудитора отметили ошибку)4.

Мы были дружны, // но потом, // мало-помалу, // связь наша оборвалась.(Анна – 4 аудитора отметили ошибку)5. - Следующим пунктом Уфа. (Анна, Tatyana – 3 аудитора отметили ошибку)6. А ты, // значит, /*Т/ теперь здесь живешь? // Давно? (Анна – 4 аудитора,Tatyana – 3 аудитора отметили ошибку) 112 В первом предложении, в котором были отмечены ошибки только для голосаАнна, возможной причиной при совпадении мест пауз послужили болеедлительные вторая и четвёртая паузы (более 300 мс) по сравнению со вторымголосом Tatyana, где самая длинная вторая пауза составляет примерно 200 мс,несмотря на более медленный общий темп чтения (см. рис. 20).Рис.20.Синхронизированныеосциллограммызвукозаписейсинтезированного предложения «Прямо передо мной внизу – // пестрый узориз крыш городских домов, // а вдалеке, // на краю горизонта, // тянетсясеребряная цепь снеговых вершин...» для голосов Tatyana (вверху) и Анна(внизу) с отмеченными паузамиВо втором предложении у голоса «Tatyana» по сравнению с голосом «Анна»в чтении есть дополнительная пауза на отрезке предложения между знакамипрепинания.В третьем предложении возможной причиной ошибки, отмеченной дляголоса «Анна», при совпадении пауз у обоих голосов послужило резкое падениетона и долгий гласный в слове «Остана\вливаюсь», возможно, выбранный вречевой базе из конечного во фразе слова с фразовым ударением, так что, несмотряна отсутствие паузы, на этом месте слышна граница синтагм.В четвёртом предложении в голосе «Анна» пауза после слова «потом» такжеявляется слишком длинной – более 400 мс.

113 В предложении «Следующим пунктом Уфа» паузы не поставили обасинтезатора. По всей видимости, ожидаемой для трёх участников экспериментабыла пауза перед словом «Уфа».В последнем предложении лишними, по мнению аудиторов, являются паузы,выделяющие вводное слово «значит».Можно сделать вывод, что большая длина пауз в голосе «Анна» моглаповлечь за собой оценку аудиторами таких пауз как ошибочных. Также следуетотметить, что «сомнения» аудиторов по поводу выделения паузами вводных словсогласуются с данными, приведёнными в исследовании [Кривнова, Чардин 1999].4.3.3 Оценка интонации синтезированной речиВ настоящем разделе предлагается двухэтапный подход к диагностическомутестированию качества интонации русскоязычной синтезированной речи, такжеописанный в статье [Solomennik, Cherentsova 2013].

На основе прослушивания иоценкитестовыхфразиспытуемымибыливычисленыинтегральныекоэффициенты интонационной адекватности и естественности. Тестирование былопроведено для нескольких голосов русскоязычных синтезаторов речи (см. ниже). Втесте от аудиторов требовалось принять лингвистическое решение относительнокоммуникативноготипавоспринимаемоговысказывания.Одновременнооценивалась естественность интонации по трехбалльной шкале. По результатамэкспериментапредлагаютсярекомендации,позволяющиеулучшитьпросодическую обработку в синтезаторах.Будем называть интонацию синтезированной речи адекватной, если припрослушивании возможно восстановить пунктуацию исходного текста в той жестепени, насколько это возможно для естественной речи при чтении текста. 114 Приоценкерассматриваютсяперцептивнодетектируемыеошибки,неточности и несоответствия в синтезированной речи в широком смысле,позволяющие производить улучшение просодического компонента системысинтеза с учетом слабых мест в определении интонационной структурысинтезируемых высказываний.Текстовый материал для исследования выбирался с использованиемсуществующих знаний о различных типах интонационных конструкций русскогоязыка и их частотности.Критерий адекватности коммуникативного типа высказываний основан наиспользовании оппозиции между интонацией завершённости (понижающийся тон«\»),незавершённости(умеренныйподъемтона«/-»)ивопросительной(значительный подъем тона «/») интонацией.

Даже адекватная интонация всинтезированной речи может звучать неестественно и раздражающе и тем самымнарушать ее комфортное восприятие: на корректное понимание сообщения можетвлиять отклонение того, что было услышано, от ожиданий слушающего.Например, нейтральный тон эмоционального восклицания или агрессивногоимператива (произнесённого ровно или с гортанной смычкой как в русском «Какаяприятная неожиданность!» может восприниматься как ироничный, а дружелюбнаяровная манера произнесения угрозы или предупреждения, такого как «Опаснаязона! Немедленно покиньте территорию!» может привести к непониманию илиигнорированию предупреждения).Для того чтобы получить представительный набор фраз для тестированияинтонации использовался размеченный речевой корпус, состоящий из записейразличных по стилю текстов, прочитанных восемью дикторами, четырьмямужчинами и четырьмя женщинами, около десяти часов речи на диктора.

Корпусбыл записан на кафедре фонетики СПбГУ для проекта по созданию синтеза 115 русской речи VitalVoice (ООО «ЦРТ»). Два текста («Обмен» Ю. Трифонова и«Поздний ребёнок» А. Алексина) были прочитаны всеми восемью дикторами. Впроцессе разметки корпуса использовалось 13 типов интонации [Вольская,Скрелин 2009], соответствующих расширенному набору семи интонационныхконструкций (ИК), обычно используемых для описания русской интонации[Брызгунова 1980]. На основе частотности различных типов интонации в корпусебыла определена доля фраз с определённой интонацией в тестовом наборе.Для эксперимента были подобраны нейтральные фразы с минимумомлексическихилисинтаксическихмаркеровкоммуникативноготипа,т.

е.потенциально многозначные, допускающие несколько значений (как минимумдва), если они представлялись вне контекста и без знаков препинания. Несколькотаких маркеров, однако, были представлены в тестовых предложениях. Это восновном союзы и вопросительные слова, отмечающие вопросы с вопросительнымсловами («Где вы родились?») и восклицания («Какой день чудесный!»), а такжеповелительные глаголы и наречия, указывающие на императив («Сиди дома!»).Несмотря на менее значительный вклад интонации в корректное понимание такихфраз, они были добавлены в набор, чтобы провести различие между независимымифразами, произнесёнными отдельно вне контекста, и незавершёнными фразамитойжеструктуры,которыеявляютсяфрагментами,выделеннымиизсоответствующего предложения. Например, вопрос с вопросительным словом впрямой речи будет иметь более интенсивное ударение на вопросительном слове ииметь динамичную основную частоту, в то время как тот же фрагмент,являющийся косвенной речью, будет произноситься невыразительно или даженейтральным тоном.Для прослушивания аудиторам были предложены 40 тестовых фраз, приэтом в них присутствовало следующее количество синтагм с требуемой 116 интонацией: завершённости – 27, незавершённости – 18, специальных вопросов –9, общих вопросов – 20, восклицаний – 6, побудительных предложений – 2.

Этифразы были просинтезированы несколькими русскоязычными голосами разныхсинтезаторов:1. Alyona (Acapela TTS),2. Milena (Nance Vocalizer)3. Olga (Loquendo TTS),4. Юлия и Владимир (VitalVoice TTS).Былотакжерусскоязычнымзаписаноестественноедиктором-женщиной28чтениелет.тогоНаборжефразнаборафразприводитсявПриложении У. Общая длительность звукозаписей для каждого голоса составилаоколо 2 минут речи.В ходе перцептивного теста аудиторов просили поставить во фразах знакипрепинания. Кроме принятия лингвистического решения о коммуникативном типекаждого высказывания, испытуемые должны были оценить его естественность (подвухбалльной шкале).

Для окончательной оценки результатов использоваласьтрёхбалльная шкала (0-2): 2 соответствовало правильной интерпретации и выборузнака пунктуации и оценке фразы как естественной, 1 – правильной пунктуации,но оценке интонации фраз как неестественной и 0 ставился тем фразам, где знакипунктуации были поставлены неправильно. Образец анкеты приводится вПриложении Ф.В эксперименте принимали участие 10 испытуемых в возрасте от 23 до 50лет, среди которых четыре мужчины и шесть женщин, для которых русский языкявляется родным. 117 Для того чтобы оценить качество интонации в синтезированной речи, былиподсчитаны два показателя: общая правильность (естественность) интонации(процент фраз с интонацией, корректно проинтерпретированной пунктуационно иотмеченной как естественная) и её адекватность (процент фраз с корректнопроинтерпретированной интонацией).

Средневзвешенное значение использовалосьдля подсчёта этих показателей по всем типам интонации, в качестве весовиспользовалось распределение значений частотности каждой интонационнойструктуры.Таблица 15. Показатели общей правильности и адекватности интонации длясинтезированных голосов (среднеквадратичное отклонение даётся в скобках).Минимальные значения отмечены жирным шрифтомЕст.Адекв.Ест.MilenaАдекв.Ест.OlgaАдекв.Ест.ЮлияАдекв.Ест.ВладимирАдекв.Ест.Ест. речьАдекв.AlyonaЗавершён- Специальный ОбщийВосклицаниеностьвопросвопрос0,72 (0,24) 0,14 (0,12) 0,24 (0,17) 0,19 (0,16)0,74 (0,10) 0,45 (0,10) 0,31 (0,09) 0,21 (0,14)0,83 (0,14) 0,10 (0,09) 0,08 (0,13) 0,19 (0,14)0,84 (0,15) 0,26 (0,27) 0,21 (0,24) 0,26 (0,13)0,51 (0,25) 0,30 (0,19) 0,11 (0,11) 0,19 (0,19)0,66 (0,24) 0,45 (0,12) 0,21 (0,24) 0,24 (0,17)0,88 (0,11) 0,25 (0,12) 0,25 (0,22) 0,34 (0,18)0,88 (0,11) 0,33 (0,11) 0,59 (0,15) 0,41 (0,19)0,86 (0,13) 0,24 (0,17) 0,38 (0,30) 0,25 (0,15)0,87 (0,10) 0,39 (0,19) 0,57 (0,25) 0,25 (0,15)0,97 (0,02) 1,00 (0,00) 0,78 (0,16) 0,89 (0,10)0,99 (0,00) 1,00 (0,00) 0,78 (0,16) 0,90 (0,09)Незавершённость0,49 (0,17)0,77 (0,08)0,54 (0,08)0,62 (0,38)0,50 (0,16)0,75 (0,17)0,50 (0,16)0,70 (0,17)0,61 (0,22)0,74 (0,19)0,94 (0,08)0,94 (0,08)Всего0,54 (0,13)0,67 (0,07)0,60 (0,07)0,66 (0.08)0,45 (0,16)0,65 (0,16)0,64 (0,07)0,72 (0,08)0,66 (0,15)0,72 (0,09)0,92 (0,03)0,93 (0,02)Таблица 16.

Показатели общей правильности и адекватности интонации длясинтезированных голосов, нормализованные относительно естественной речи.Минимальные значения отмечены жирным шрифтомAlyonaMilenaЗавершён- Специальныностьй вопросЕст.0,740,14Адекв.0,750,45Ест.0,850,10Адекв.0,850,26Общийвопрос0,310,400,100,27Восклицание0,210,230,210,29Незавершённость0,520,820,580,66Всего0,590,720,650,71 118 Ест.Адекв.Ест.ЮлияАдекв.Ест.ВладимирАдекв.Olga0,520,670,900,890,880,880,300,450,250,330,240,390,140,270,320,750,490,730,210,270,380,450,280,280,530,800,530,740,650,790,490,700,700,770,720,77В результате общая естественность интонации синтезированных голосов,участвовавших в тестировании, нормированная на естественный голос, изменяетсяот 49 % для голоса «Olga» до 72 % («Владимир»).Показательточностиобнаруживаетменьшуюмеждикторскуювариативность, приближаясь к 70 процентам для всех синтезированных голосов.Восприятие голоса «Olga» (Loquendo) могло быть несколько нарушено фоновоймузыкой в демо-версии синтезатора.Различия в работе синтезаторов, подсчитанные для среднего количества фразс точной/естественной интонацией, не являются статистически значимыми науровне значимости p < 0,05.

Характеристики

Тип файла
PDF-файл
Размер
2,91 Mb
Предмет
Высшее учебное заведение

Список файлов диссертации

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6381
Авторов
на СтудИзбе
308
Средний доход
с одного платного файла
Обучение Подробнее