Диссертация (1101009), страница 22
Текст из файла (страница 22)
— 2013. — Vol.101. — No. 5. — P. 1234–1252.99. Van Heuven V. J., Van Bezooijen R. Quality Evaluation of Synthesized Speech. //Speech Coding and Synthesis. — New York, 1995. — P. 723–725.100. Van Santen J. Evaluation // Multilingual Text-to-Speech Synthesis: The Bell LabsApproach. — Kluwer, Dordrecht, 1998. — P. 229–244.101. Van Santen J. P. H., Buchsbaum A. L. Methods for optimal text selection. Proc. ofEurospeech. — Rhodes, Greece, 1997. — P. 553–556.102. Vepa J. Join Cost for Unit Selection Speech Synthesis. — University ofEdinburgh, 2004.
— 219 p.103. Vepa J., King S. Subjective evaluation of join cost functions used in unit selectionspeech synthesis // In Proceedings of the International Conference on Speech andLanguage Processing 2004. — Jeju, Korea, 2004. — P.1181–1184.104. Vepa J.,King S.,Taylor P.Objectivedistancemeasuresforspectraldiscontinuities in concatenative speech synthesis // Proc. Int. Conf.
SpokenLanguage Processing. — 2002. — P. 2605–2608. 150 СПИСОК РИСУНКОВРис. 1. Система резонаторов Кратценштейна ............................................................ 12Рис. 2. Говорящая машина Кемпелена, построенная Уитстоном ............................ 13Рис. 3. Механический синтезатор Риша ....................................................................
14Рис. 4. Электрическая модель речевого тракта Стюарта ......................................... 15Рис. 5. Схема синтезатора «водер» ............................................................................. 17Рис. 6. Синтезатор Pattern Playback ............................................................................ 19Рис. 7.
Аналог речевого тракта с линией передачи, управляемый непрерывно .... 22Рис. 8. Каскадный и параллельный синтезаторы. В параллельном синтезатореамплитуда каждого формантного резонатора должна контролироваться отдельно.В каскадном – выходной сигнал каждого резонатора является входным сигналомследующего ..................................................................................................................
23Рис. 9. Формантный синтезатор Холмса, состоящий из резонаторов для четырёхформант и носовой форманты, каждый из которых возбуждался вариативнойсмесью сигналов шумового и голосового источников ............................................. 25Рис. 10. Внешний вид синтезатора «Фонемофон-1» ................................................. 26Рис. 11. Структурная схема КЛП-синтезатора........................................................... 27Рис.
12. Прототипическая схема системы синтеза речи ........................................... 29Рис. 13. Общая схема системы синтеза речи, основанной на СММ ........................ 35Рис. 14. Выбор целевой звуковой последовательности при селективном синтезеречи................................................................................................................................. 39 151 Рис. 15. Общая структура селективного синтезатора речи....................................... 45Рис. 16. Алгоритм создания речевой базы для селективного синтезатора ............. 58Рис.
17. Иллюстрация применения алгоритма TD-PSOLA....................................... 60Рис. 18. Зависимость слоговой (3), словной (2) и фразовой (1) разборчивости отфонемной ....................................................................................................................... 66Рис. 19. Вариативность оценок аудиторов (процент предложений, в которыхотмечены ошибки указанного типа) для разных синтезированных голосов.Цветами показаны проценты ошибок, указанные каждым испытуемым ............... 92Рис. 20.
Синхронизированные осциллограммы звукозаписей синтезированногопредложения «Прямо передо мной внизу – // пестрый узор из крыш городскихдомов, // а вдалеке, // на краю горизонта, // тянется серебряная цепь снеговыхвершин...» для голосов Tatyana (вверху) и Анна (внизу) с отмеченными паузами....................................................................................................................................... 112Рис. 21. Средние оценки различных типов синтезированной речи по отношению к«знакомству» испытуемых с синтезом речи ............................................................
130 152 ПЕРЕЧЕНЬ ТАБЛИЦТаблица 1. Основные селективные синтезаторы для русского языка ..................... 42Таблица 2. Общая классификация нестандартных текстовых элементов в русскихтекстах ............................................................................................................................ 47Таблица 3.
Количество ошибок разных типов, выделенных испытуемыми, исредняя оценка естественности речи (в скобках указано стандартное отклонение).Приводятся значения, усредненные по всем предложениям ................................... 89Таблица 4. Максимально возможные оценки естественности речи при наличииошибки определённого типа ........................................................................................
91Таблица 5. Данные по ошибкам, отмеченным большинством испытуемых дляголоса «Tatyana» ........................................................................................................... 93Таблица 6. Данные по ошибкам, отмеченным большинством испытуемых дляголоса «Анна» ............................................................................................................... 93Таблица 7. Процент ошибочного чтения графических сокращений различнымисинтезаторами ...............................................................................................................
96Таблица 8. Процент ошибочного чтения аббревиатур различными синтезаторами......................................................................................................................................... 98Таблица 9. Процент ошибочного чтения цифровых обозначений различнымисинтезаторами ............................................................................................................. 100Таблица 10.
Процент ошибочного чтения символьных обозначений различнымисинтезаторами ............................................................................................................. 101Таблица 11. Проценты ошибочного и неточного чтения англоязычных вставокразличными синтезаторами ....................................................................................... 103 153 Таблица 12.
Ошибки различных синтезаторов в ударениях при чтениифонетически представительного текста (приведены неправильные ударения, в томчисле в омографах) ..................................................................................................... 105Таблица13.Процентошибочногочтенияслов-омографовразличнымисинтезаторами ............................................................................................................. 107Таблица 14. Количество ошибок в сегментной транскрипции у различныхсинтезаторов ................................................................................................................ 110Таблица 15. Показатели общей правильности и адекватности интонации длясинтезированных голосов (среднеквадратичное отклонение даётся в скобках).Минимальные значения отмечены жирным шрифтом ...........................................
117Таблица 16. Показатели общей правильности и адекватности интонации длясинтезированных голосов, нормализованные относительно естественной речи.Минимальные значения отмечены жирным шрифтом ........................................... 117Таблица 17. Процент интонационных ошибок по данным двух экспериментов . 119Таблица 18. Признаки, используемые для обучения СММ .................................... 125Таблица 19. Оценки и их количественное значение ............................................... 127Таблица 20. Результаты оценки естественности звучания различных образцовсинтезированной речи ................................................................................................
128Таблица 21. Классы качества речи по ГОСТ Р 50840-95 ........................................ 128Таблица 22. Сводная таблица результатов проведённых тестов по успешностивыполнения системами синтеза речи различных задач .......................................... 132 154 ПРИЛОЖЕНИЯПриложение А. Фонетически представительный текстДом, в котором я живу, расположен на окраине маленького городка, у самойподошвы горы.
Здесь мягкий климат и редко идут дожди. Ночью небосвод бываеттак густо усеян звездами, что кажется, будто все миллиарды их из нашей галактикиразбросаны вверху над моей головой. Летним утром, как только я открываю окно,моя большая комната наполняется запахом цветов. Ветки черешен смотрят мне вокна, и легкий теплый ветер усыпает мой письменный стол белыми лепестками.Я слушаю щебет птиц. Вот с искрометным задором пропел зяблик. Где-тодятел устраивает дупло.