Диссертация (1101009)
Текст из файла
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТим. М. В. ЛОМОНОСОВАФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТНа правах рукописиСоломенник Анна ИвановнаОценка качества селективного синтеза речи:методы и результатыСпециальность 10.02.21 – «Прикладная и математическая лингвистика»Диссертация на соискание учёной степеникандидата филологических наукНаучный руководительдоктор филологических наук,ведущий научный сотрудникКривнова Ольга ФёдоровнаМосква – 20162 ОГЛАВЛЕНИЕВВЕДЕНИЕ .................................................................................................................
5ГЛАВА1.ИСТОРИЯСИНТЕЗАТОРОВРЕЧИИСОВРЕМЕННЫЕРАЗРАБОТКИ ........................................................................................................... 101.1 Цели и задачи синтеза речи ............................................................................... 101.2 История вопроса и типы синтезаторов речи .................................................... 101.3 Перспективы дальнейшего развития синтеза речи..........................................
361.4 ВЫВОДЫ К ГЛАВЕ 1 ........................................................................................ 37ГЛАВА 2. СЕЛЕКТИВНЫЙ СИНТЕЗ РЕЧИ ........................................................ 382.1 Алгоритм Unit selection ...................................................................................... 382.2 Русскоязычные селективные синтезаторы ....................................................... 412.3 Структура современного селективного синтезатора речи типа «Текст–Речь»..................................................................................................................................... 432.4 ВЫВОДЫ К ГЛАВЕ 2 ........................................................................................
61ГЛАВА 3. МЕТОДЫ ОЦЕНКИ КАЧЕСТВА СЕЛЕКТИВНОГО СИНТЕЗАРЕЧИ .......................................................................................................................... 623.1 Задачи и критерии оценки качества синтезированной речи ........................... 623.2 Методы оценки разборчивости речи................................................................. 653.3 Методы оценки естественности речи ............................................................... 673.4 Факторы, влияющие на восприятие синтезированной речи человеком ........ 713.5 Необходимость адаптации методов оценки к селективному синтезу речи .. 723.6 Структура и задачи системы оценки качества синтезированной речи..........
753.7 ВЫВОДЫ К ГЛАВЕ 3 ........................................................................................ 84 3 ГЛАВА 4. РЕЗУЛЬТАТЫ ОЦЕНКИ КАЧЕСТВА СЕЛЕКТИВНОГО СИНТЕЗАРЕЧИ .......................................................................................................................... 854.1Оценкастепенивлиянияразличныхтиповошибокнакачествосинтезированной речи .............................................................................................. 864.2 Оценка лингвистической обработки .................................................................
944.3 Оценка фонетической обработки .................................................................... 1084.4 Оценка акустической обработки ..................................................................... 1204.5 Интегральная оценка качества синтезированной речи и оценка общегокачества синтеза ...................................................................................................... 1214.7 ВЫВОДЫ К ГЛАВЕ 4 ......................................................................................
131ЗАКЛЮЧЕНИЕ ....................................................................................................... 133СПИСОК СОКРАЩЕНИЙ .................................................................................... 136СПИСОК ЛИТЕРАТУРЫ ...................................................................................... 137СПИСОК РИСУНКОВ ...........................................................................................
150ПЕРЕЧЕНЬ ТАБЛИЦ ............................................................................................. 152ПРИЛОЖЕНИЯ ...................................................................................................... 154Приложение А. Фонетически представительный текст ......................................
154Приложение Б. Инструкция и пример анкеты в эксперименте по влияниюразличных типов ошибок на качество синтезированной речи ........................... 157ПриложениеВ.Списокпредложенийдлятестированияграфическихсокращений .............................................................................................................. 158Приложение Г. Ошибки чтения сокращений: результаты тестирования ..........
162ПриложениеД.Списокпредложенийдлятестированияозвучиванияаббревиатур ............................................................................................................. 164 4 Приложение Е. Ошибки озвучивания аббревиатур ............................................. 169Приложение Ж. Список предложений для тестирования расшифровки цифровыхобозначений и выражений .....................................................................................
171Приложение И. Результаты тестирования расшифровки цифровых обозначенийи выражений ............................................................................................................ 174Приложение К. Список предложений для тестирования чтения особыхсимвольных обозначений .......................................................................................
175Приложение Л. Результаты тестирования чтения символьных обозначений .. 177Приложение М. Список английских слов с их практической транскрипцией . 178Приложение Н. Результаты тестирования по озвучиванию англоязычныхвставок ..................................................................................................................... 180Приложение П.
Список предложений для тестирования правильности снятияомонимии ................................................................................................................. 181Приложение Р. Результаты тестирования правильности снятия омонимии ..... 185Приложение С. Список предложений для оценки правильности сегментнойтранскрипции .......................................................................................................... 187Приложение Т. Результаты оценки правильности сегментной транскрипции всинтезаторах речи ................................................................................................... 188Приложение У. Набор фраз для тестирования интонации .................................
190Приложение Ф. Образец анкеты по оценке адекватности и естественностиинтонации синтезированной речи ......................................................................... 193Приложение Х. Образец бланка оценки качества речи ...................................... 194 5 ВВЕДЕНИЕВ течение нескольких последних десятилетий технология синтеза речиразвивалась с большой скоростью и эффективностью. Главным достижением вэтой области можно считать озвучивание произвольного текста, которое близко покачеству к естественному звучанию. Важно также и то, что это можно сделать врежиме реального времени даже на небольшом мобильном устройстве.
Синтезиспользуется в системах голосового самообслуживания банков, транспортныхкомпаний, в проведении телефонных опросов. Синтезированными голосами«говорят» мобильные устройства, озвучиваются аудиокниги. Синтезированнаяречь всё более уверенно становится частью повседневной жизни человека иобщества. В связи с этим проблема объективной оценки качества синтезированнойречи и сравнения речевых синтезаторов между собой приобретает особуюзначимость.Актуальность данной работы состоит в том, что именно селективный синтезречи, в англоязычных источниках называемый unit selection, в настоящее времяявляется общепризнанным методом получения качественной синтезированнойречи, наиболее близкой по звучанию к естественной. Этим обусловлено то, что приразработке большинства современных синтезаторов, особенно коммерческихприложений, используется именно этот метод.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.