Автореферат (1101008), страница 4
Текст из файла (страница 4)
Для точной оценки правильностиинтонационнойсинтезаторов,транскрипциинедоступныепринеобходимыпромежуточныетестированиикоммерческихданныесистемсиспользованием демо-версий. Также следует отметить, что, в отличие от оценкилингвистической обработки, нельзя обобщать данные, полученные для одногоголоса, на всю систему синтеза. Например, для различных голосов синтезатораVitalVoiceTTS процент фраз с ошибками варьируется от 34 до 41, что можетобъясняться как размером речевой базы для конкретного голоса, так иособенностями чтения конкретного «диктора-донора».Вчетвёртомразделе«Оценкаакустическойобработки»даютсярекомендации по оценке модуля выбора звуковых элементов из речевой базы имодуля модификации, провести которые не представляется возможным сиспользованием демо-версий синтезаторов.18Заключительный пятый раздел посвящен обсуждению интегральнойоценкикачествасинтезированнойречи,описываетсяэкспериментпосравнительной оценке качества речи по ГОСТ Р 50840-95 «Передача речи потрактам связи.
Методы оценки качества, разборчивости и узнаваемости», а такжеприводятся данные по зависимости оценок от «знакомства» аудиторов с синтезомречи.Ниже в таблице 2 приведены общие результаты по всем экспериментам,описанным в четвёртой главе. На основании диагностических тестов отдельныхмодулей синтезатора нельзя определить наилучшую систему синтеза речи, так какдля различных задач использования синтезаторов, критичными могут оказатьсяразличные показатели, даже те, которые не обсуждались в данной главе(например, степень устойчивости синтеза речи к шумовым помехам или качестворечи в телефонном канале).
Даже система Mary TTS, показавшая самый плохойрезультат практически по всем тестам, обладает одним несомненнымпреимуществом – открытым доступом к исходному коду программы и,следовательно, возможностью улучшения и настройки синтезатора подопределённую задачу. В то же время проведённые в настоящей работе тестыуказывают на слабые стороны, которые требуют той или иной доработки дляразличных систем синтеза и могут существенно улучшить их качество иэффективность.Таблица 2. Сводная таблица результатов тестов, проведенных для оценкиуспешности выполнения системами синтеза речи различных задачСистемасинтезаAcapelaiSpechIvonaMaryLoquendoГолосAlyonaFemalevoiceTatyanaMalevoiceOlgaKatyaMilenaАннаВладимирЮлияВыделениепредложений(%)--100----100--Графическиесокращения(%)5228320-40---7919Nuance VocalizerVitalVoiceАббревиатуры (%)827478--75---99Цифровыеобозначения(%)6259630-62---83Специальныесимволы (%)9533710-43---81Английскиеслова (%)10015260-74---93Омографы(%)66795746-61---98Транскрипция(%)88446344-50---88Места пауз(%)--100----100--Точностьинтонации(%)72---70-71-7777Естественностьинтонации(%)59---49-65-7270Качество поГОСТу(баллы)---------4,5В заключении даётся краткая характеристика основных разделов работы,приводятся основные результаты, полученные в ходе рамках диссертационногоисследования, обсуждаются перспективы дальнейшей разработки темы.ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫВ рамках диссертационного исследования получены следующие основныерезультаты:1.
Произведено описание и анализ существующих методов оценки качествасинтезированной речи.202. Обоснована необходимость специального подхода к оценке селективногосинтеза речи, учитывающая его специфические особенности.3. Предложена система методов оценки, адаптированных для селективногосинтеза речи.4. Подготовлены тестовые тексты и опросники для проведения комплекснойоценки различных модулей синтезаторов речи на основе предложенной в работесистемы оценочной процедуры.5. Произведенокомплексноетестированиерусскоязычныхселективныхсинтезаторов и получены оценки качества речи, синтезируемой с ихиспользованием.Дальнейшие исследования по данной тематике наиболее актуальны вследующих направлениях: оценка качества статистического параметрическогосинтезаречи,инструментальнаяавтоматизированнаяоценкакачествасинтезаторов речи, оценка выразительности и эмоциональности синтезированнойречи, оценка точности воспроизведения особенностей речи конкретного дикторадонора.
Полезным направлением могло бы стать также проведение независимогоконкурса синтезаторов речи на материале русского языка, что, к сожалению,трудно осуществить, так как большинство разработчиков современныхсинтезаторов речи высокого качества являются зарубежными компаниями, длякоторых разработка и совершенствование русскоязычного синтеза не всегдаявляется приоритетной задачей.По теме диссертации опубликованы следующие работы:1. Соломенник А.
И. Структура системы оценки качества синтезированнойрусской речи // Структурная и прикладная лингвистика. — Вып. 10. —СПб, 2013. — С. 251–266.2. Соломенник А. И. Технология синтеза речи: история и методологияисследований // Вестник Московского университета. Сер. 9. Филология.— 2013. — № 6. — С. 149–162.213. Соломенник А. И., Чистиков П. Г., Рыбин С. В., Томашенко Н. А.Автоматизация процедуры подготовки нового голоса для системысинтеза русской речи // Изв. вузов. Приборостроение.
Тематическийвыпуск "Речевые информационные системы". — 2013. — №2. — С. 29–32.4. Соломенник А. И., Таланов А. О., Соломенник М. В., Хомицевич О. Г.,Чистиков П. Г. Оценка качества синтезированной речи: проблемы ирешения // Изв. вузов. Приборостроение. Тематический выпуск "Речевыеинформационные системы". — 2013. — №2. — С. 38–42.5. Чистиков П. Г., Корольков Е.А., Таланов А.
О., Соломенник А. И.Гибридная технология синтеза русской речи на основе скрытыхМарковских моделей и алгоритма Unit Selection // Изв. вузов.Приборостроение. Тематический выпуск "Речевые информационныесистемы". — 2013. — №2. — С. 33–38.6. Чистиков П. Г., Таланов А. О., Захаров Д. С., Соломенник А. И.Технология синтеза естественной речи с использованием базы данныхнебольшого объема // Научно-технический вестник информационныхтехнологий, механики и оптики. — №4 (91) — 2014. — С. 83–97.7. Solomennik A. I., Cherentsova A.
E. A Method for Auditory Evaluation ofSynthesized Speech Intonation // Miloš Železný et al. (Eds.): SPECOM 2013,Lecture Notes in Artificial Intelligence 8113. — Springer, 2013. — P. 9–16.8. Продан А. И., Корольков Е. А., Опарин И. В., Таланов А. О. Особенностииспользования многоуровневой разметки звукового корпуса // Компьютернаялингвистика и интеллектуальные технологии: По материалам ежегоднойМеждународной конференции «Диалог 2009» (Бекасово, 27-31 мая 2009 г.).Вып. 8 (15). – М.: РГГУ, 2009.
— С. 415–419.9. Продан А. И., Таланов А. О., Чистиков П. Г. Система подготовки нового голосадля системы синтеза «VitalVoice» // Компьютерная лингвистика иинтеллектуальные технологии: По материалам ежегодной Международнойконференции «Диалог» (Бекасово, 26–30 мая 2010 г.). Вып. 9 (16). — М.: Издво РГГУ, 2010. — С. 394–399.10. Соломенник А. И. Зависимость естественности звучания синтезированнойречи от наличия ошибок различных типов // Актуальные проблемыфилологической науки: взгляд нового поколения.
Доклады участников ХХ–ХХI Международных конференций студентов, аспирантов и молодых ученых«Ломоносов». Секция «Филология». Вып. 6. — Изд. Московскогоуниверситета, 2015. — С. 475–480.11. Соломенник А. И. Особенности оценки качества селективного синтеза речи.Актуальные вопросы теоретической и прикладной фонетики // Сборник статей22к юбилею О. Ф. Кривновой / Под ред. А. В.
Архипова, И. М. Кобозевой,Кс. П. Семёновой. — М.: ООО «Буки-Веди», 2013. — С. 336–341.12. Соломенник А. И. Ошибки и дефекты синтезированной речи: типы,частотность и влияние на естественность звучания // МатериалыМеждународного молодежного научного форума «ЛОМОНОСОВ-2014» / Отв.ред. А. И. Андреев, Е. А. Антипов. [Электронный ресурс] — М.: МАКС Пресс,2014. — 1 электрон. опт. диск (CD-ROM).13. Соломенник А. И. Технология синтеза речи в историко-методологическомаспекте. Речевые технологии.
— №1, — 2013. — С. 42–57.14. Solomennik A. An influence of defects in synthesized speech on its naturalness //2nd International Scientific Conference CONTEMPORARY RESEARCH INPHONETICS AND PHONOLOGY: METHODS, ASPECTS AND PROBLEMS.Abstracts [Электронный ресурс]. — Riga, 2015.
— P. 22. — Режим доступа:http://www.lulavi.lv/media/upload/tiny/files/Abstracts_%20Phon%202015.pdf.15. Solomennik A., Chistikov P. Automatic generation of text corpora for creating voicedatabases in a Russian text-to-speech // Компьютерная лингвистика иинтеллектуальные технологии: По материалам ежегодной Международнойконференции «Диалог». — М.: Изд-во РГГУ, 2012. — Вып.11 (18). — С. 607–615.16. Solomennik A. I., Chistikov P. G. Evaluation of naturalness of synthesized speechwith different prosodic models // Компьютерная лингвистика иинтеллектуальные технологии: По материалам ежегодной Международнойконференции «Диалог».
— М.: Изд-во РГГУ, 2013. — Вып. 12 (19). — Т. 2. —С. 31–38.23Подписано в печать: 19.03.2016Объем: 1,0 усл.п.л.Тираж: 100 экз. Заказ № 1539Отпечатано в типографии «Реглет»125315, г. Москва, Ленинградский проспект д. 74, корп. 1+7(495) 790-47-77 www.reglet.ru.











