Отзыв ведущей организации (сост. Карпов А. А.) (Оценка качества селективного синтеза речи - методы и результаты)
Описание файла
Файл "Отзыв ведущей организации (сост. Карпов А. А.)" внутри архива находится в следующих папках: Оценка качества селективного синтеза речи - методы и результаты, документы. PDF-файл из архива "Оценка качества селективного синтеза речи - методы и результаты", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст из PDF
Федеральмое Гоетдаретаеммое би3да4етмое ~~ч р4якдемме ма3 км Самкт-Петерб~рГекмй аметист миформатмкм и аатоматм3аммм Роеемйекой академмм Наук (СПНИРАН) 194178, С44п-Пенр4314. 14 ж4444, 439. Фжс 14131328-445а Т444Ф 12В23-3311; Еляйуй44 а ЙМ ъГК44 ОТЗЫВ Диссертациа А. И. Соломенник посаащенз проблеме оцеики кзчестаз синтезироайинОЙ комп3иотером речи. В фок3'се исследоааниЯ находятся соаременн1ае р~сскоязычнме синтеааторы речи Вь3сокОГО КЗЧЕСТВЗ, ИСПОЛЬЗЗИЗПЗИЕ ТЕХМОЛОГЗПО СЕЛЕКТИВНОГО СИНТЕЗЗ РЕЧИ.
Диссертзпиа имеет ме3кдисциплинзрный характер и (1бьединает исследоазниЯ В Области прикладной и математическом ЯННГВистики, 3КСПЕРИМЕНТЗЛЬНОИ фоНЕ*ИКИ, МмфОРМЙТИКН и ЙВТОМЙТИТИРОВЙННМХ речеаых тех34ОДОГий, Актуальность данной работы обусловлена, прежде всего, тем, что селективный (англ. "ипИ зе1есбоп") синтез речи в настоящее время является одним из основных методов получения качественной синтезированной речи, близкой по звучанию к естественной. Таким образом, обращение к специфическим особенностям звучания речи, получаемой при помощи селективного метода, является одной из основных задач при оценке качества работы современных синтезаторов речи. Новизна исследования заключается в том, что для русского языка впервые были предложены и применены методики комплексной оценки современных селективных синтезаторов речи, а также предложена система тестовых данных, использующихся в методе.
Тот факт, что автор учитывает комплексное влияние различных факторов на качество звучания синтезированной речи, а также отечественный и зарубежный опыт подобных исследований, придает рецензируемой работе теоретическую значимость. Возможность использовать предложенные методы для оценки и сравнения между собой современных синтезаторов русской речи высокого качества обуславливает практическую значимость работы. Кроме того, в рассматриваемой диссертации предложены конкретные рекомендации по тестированию и сравнению синтезаторов, а также приводятся использованные в экспериментах тестовые материалы и опросники для проведения комплексной оценки лексических и акустических модулей синтезаторов речи. К достоинствам диссертации А.И.Соломенник можно отнести четкую постановку цели и задач исследования, среди которых следует отметить описание существующих проблем и методов оценки качества синтеза речи с анализом и обобщением результатов предыдущих исследований, обоснование необходимости специального подхода к оценке селективного синтеза с учетом его характерных особенностей, разработку методов оценки синтеза речи, позволяющих объективно оценивать и сравнивать современные селективные синтезаторы русской речи и апробацию предложенных методов для комплексной оценки нескольких современных русскоязычных синтезаторов.
Несомненным достоинством диссертационной работы является выбор. и объем речевого материала для исследования, включающий синтезированную речь, полученную с использованием нескольких современных русскоязычных селективных синтезаторов (Асаре1а, БреесЬ, 1чопа ТТЗ, Магу ТТБ, Ьос1иепдо ТТЯ, %апсе Чоса11кег, Ч1~а1Чо1се ТТЯ), общим объемом более 4 часов речи. Структурно работа состоит из введения, четырех глав, заключения, обширного списка литературы из 104 наименований и 19 приложений, содержащих разработанные автором тестовые текстовые материалы и подробные результаты экспериментов. Во введении к диссертации дается краткая характеристика работы, обосновывается ее актуальность, новизна, теоретическая и практическая значимость, В главе 1 «История синтезаторов речи и современные разработки» рассматривается теоретическая база, лежащая в основе компьютерной технологии синтеза речи, а также история создания синтезаторов речи и требований к их качеству.
Обсуждается современное состояние данной речевой технологии, перспективы ее развития и изменения в методах оценки качества синтезированной речи. Глава 2 «Селективный синтез речи» описывает особенности способа синтеза, исследуемого в диссертации, в ней также приводятся данные по современным русскоязычным селективным синтезаторам, описывается обобщенная структура селективного синтезатора. В основной главе 3 «Методы оценки качества селективного синтеза речи» описываются существующие методы и способы оценки качества синтезированной речи, предлагается структура системы оценки качества селективного синтеза речи, дается обоснование необходимости разработки соответствующих оценочных методов. Автор приводит рекомендации по составлению и проведению сравнительного и диагностического тестирования синтезаторов.
В главе 4 <<Результаты оценки качества селективного синтеза речи» описаны выполненные автором эксперименты и тесты, проведенные в диссертационном исследовании по оценке качества нескольких современных систем селективного синтеза русской речи, дается анализ полученных результатов. При проведении экспериментов материалом послужила синтезированная речь, полученная с использованием нескольких современных русскоязычных синтезаторов речи, большинство из которых являются коммерческими программами, что наложило определенные ограничения на длительность и качество тестируемых речевых записей.
Основное содержание этой главы посвящено серии из 12 экспериментов по оценке качества работы различных модулей синтезаторов. На основании полученных результатов автор делает вывод о том, что при использовании диагностических тестов отдельных модулей синтезатора невозможно однозначно определить лучшую систему синтеза русской речи, так как для разных задач использования синтезаторов, критичными могут оказаться различные показатели. В то же время проведенные тесты указывают на слабые стороны доступных систем, которые требуют той или иной доработки . Подобные тестымогут существенно улучшить качество систем синтеза речи, что также является практическим результатом работы.
Отметим достаточно большое количество графиков и таблиц в данной части работы, в которых представлены результаты проведенных экспериментов; их наличие в значительной степени облегчает восприятие текста. При всех своих неоспоримых достоинствах диссертация не лишена ряда недостатков, которые следует указать: 1. Из диссертации следует, что автор, к сожалению, не знакома с ГОСТ Р 52873-2007 «Синтезаторы речи для специальных компьютерных рабочих мест для инвалидов по зрению.
Технические требования», который применяется в РФ с 2008 г. и описывает основные характеристики и технические требования, предъявляемые к компьютерным синтезаторам русской речи. 2. Для проведения исследований привлекалась пара десятков аудиторов-носителей русского языка, однако, среди них не было людей с нарушениями зрения и незрячих, а, как известно из практики, такие люди обладают более развитой слуховой системой, чем обычные люди, и более тонко воспринимают неточности в синтезированном звуковом сигнале. 3. Среди основных критериев оценки качества синтезаторов речи автор не выделила возможность настройки параметров компьютерной системы под пользователя, хотя для многих людей оказывается необходимым изменение стандартных значений темпа речи, частоты основного тона, интонации и т.д.
для лучшего восприятия синтезируемой компьютером речи. 4. Считаем, что не совсем точно сформулирована тема диссертации «Оценка качества селективного синтеза речи: методы и результаты», так как в мире уже разработано достаточно много различных методов для оценки качества синтеза речи и получено множество результатов для ряда мировых языков, автор же занималась только оценкой синтезаторов русской речи.
5. В диссертации отсутствует подраздел 4.6. Представленные выше замечания являются существенными, но не снижают общей актуальности и научной значимости представленных в диссертации методик оценки и полученных результатов, что позволяет оценить диссертационную работу А. И. Соломенник положительно. Сведения о составителе отзыва ведущей организации: Карпов Алексей Анатольевич, доктор технических наук, доцент, заведующий лабораторией речевых и многомодальных интерфейсов СПИИРАН, 199178, Санкт-Петербург, 14-я линия, дом 39, Ьпр:// вил.зршаз.пю.ги, Ькроч®п1аз.арЬ.аи, +7 812 3280421 Публикации составителя отзыва, близкие теме диссертации соискателя: Карпов А.А., Железны М.
Двуязычная многомодальная система для аудиовизуального синтеза речи и жестового языка по тексту // Научно-технический вестник информационных технологий, механики и оптики. СПб: ИТМО, № 5, 2014, С. 92-98. Карпов А. А., Верходанова В. О. Речевые технологии для малоресурсных языков мира // Вопросы языкознания. М.: Наука, № 3, 2015, С. 117-135. Кыроч А., Маг1соч К., К1руайоча 1., ЧакЬешпа О., КопкЫп А. ?.агяе чосаЬи1агу Кыа1ап ареесЬ гесо8п1поп мял аутйасйсо-а1айзйса1 1ащра8е тоде11п8 // БреесЬ Сопппишсат1оп. Е1аетлег, 2014, чо1. 56, рр. 213-228. .