Отзыв официального оппонента (авт. Кузнецов В. Б.) (Оценка качества селективного синтеза речи - методы и результаты)
Описание файла
Файл "Отзыв официального оппонента (авт. Кузнецов В. Б.)" внутри архива находится в следующих папках: Оценка качества селективного синтеза речи - методы и результаты, документы. PDF-файл из архива "Оценка качества селективного синтеза речи - методы и результаты", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст из PDF
отзывоф ициального оппонентао диссертации С олом енник Анны Ивановны«Оценка качества сел ективного синтеза речи: м етоды и результаты»,представленной на соискание ученой степеникандидата ф илологических наукпо специальности 10.02.21 Прикладная и математическая лингвистикаДиссертация Соломенник А.И. посвящена проблеме объективной оценкирезультатовработыАктуальностьселективных синтезаторовработыневызываетсомнений,речи длят.
к.русскогопосвященаязыка.наиболеераспространенным в настоящее время типам синтезаторов, и для русскогоязыка к настоящему времени недостаточно разработана.Предложенныеавторомметодыохватываютвсеэтапысинтеза,достаточно полно проанализированы в работе, что свидетельствует о хорошейинформированности автора в рассматриваемой области и его высоком уровнеквалификации в компьютерной лингвистике в целом.Диссертационная работа насчитывает 195 страниц, содержит 21 рисуноки22таблицы.В19приложенияхсодержатсятестовыетекстыдляпредложенных в диссертации способов оценки и результаты экспериментов.Вовведениикдиссертациисформулированаосновнаяцельисследования - разработать комплекс методов оценки качества селективногосинтеза речи на материале русского языка, и задачи, которые потребовалосьрешить в процессе ее достижения.
Материалом для исследования явиласьсинтезированнаяречь,полученнаяс помощью1несколькихсовременныхрусскоязычных селективных синтезаторов, список которых приведен автором.Также здесь обосновывается актуальность проделанной работы и отмечается еепрактическая значимость.
Материалы работы прошли апробацию на рядемеждународных конференций, проходивших с 2009 по 2015 гг. По темедиссертации опубликовано 16 научных работ, из них 14 статей, 7 из которыхопубликовано в журналах из перечня ВАК.Основной текст диссертации состоит из четырех глав, разбитых наразделы и содержащих краткие заключения.В первойглавеоченьподробноописанаисториясинтезаречи,применяемые решения в технологии синтеза в разные периоды развития,рассмотрено изменение целей задач, а также требований к качеству в процессесовершенствования данной технологии.
Отмечены факторы, влияющие наразвитие технологии синтеза: развитие техники, а также соответствующихразделов прикладнойи теоретической лингвистики. Отдельное вниманиеуделено перспективам развития технологии.Во второй главе дается описание технологии исследуемого в диссертацииселективного синтеза речи. Селективный синтез речи является разновидностьюконкатенативногосинтеза,тоестьпригенерацииречевогосигналаиспользуются заранее полученные звукозаписи естественной речи. Авторомотмечаются особенности этого синтеза по сравнению с другими применяемымиспособамиполучения синтезированнойречи. Сделанное описание этаповселективного синтеза позволяет выявить проблемы, которые отличают данныйтипсинтезаот других,чемобосновываетсянеобходимостьпроведенияспециальных видов тестов, разработанных с учетом этих особенностей, аналичиеобщихэтаповвразныхтехнологияхпозволяетиспользоватьразработанные ранее тесты.Также во второй главе приведен список синтезаторов речи для русскогоязыка, на основе которых были проведены эксперименты по тестированию.2Списокснабженособенностейописаниемполученияособенностейматериаловдляконкретныхтестирования,синтезаторовкоторыйиможетоказаться полезным в подобных исследованиях.Третья, основная, глава посвящена описанию структуры предлагаемойсистемы оценки качества селективного синтеза речи, дается обоснованиевозможности использования существующих методов оценки и необходимостиразработки специфических методов.
В первом разделе приводится списокзадач, которые позволяет решить разработанная система оценки качествасинтезированной речи. К ним относятся: тестирование системы синтеза впроцессе ее разработки, оценка собственной системы синтеза речи в сравнениис конкурентами, участие в конкурсах, проводимых независимыми компаниями.Вовторомразделеданнойглавырассматриваютсяметодыоценкиразборчивости речи.
Отдельное внимание в главе посвящено задаче, котораястановится наиболее важной на современном этапе развития синтезаторов речи-методамоценкиестественностисинтезированнойречи.Вработеподчеркивается тот факт, что наряду с субъективными методами оценки можетиспользоваться и инструментальная оценка, позволяющая оценить качествозвучания речи. К сожалению, в работе нет подробного описания и анализаспособов получения таких оценок.
В четвертом разделе главы «Методы оценкикачества селективного синтеза речи» обсуждаются факторы, влияющие навосприятиесинтезированнойречи человеком.К нимотносятся: условияокружения, ограничения, присущие системе обработки информации, которойобладает человек,опытиподготовленностьслушателя,лингвистическаяструктура сообщения, качество звука. В пятом разделе главы обосновываетсянеобходимость адаптации общих методов оценки качества к селективномусинтезуречи.специфическиеРечь,порождаемаяособенности.селективнымЭто,преждесинтезатором,всего,имеетнеравномерностьраспределения мест с неудачным звучанием: нередко отдельная фраза или еечасть звучит гораздо естественнее остальных, а при стыковке «гладких»3участков появляютсяпомехи.
Указанные особенности связаны с базовымалгоритмом выбора звуковых единиц. В данном разделе подчеркивается, чтоследует разграничивать причины возникновения ошибок в лингвистическойобработке, связанные с работой лингвистического процессора, и ошибки,появившиесявследствие неудачно подобранных звуковых элементов дляконкатенации. Для селективного синтеза невозможно, как, например, дляаллофонного или дифонного конкатенативного синтезатора, составить тест,содержащийвсеилибольшинствоэлементовегоречевойбазыдлятестирования их звучания, так как сегментные единицы языка (фонемы и ихаллофоны) в базе будут представлены не одним, а, возможно, сотнями илидаже тысячами вариантов.
В шестом разделе главы рассматривается общаяструктурасистемыкомплекснойоценкиселективногосинтезаречи.Всоответствующих подразделах рассматриваются тесты для отдельных модулейсинтезаторов, а также интегральной оценки качества синтезированной речи.Даютсяконкретныерекомендациипосоставлениюипроведениюсравнительного и диагностического тестирования синтезаторов.В четвертой, экспериментальной, главе описаны эксперименты и тесты,проведенные в диссертационном исследовании по оценке качества несколькихсовременных систем селективного синтеза речи на русском языке, даетсяанализ полученных результатов. Эксперименты проводились на материалахполученных с использованием современных русскоязычных синтезаторов речи.Первый эксперимент посвящен оценке влияния различных типов ошибокна общее качество синтезированной речи.
В нем делается попытка оценить,какиеошибкисинтезаторахпроблемынаиболеевысокогоприраспространеныкачествавосприятииикакиевизсинтезированнойсовременныхнихречи,селективныхвызываютнаибольшиезаставляяслушающихоценивать ее как менее естественную. Из проведенного теста автор делаетвывод, что ошибкиявляютсяглавнойв интонационном оформлении синтезированной речипроблемойсовременных4русскоязычныхселективныхсинтезаторовилингвистическойухудшениетестируемыесинтезаторыотличаютсяпокачествуи акустической обработки, причем большее влияние наестественностиимеютошибки,связанныеснеправильнойпостановкой словесного ударения и неверной транскрипцией.В следующем разделе обсуждается серия из нескольких тестов модулялингвистической обработки. Анализируется точность выделения предложений,оценка чтения аббревиатур, цифровых обозначений, специальных символов,иностранных слов на латинице и правильности определения места ударения.Общие результаты исследований, описанных в данном разделе, как и отмечаетавтор, являются безусловно ожидаемыми.
Отдельный раздел посвящен оценкемодуля фонетической обработки, в нем одновременно проверяется результатыработы просодической и фонетической обработки, при этом автор отмечает, чтобез доступа к результатам работы соответствующих модулей невозможнопротестировать правильность интонационной транскрипциинезависимо отрезультирующих физических характеристик речи. В данном разделе приводятсярезультаты тестов правильности сегментной транскрипции, паузирования иинтонации.