Отзыв официального оппонента (авт. Кузнецов В. Б.) (1101004)
Текст из файла
отзывоф ициального оппонентао диссертации С олом енник Анны Ивановны«Оценка качества сел ективного синтеза речи: м етоды и результаты»,представленной на соискание ученой степеникандидата ф илологических наукпо специальности 10.02.21 Прикладная и математическая лингвистикаДиссертация Соломенник А.И. посвящена проблеме объективной оценкирезультатовработыАктуальностьселективных синтезаторовработыневызываетсомнений,речи длят.
к.русскогопосвященаязыка.наиболеераспространенным в настоящее время типам синтезаторов, и для русскогоязыка к настоящему времени недостаточно разработана.Предложенныеавторомметодыохватываютвсеэтапысинтеза,достаточно полно проанализированы в работе, что свидетельствует о хорошейинформированности автора в рассматриваемой области и его высоком уровнеквалификации в компьютерной лингвистике в целом.Диссертационная работа насчитывает 195 страниц, содержит 21 рисуноки22таблицы.В19приложенияхсодержатсятестовыетекстыдляпредложенных в диссертации способов оценки и результаты экспериментов.Вовведениикдиссертациисформулированаосновнаяцельисследования - разработать комплекс методов оценки качества селективногосинтеза речи на материале русского языка, и задачи, которые потребовалосьрешить в процессе ее достижения.
Материалом для исследования явиласьсинтезированнаяречь,полученнаяс помощью1несколькихсовременныхрусскоязычных селективных синтезаторов, список которых приведен автором.Также здесь обосновывается актуальность проделанной работы и отмечается еепрактическая значимость.
Материалы работы прошли апробацию на рядемеждународных конференций, проходивших с 2009 по 2015 гг. По темедиссертации опубликовано 16 научных работ, из них 14 статей, 7 из которыхопубликовано в журналах из перечня ВАК.Основной текст диссертации состоит из четырех глав, разбитых наразделы и содержащих краткие заключения.В первойглавеоченьподробноописанаисториясинтезаречи,применяемые решения в технологии синтеза в разные периоды развития,рассмотрено изменение целей задач, а также требований к качеству в процессесовершенствования данной технологии.
Отмечены факторы, влияющие наразвитие технологии синтеза: развитие техники, а также соответствующихразделов прикладнойи теоретической лингвистики. Отдельное вниманиеуделено перспективам развития технологии.Во второй главе дается описание технологии исследуемого в диссертацииселективного синтеза речи. Селективный синтез речи является разновидностьюконкатенативногосинтеза,тоестьпригенерацииречевогосигналаиспользуются заранее полученные звукозаписи естественной речи. Авторомотмечаются особенности этого синтеза по сравнению с другими применяемымиспособамиполучения синтезированнойречи. Сделанное описание этаповселективного синтеза позволяет выявить проблемы, которые отличают данныйтипсинтезаот других,чемобосновываетсянеобходимостьпроведенияспециальных видов тестов, разработанных с учетом этих особенностей, аналичиеобщихэтаповвразныхтехнологияхпозволяетиспользоватьразработанные ранее тесты.Также во второй главе приведен список синтезаторов речи для русскогоязыка, на основе которых были проведены эксперименты по тестированию.2Списокснабженособенностейописаниемполученияособенностейматериаловдляконкретныхтестирования,синтезаторовкоторыйиможетоказаться полезным в подобных исследованиях.Третья, основная, глава посвящена описанию структуры предлагаемойсистемы оценки качества селективного синтеза речи, дается обоснованиевозможности использования существующих методов оценки и необходимостиразработки специфических методов.
В первом разделе приводится списокзадач, которые позволяет решить разработанная система оценки качествасинтезированной речи. К ним относятся: тестирование системы синтеза впроцессе ее разработки, оценка собственной системы синтеза речи в сравнениис конкурентами, участие в конкурсах, проводимых независимыми компаниями.Вовторомразделеданнойглавырассматриваютсяметодыоценкиразборчивости речи.
Отдельное внимание в главе посвящено задаче, котораястановится наиболее важной на современном этапе развития синтезаторов речи-методамоценкиестественностисинтезированнойречи.Вработеподчеркивается тот факт, что наряду с субъективными методами оценки можетиспользоваться и инструментальная оценка, позволяющая оценить качествозвучания речи. К сожалению, в работе нет подробного описания и анализаспособов получения таких оценок.
В четвертом разделе главы «Методы оценкикачества селективного синтеза речи» обсуждаются факторы, влияющие навосприятиесинтезированнойречи человеком.К нимотносятся: условияокружения, ограничения, присущие системе обработки информации, которойобладает человек,опытиподготовленностьслушателя,лингвистическаяструктура сообщения, качество звука. В пятом разделе главы обосновываетсянеобходимость адаптации общих методов оценки качества к селективномусинтезуречи.специфическиеРечь,порождаемаяособенности.селективнымЭто,преждесинтезатором,всего,имеетнеравномерностьраспределения мест с неудачным звучанием: нередко отдельная фраза или еечасть звучит гораздо естественнее остальных, а при стыковке «гладких»3участков появляютсяпомехи.
Указанные особенности связаны с базовымалгоритмом выбора звуковых единиц. В данном разделе подчеркивается, чтоследует разграничивать причины возникновения ошибок в лингвистическойобработке, связанные с работой лингвистического процессора, и ошибки,появившиесявследствие неудачно подобранных звуковых элементов дляконкатенации. Для селективного синтеза невозможно, как, например, дляаллофонного или дифонного конкатенативного синтезатора, составить тест,содержащийвсеилибольшинствоэлементовегоречевойбазыдлятестирования их звучания, так как сегментные единицы языка (фонемы и ихаллофоны) в базе будут представлены не одним, а, возможно, сотнями илидаже тысячами вариантов.
В шестом разделе главы рассматривается общаяструктурасистемыкомплекснойоценкиселективногосинтезаречи.Всоответствующих подразделах рассматриваются тесты для отдельных модулейсинтезаторов, а также интегральной оценки качества синтезированной речи.Даютсяконкретныерекомендациипосоставлениюипроведениюсравнительного и диагностического тестирования синтезаторов.В четвертой, экспериментальной, главе описаны эксперименты и тесты,проведенные в диссертационном исследовании по оценке качества несколькихсовременных систем селективного синтеза речи на русском языке, даетсяанализ полученных результатов. Эксперименты проводились на материалахполученных с использованием современных русскоязычных синтезаторов речи.Первый эксперимент посвящен оценке влияния различных типов ошибокна общее качество синтезированной речи.
В нем делается попытка оценить,какиеошибкисинтезаторахпроблемынаиболеевысокогоприраспространеныкачествавосприятииикакиевизсинтезированнойсовременныхнихречи,селективныхвызываютнаибольшиезаставляяслушающихоценивать ее как менее естественную. Из проведенного теста автор делаетвывод, что ошибкиявляютсяглавнойв интонационном оформлении синтезированной речипроблемойсовременных4русскоязычныхселективныхсинтезаторовилингвистическойухудшениетестируемыесинтезаторыотличаютсяпокачествуи акустической обработки, причем большее влияние наестественностиимеютошибки,связанныеснеправильнойпостановкой словесного ударения и неверной транскрипцией.В следующем разделе обсуждается серия из нескольких тестов модулялингвистической обработки. Анализируется точность выделения предложений,оценка чтения аббревиатур, цифровых обозначений, специальных символов,иностранных слов на латинице и правильности определения места ударения.Общие результаты исследований, описанных в данном разделе, как и отмечаетавтор, являются безусловно ожидаемыми.
Отдельный раздел посвящен оценкемодуля фонетической обработки, в нем одновременно проверяется результатыработы просодической и фонетической обработки, при этом автор отмечает, чтобез доступа к результатам работы соответствующих модулей невозможнопротестировать правильность интонационной транскрипциинезависимо отрезультирующих физических характеристик речи. В данном разделе приводятсярезультаты тестов правильности сегментной транскрипции, паузирования иинтонации.
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.