Отзыв официального оппонента (авт. Исаев И. И.) (1101503)
Текст из файла
Отзыв о диссертации на соискание ученой степени кандидата филологических наук Елены Владимировны Моисеевой "Реализация гласных после мягких согласных на стыках слов в современном русском языке", специальность 10.02.01 - русский язык. Диссертация Е.В. Моисеевой посвящена одному их ключевых участков русской фонетической системы. Литературный вокализм находится под пристальным наблюдением лингвистов уже более века, но до сих пор предлагает задачи, требующие решения специалистов.
Один из таких ответов на вопрос о функционировании фрагмента безударного вокализма дает рецензируемая диссертация. Работа имеет установку на практическое применение результатов исследования, необходимых для создания и совершенствования систем автоматического распознавания и синтеза речи. Нужно заметить, что современные системы синтеза речи, такие как телекоммуникационный продукт ЦРТ (Центр речевых технологий, Ьпр:Пимж.вреес1зрго.гш') или Хиапсе (Ыр:/Мжъч.пиапсе.сопз!)„которым пользуются крупнейшие банки и операторы сотовой связи для генерации звучащих текстов из орфографических 1 "текст-в-речь" 1, имеют существенные недостатки в том числе в части реализации качества безударных гласных в неканонических случаях. Даже сложные артикуляционные модели американского исследователя Бреда Стори имеют существенные сложности, касающисся реализации такого «композита» как линейное сочетание звуков в речи.
Практическая часть диссертации Е.В. Моисеевой предваряется замечательной «историей вопроса» во введении и первой главе. Эта часть претендует на крайне содержательный и даже справочный по своему характеру раздел в учебнике фонетики. Автор дает все необходимые современные сведения не только о литературе„ которая поможет читателю понять место диссертационного исследования в кругу прочих фонетических трудов, но эти сведения также позволят расширить кругозор в области использования программ акустического анализа речи.
История вопроса, опубликованная отдельно, может быть крайне полезна студентамлннгвистам и филологам. После широкого вступления у читателя возникает вопрос о непосредственной сути самого диссертационного исследования и на с. 39 автор ставит яркую точку в определении значимости и места работы в ряду прочих фонетических проблем: «С одной стороны, позиция в начале слова способствует сохранению тембра гласного, с другой стороны, предшествующий мягкий согласный обусловливает изменение формантной структуры гласного. Изучение влияния взаимодействий этих 1 двух факторов на формантную структуру начального гласного слова является целью настоящей работы».
Детальное и весьма объемное описание множества факторов. влияннцих на качество гласного, формирует у читателя внутреннее переживание, так как хорошо известна сложность многофакторного описания гласных. Однако Елена Владимировна на с. 40 предлагает раз< раничение факторов и объясняет экспериментальную базу исследования: «Некоторые из них были учтены при подборе и анализе материала, а именно: положение по отношению к ударению. положение в сильной или слабой фразовой позиции, интонационное оформление высказывания, особенности идиолекта и пол диктора. Влияние остальных факторов — правого сегментного контекста, места образования предшествующего согласного, эмоционального состояния диктора — мы постарались максимально уменьшить». Спектрографический анализ и расчет формантных данных автор проводил силами программы акустического анализа звука РКААТ.
Так на с. 45 размещен рисунок б, осциллограмма и спектрограмма фрагмента слова о<ъалык в произношении диктора-женшины, где формантные переходы происходят скачкообразно. Эта особенность формантн ой структуры женских и детских голосов делает анализ формант затруднительным и заставляет отводить часть материала. Однако надо полагать, узкополосная спектрограмма с настройками шага анализа 0,0125 могла бы снять часть графических накладок.
В этом отношении не хватает данных о настройках параметра зрес1пип, а также Гоппап1, которые использованы автором. Настройки существенно влияют на выходные данные и знать их необходимо для понимания того, какой сигнал после обработки программой получил автор исследования. Стандартные настройки программы могут скрывать расположенные рядом форманты (или возникающие «паразитные» форманты), объединяя их в одну в окне спектрограммы„что приведет к «фантомному» браку материала. Не лучшее качество иллюстраций из программы Ргаа1 может быть отмечено также на рисунках 7-3. Иллюстрация 7, судя по спектру, представляет мужской скрипучий голос, форманты разбиты на равные кратки~ периоды. Такой материал не мешает глазу видеть формантные треки, но предъявляет особые требования к выбору места вычисления формант на треке, Рисунок 8 показывает речь женщины с низкой собственной энергией артикуляции, Это тихий голос, потому.
как совершенно верно замечает Е.В. Моисеева, формантные максимумы реализованы слабо или смазано. Высокий внешний шум и низкая энергия голоса делают иллюстрацию неубедительной с точки зрения качества картинки. Кроме того, в работе <смужские» картинки всегда громче, чем шумные «женские», что говорит о неудовлетворительных технических 2 условиях записи, которая, вероятно, выполнялась прямо на компьютер в программе Ргаа1.
Есть и другие вопросы по работе автора с программой акустического анализа звука. Эти вопросы имеют целью уточни~ь выбор способа подачи графического материала, но не должны приравниваться к фактическому замечанию. На с. 64, например, следует признать не совсем удачными иллюстрации из Ргаа1„сделанные в режиме фотографии основного рабочего экрана программы. На такой картинке отсутствует частотная разметка, чтение иллюстрации и определение формантных значений.
которое выполняет читатель глазом, превращается в гадание. Отсутствие качесз венных подписей также мешает читать текст. Преодолеть это несовершенство диалогового окна программы можно, используя вшитую функцию "~ехфгкГ' и "ргаа~ р)сгцге". При таком оформлении иллюстративный материал может стать более «дружелюбным» к чита~елю.
На с. 80 описывается методика подсчета результатов. то же и во второй главе. Выводы о формшггной структуре гласного строятся на средних арифметических значениях в произношении информантов, Несмотря на подобранный контекст и единообразное просодическое оформление звуковых фрагментов ~такова установка эксперимента) форманты могут иметь значительные расхождения от примера к примеру. К этому должны быть добавлены возможные ошибки расчета формант в программы Ргаап Насколько необходимо знать среднее арифметическое значение, игнорирующее частные отклонения". Продолжая разговор о некоторых технических недостатках работы.
стоит сказать, что на с. 56, например, смущают подписи к спектрам в орфографии. Хотя можно догадаться, что это сделано для удобства восприятия, но, тем не менее, этим стоит пренебречь, так как диссертация рассчитана на чтение специалистами. То же на с 96-97. "В СРЛЯ в первом предударном слоге в аосолютном ~ач~ле слова смыслоразличителыюй является оппозиция трех гласных 1а1, 1и), 1у~: унес — и нес — а нес 1ун'ос1— 1ин'ос1 — 1ан'ос~, а в позиции после мягкого согласного внутри слова— только двух: тюки — теки, люблю — леплю". Из-за отсутствия транскрипции в двух последних парах примеров может возникнуть ощущение, что орфографическая подача материала акцентирует различение гласных [у1- 1э). Есть и другие моменты, которые не совсем понятны и требуют разьяснения автором.
С.76. «Абсолютная частота формант гласного пепе рвого предударного слога приблизительно вычисляется по формуле Г14 1)— (Г(4 1с) — Е1ФГ" 1с))/2 в положении перед твердым заднеязычным согласным, но для положения между мягкими согласными эта формула нуждается в корректировке». Приблизительное вычисление по формуле, кажется.
затруднит ее применение. То же на с.87, таблицы 12-13. Описание таблиц говорит о том, что «Первая же форманта испытывает влияние не столь единообразное. вероятно, существуют и иные факторы, влияющие на ее частоту, кроме соседних согласных». В свете того, что актуальность работы определяется необходимостью исчерпывающего описания акустических свойств гласных звуков с целью создания систем автоматического распознавания и синтеза речи, слово ссвероятно» кажется в этом контексте чересчур осторожным и даже лишним. Следует признать неудачной формулировку одного из вводов к 4 главе 1с. 128).
"В идиолектах дикторов спектральные характеристики гласных на месте фонем <а>, <о> и гиперфонемы <а/о> сильно различаются, причем это различие сохраняется как в ударном, так и в безударном положении". Следуя этому выводу можно подумать, что существует различие в реализации фонем <о>, <а> и гиперфонемы <о/а>, то есть некое "оканье" в широком смысле, хотя ясно, что автор подразумевал совершенно иное явление.
Интерпретация некоторых данных вызывает вопрос. На с, 88: «Мягкий согласный предшествующего слова повышает значение Е2 на 35;4 в идиолекте диктора 1 и !5 — 18',4 в идиолекте диктора 2». Каким образом можно употребить столь широкие расхождения данных для автоматического распознавания и синтеза7 С чем связаны пробелы в табличных данных в приложении, что значит отсутствие релевантных примеров и не влияют ли они на статистическую картину в вычислении среднего значения'? Эти частные вопросы и замечания требуют ответа.
но не влияют на общее качество работы. В своих выводах автор следует внутренней логике развития исследования. Гипотеза о связи длительности гласного и качественной редукции рассматривается и отводится как нерабочая. Обычно же в диссертационных исследованиях даются лишь положительные выводы. Честная позиция отрицающего автора заслуживает всяческого одобрения: «Объяснить изменение спектральной картины гласного недостижением целевой артикуляции вследствие сокращения длительности в положении после согласного предшествующего слова на исследованном материале не удалось».
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.