Диссертация (1173184), страница 18
Текст из файла (страница 18)
1998]. В то же время отмечена возможная зависимость тайминга оттонального контекста, в частности, от наличия акцентно-выделенных тоновна соседних слогах [Arvaniti etc. 1998].4. Время минимума – координата минимального значения в процентахот общей длительности выделенного фрагмента (соответствует параметру«тайминг»).Значение конечной минимальной частоты, взятое в конечной точкенисходящего завершения высказывания, традиционно считается наиболеестабильным реализационным параметром ЧОТ [Научно-технический отчет2008; Научно-технический отчет 2011]. Можно привести достаточноеколичество научных работ, в которых экспериментально доказана низкаявариативность значения конечного минимума для конкретного диктора как вчтении, так и в спонтанной речи [Ladd 1996; Maeda 1976; Menn 1982;Liberman, Pierrehumbert 1984; Connell, Ladd 1990].Время минимума, так же как и время максимума, соответствуетпараметру «тайминг», используемому в модуле SIS II при анализе кривойЧОТ (мелодического контура), и измеряется в процентах от длительностианализируемого фрагмента контура [Научно-технический отчет 2008;Научно-технический отчет 2011].
При исследовании английской устнойМ. Эшби пришел к выводу о том, что как собственно минимальное значениеЧОТ, так и время минимума у каждого из дикторов проявляет высокуюстабильность [Ashby 1978]. Частичное подтверждение этому можно найти в102работах Ф. Нолана: если для тайминга минимума предъядерного подъемавнутридикторская вариативность превысила междикторскую, то таймингминимума конечного ядерного подъема является достаточно информативнойхарактеристикой [Nolan 2002].5.
Интервал – разница между максимальным и минимальнымзначением ЧОТ (в Гц и в полутонах - ПТ).Параметр разницы между максимальным и минимальным значениемЧОТявляется информативным индивидуализирующим признаком приусловии стилистической сопоставимости сравниваемых фонограмм [Научнотехнический отчет 2008; Научно-технический отчет 2011]. Установлено, чтов речи одного диктора проявляется относительная стабильность в степениобщей вариативности ЧОТ и в локальных интервалах основного тона.Однако изменение физического или эмоционального состояния говорящего,равно как и изменение коммуникативной направленности сообщения, можетсущественно изменить вариативность ЧОТ, что повлияет на оценкулокальных интервалов [Златоустова, Потапова 1997; Потапова, Потапов2015; Connell, Ladd 1990; Ladd 1996].Для оценки интервалов, а также для оценки скорости измененияосновного тона в качестве единиц используются как герцы (Гц), так иполутона (ПТ) [Научно-технический отчет 2008; Научно-технический отчет2011].
Разница между максимальным и минимальным значениями ЧОТкаждого конкретного высказывания определяется автоматически. Переводцифровых показателей ЧОТ, выраженных в герцах (Гц), в полутоны (ПТ)позволяет наиболее объективно оценивать близость интервалов основноготона, а также упрощает приспособление пороговых значений к различиям ввысоте голоса (мужской-женский) [Смирнова 2007].6. Время половинной частоты – координата значения половиннойчастоты (от интервала между максимумом и минимумом) в процентах отобщей длительности выделенного фрагмента [Научно-технический отчет2008; Научно-технический отчет 2011].103Данный параметр как достаточно информативный признак былпредложен Ф. Ноланом [Nolan 2002].
В проводимом им исследовании голосаи речи носителей английского языка внутридикторская вариативность попараметру «относительная время половинной частоты» оказалась почти в 4раза ниже междикторской, что может быть сопоставимо с различительнойфункцией формант [Nolan 2002].7. Среднее значение ЧОТ – среднее значение частоты основного тона (вГц) в пределах выделенного сегмента.СреднеезначениеЧОТтрадиционносчитаетсясущественнымпризнаком при идентификационном исследовании речи [Златоустова,Потапова 1997; Потапова, Михайлов 2012; Потапова, Потапов 2015; Connell,Ladd 1990; Ladd 1996; Nolan 2002 и др.].
Среднее значение ЧОТхарактеризуется, как правило, достаточно высокой степенью междикторскойвариативности, поскольку зависит от индивидуальной длины голосовыхсвязок.Наибольшую сложность для идентификационного исследования голосаи речи представляют ситуационно обусловленные различия в среднемзначении ЧОТ, вызванные, например, несоответствием физического иэмоционального состояния говорящего, условий записи, речевого стиля икоммуникативнойситуации[Златоустова,Потапова1997;Потапова,Михайлов 2012; Потапова, Потапов 2015; Connell, Ladd 1990; Ladd 1996;Nolan 2002 и др.].В исследовании И.
Вагнера и С. Гфроерера экспериментальносравнивались средние значения ЧОТ, полученные на прочитанном материалев лабораторных условиях, со значениями ЧОТ на реальных фонограммах,поступающих для производства экспертизы. В результате было установлено,что если для речи взрослых мужчин в лабораторных условиях среднеезначение ЧОТ варьируется в диапазоне 117-121 Гц, то среднее значение ЧОТна фонограммах, полученных в реальных условиях звукозаписи, составляет144 Гц [Gfroerer, Wagner 1995].
Таким образом, в большинстве случаев104среднее значение ЧОТ голоса на реальной фонограмме оказываетсясущественно выше среднего значения ЧОТ на речевом образце, полученномв лабораторных условиях.Различия в средних значениях ЧОТ в зависимости от степенигромкости исследовались в работах М. Джэссена, О. Кёстера и С. Гфроерера.Они сравнивали спонтанную речь и чтение в нейтральном стиле подвоздействиемтакназываемоголомбард-эффекта[Jessen,Köster,Gfroerer 2005].
Помимо вполне предсказуемого вывода о неизменномувеличении среднего значения ЧОТ у всех «дикторов» при увеличениигромкости (как при чтении, так и при спонтанном произнесении), авторыисследования установили, что степень увеличения среднего значения ЧОТотличается у разных дикторов, поэтому при заданном увеличении амплитудыкрайне трудно предсказать, насколько увеличится среднее значение ЧОТ уконкретного диктора [Jessen, Köster, Gfroerer 2005].Такая сильная зависимость средних значений ЧОТ от различныхфакторов влияния привела ряд исследователей [Jessen, Köster, Gfroerer 2005;Kraayeveld 1997] к выводу о целесообразности использования приидентификационных исследованиях не просто среднего значения ЧОТ, азначения коэффициента вариативности для этого параметра.Исследования,проводимыенаматериалеанглийскогоязыка[Hudson etc.
2007], показали следующее распределение средних значенийЧОТ в большой однородной группе «дикторов»: 60% «дикторов» имеютсредние значения ЧОТ в пределах интервала в 20 Гц (допустимаявариативность для одного диктора), из чего следует, что совпадениезначений, попадающих в данный интервал, имеет значимость не более 40%,то есть малоинформативно для идентификации [Hudson etc. 2007]. В то жевремя значимость совпадения значений, выходящих за пределы данногоинтервала, растет по мере удаления от центра распределения значений.
Какотмечают исследователи, данная ситуация, вероятно, характерна для любойязыковой общности [Hudson etc. 2007].1058. Скорость изменения ЧОТ – средняя скорость убывания иливозрастания частоты основного тона на выделенном участке контура в пт/сек.Скорость изменения (повышения или понижения) частоты основноготонасоответствуетописательномупараметру«крутизна»[Научно-технический отчет 2008; Научно-технический отчет 2011]. На скоростьизмененияЧОТнаибольшеевлияниеоказываютэмоциональнаянасыщенность высказывания, особенности коммуникативной ситуации, атакже сопоставимость по длительности и направлению кривой ЧОТанализируемого сегмента [Смирнова 2007].
Таким образом, наиболееоптимальными для сравнения являются сопоставимые по сегментномуконтексту восходящие или нисходящие ядерно-заядерные участки сзаядерными слогами, позволяющие выявить индивидуальные особенности вскорости повышения или понижения тона.На материале таджикской и цыганской речи в рамках настоящегоисследованиябылоперспективнымиустановлено,длячтоидентификационногонаиболеесравнениястабильнымиявляютсяитакназываемые «физические» параметры, связанные со значениями ЧОТ (впервую очередь – минимальное значение ЧОТ ядерного восходящего иядерного нисходящего тонов, а также значения средней, начальной, конечнойЧОТ).
Остальные же описанные параметры (время максимума, времяминимума, время половинной частоты, интервалы и скорость изменениятона) обладают невысокой различительной способностью. Использованиеэтих параметров при идентификации говорящего может быть релевантно втех случаях, когда в речи «диктора» стабильно наблюдаются ярковыраженные отличия от типичного характера реализации того или иногопризнака. Один из таких случаев проиллюстрирован гистограммой,приведенной на рис.
11 [Научно-технический отчет 2008; Научнотехнический отчет 2011].106Рис. 11 Среднее значение интервала восходящей ЧОТ на контрольной(спорной) и опорной (образцовой) фонограммах (в Гц).На гистограмме показаны значения интервала ядерного подъема в Гцдля 10 «дикторов», говорящих на таджикском (N = 5) и на цыганском (N = 5)языках, каждый на двух фонограммах– контрольной (спонтаннаядиалогическая речь) и опорной (квазиспонтанная монологическая речь). Какпродемонстрировано на гистограмме, разница между максимальным иминимальным значением ЧОТ большинства «дикторов» (8 из 10) составляетот 30 до 40 Гц хотя бы на одной из фонограмм (6 «дикторов» – на обеихфонограммах); три «диктора» имеют значения интервала выше 45 Гц хотя бына одной фонограмме (один «диктор» – на обеих), и только один «диктор»(«диктор» 10) в обеих фонограммах имеет специфически узкий интервалреализации ядерного подъема – менее 25 Гц.
Учитывая, что вариативность поданному параметру у этого «диктора» существенно ниже среднедикторской,данную особенность можно отнести к индивидуальным идентификационнозначимым.9. Скос (асимметрия) характеризует степень несимметричностираспределения значений ЧОТ относительно среднего значения [Научно107технический отчет 2008; Научно-технический отчет 2011]. При анализевосходящего и нисходящего направления движения ЧОТ на ядерном участке(как для типа «ядерный слог», так и для типа «ядерно-заядерный участок»)данный параметр характеризует степень выпуклости/вогнутости кривой ЧОТ(мелодического контура). Для более длительных участков речи значениескоса может указывать на наличие/отсутствие резких перепадов значений.10.