Диссертация (1173184), страница 25
Текст из файла (страница 25)
Опорные фрагменты представляли собой фоноабзацы(последовательности из нескольких высказываний или синтагм общейдлительностью более 10 секунд), синтагмы, а также их структурныесоставляющие (предшкалы, шкалы, ядерные слоги, ядерно-заядерныеучастки и т.д. с однотипным движением огибающей ЧОТ) [Курьянова 2011а].Для анализа было предусмотрено 16 подтипов фрагментов мелодическойкривой и 15 параметров их описания.
Для разных типов используются разныенаборы параметров.Предварительная подготовка фонограмм для сравнения даннымметодом заключалась в получении корректных графиков ЧОТ. Переданализом параметров частоты основного тона было необходимо просмотретьполученный график ЧОТ и скорректировать неточности, которые могли бытьдопущеныавтоматическимавтоматическоговыделителявыделителем.осуществляетсяПоискнеточностейпосредствомналоженияграфика ЧОТ на кепстр сигнала, который в наглядной форме позволяетотобразить характеристики периодичности голоса:огибающую ЧОТ,границы тональных и шумовых звуков, динамику указанных характеристик.При подборе фрагментов для сравнения для достижения надёжногоидентификационногорешенияиспытуемымбылорекомендованособлюдение следующих условий:1) Перед началом сравнительного анализа испытуемые должны былипрослушать обе фонограммы, предназначенные для сравнения, и оценить ихобщую сопоставимость с точки зрения стиля и манеры речи, еёэмоциональной насыщенности.2) Поскольку метод предназначен для сравнения фонограмм без ярковыраженной эмоционально-модальной окраски, в случае необходимости150следовало удалить из сигнала те участки, которые не соответствуют даннымтребованиям.3) По возможности подобрать такие компоненты огибающей ЧОТ,которые имеют ярко выраженную специфику и несколько примеровреализации в каждой из фонограмм (не менее 5).4) Провести сравнение голосов в автоматическом режиме.Параметры выделяемых экспертом на графике ЧОТ однотипныхсопоставимых участков контура вычислялись автоматически, данныезаносилисьвтаблицу.Автоматическоесравнениефонограммосуществлялось на основе полученных средних (пороговых) значений покаждому параметру каждого типа/подтипа элементов огибающей ЧОТ(мелодическогоконтура)[Курьянова2011а].Длякаждойпарысравниваемых значений находилась разность значений, которая затемсравнивалась с соответствующим порогом.В процессе сравнения длякаждого типа/подтипа рассчитывалась степень сходства и степень различий.Далее результаты сравнения отдельных типов суммировались для полученияобщего решения относительно тождества либо различия голосов насравниваемыхфонограммах.Почастнымзначениямтипов/подтипованалогичным образом, с учетом весовых коэффициентов, рассчитываласьобщая оценка сходства/различия голосов на фонограммах, на основе которойформулировался общий вывод о тождестве/различии голосов и выводилисьвероятностиложногоотклоненияиложногопринятия«диктора»,автоматически рассчитанные в модуле идентификации SIS II.
Еслипоказатель оценки сходства существенно превышал показатель различий, товероятность тождества голосов считалась высокой. При высокой степениразличий в оценках формулировалось решение о различии голосов. Принезначительных различиях в оценках (менее 10%) выдавалось сообщение оневозможности принять решение [Курьянова 2011b; Голощапова, Курьянова2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].151III.3.2. Результаты экспериментального исследования №2В одно из основных условий эксперимента №2 входила оценкафонограмм с точки зрения стиля и манеры речи, её эмоциональнойнасыщенности, а также выявление и анализ сопоставимых для дальнейшегоидентификационного сравнения фрагментов синтагм.Аудиторы группы №1, имеющие опыт экспертной работы более 5 лет,смогли успешно и уверенно выявить сопоставимые сегменты иноязычнойречи во всех без исключения случаях.
Сегментация сопоставимыхфрагментов испытуемыми группы №2 была несколько затруднена в связи сотсутствием навыка восприятия таджикской и цыганской речи, потребовалабольших временных затрат по сравнению с результатами сегментациииспытуемых группы №1, однако в целом, данная задача была выполнена также успешно.Наосновеметодаанализамелодическогоконтурасинтагмиспытуемыми группы №1 было установлено 9 лиц, говорящих на цыганскоми таджикском языках, что составило 100% от общего числа лиц, подлежащихидентификации; испытуемыми группы №2 было установлено 7 лиц,говорящих на цыганском и таджикском языках, что составило 77,7% отобщего числа лиц, подлежащих идентификации.Образецидентификационногоисследованияметодомсравненияоднотипных мелодических структур представлен в Приложении 4 кнастоящему диссертационному исследованию.При анализе идентификационных отчетов, выполненных методоманализа мелодического контура высказываний, обнаружилась прямаязависимостьмеждуопытомэкспертнойработыиспытуемогоивсесторонности и правильности проведенных исследований, в частности,полноты и точности выделения типов/подтипов фрагментов огибающей ЧОТ[Курьянова 2018].Так, испытуемые группы №1 с высокой степеньюточности подобрали и проанализировали опорные фрагменты, дали152адекватные характеристики типов/подтипов синтагм, достаточно точнозарегистрировали наличие тех или иных речевых особенностей, дали имобоснованное толкование, наиболее полно проанализировали наличие в речидикторов нефонологических элементов, являющихся заполнителями паузхезитации.
Аудиторы группы №2 также смогли выявить и проанализироватьопорные фрагменты синтагмы, однако на выполнение данного заданияиспытуемыми было потрачено существенно больше времени, при этомоценка выявленных признаков затруднений не вызывала.Таким образом, подготовленные эксперты в спонтанном речевомпотоке на таджикском и цыганском языках уверенно выявляют ианализируютсопоставимыесегментывусловияхвосприятияиноязычной речи [Курьянова 2018].При этом для эффективного использования метода необходимо владетьпонятийно-терминологическимаппаратоммелодическогоанализаикорректно подбирать опорные фрагменты огибающей ЧОТ для сравнения,соблюдая необходимые условия применимости данного метода.Какпоказалирезультатыэксперимента№2,дляуспешнойидентификации «дикторов» указанным методом выявления только техфрагментов речи, которые максимально совпадают по эмоциональнойнасыщенности недостаточно для успешной идентификации.Так,в22%случаевиспытуемыегруппы№2анализировалитипы/подтипы синтагм и их составляющие без учета факторов, вызывающихреализационное варьирование однотипных мелодических структур.
Вчастности, испытуемыми данной группы при анализе и сравнениипараметров мелодической кривой на ядерном участке были подобраныфрагменты,несопоставимыеподлительностиголосовогоучастка,различающиеся по наличию/отсутствию заядерных слогов, а также без учетасегментного состава ядерного слога. Несоблюдение данных условийвызывало ошибки ложного отклонения «диктора».Однотипные участкимелодической кривой в большинстве случаев правильно анализируются153экспертами, не владеющими исследуемыми языками, и проявляют высокуюстепень параметрического сходства у одного «диктора».При более подробном анализе идентификационных отчетов групписпытуемыхобнаруживаютсяследующиеобщиезакономерности,характерные для обоих исследуемых в настоящей диссертационной работеязыков [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова,Елемешина 2012; Голощапова, Курьянова 2012а; Курьянова 2018]:- на коротком тональном участке (например, если ядерный слогоканчиваетсяглухимсогласным)характернаравномернаяскоростьизменения ЧОТ; при большей длительности тонального участка ядерногослога (например, если на конце ядерного слога сонант или долгий гласный),наблюдается неравномерность скорости изменения ЧОТ;- реализации высокой предшкалы встречаются гораздо реже и не у всех«дикторов»; низкая предшкала, напротив, является типичной практическидля большинства «дикторов», поэтому анализ лексически идентичныхвысоких предшкал (например, часто повторяющегося союза «и» в цыганскомязыке и союзов «ва», «у» в таджикском языке) является наиболееинформативным при решении задачи идентификации;- предельное значение ЧОТ на ядерных и предъядерных участкахсинтагмы в речи таджиков и цыган достигается, как правило, на самом концеударного слога (при отсутствии заударных), либо на заударном слоге при егоналичии.Крометого,удалосьустановить,чтоувеличение/уменьшениедлительности тонального участка может происходить также под влияниемускорения/замедления темпа речи.
Данные характеристики вступают вкорреляционнуюзависимость:замедлениетемпаречиувеличиваетдлительность односложного ядра, а ускорение темпа речи приводитсокращениютональногоучасткаи,соответственно,купрощениюмелодической конфигурации анализируемого голосового участка [Курьянова1542011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012;Голощапова, Курьянова 2012а; Курьянова 2018].Исследование различных типов огибающей ЧОТ (фоноабзацев,синтагм, шкал, предшкал, заядерных участков и так далее) показало, что прианализе фоноабзацев минимизируется так называемый «человеческийфактор», поскольку для корректного выделения участков мелодическогоконтура данного типа от эксперта требуется лишь умение оценитьправильность рисунка выделенной огибающей ЧОТ и при необходимостиоткорректировать её отображение. Эффективность использования этих жеданных при выделении «локальных» фрагментов огибающей ЧОТ напрямуюзависит от квалификации и опыта эксперта, его компетенции, способноститочно определить потенциально наиболее информативные «фокусные» зоныпри работе с конкретным материалом, поступившим на экспертноеисследование [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова,Елемешина 2012; Голощапова, Курьянова 2012а].Проведенный эксперимент также позволил сформулировать критериипригодности фонограмм для проведения исследования методом анализамелодического контура синтагм:- для достижения надежности идентификационного решения присравнении фонограмм данным методом важна не длительность сама по себе,а представительность звукозаписи, то есть представленность в фонограммецелевых структур для анализа – ядерных тонов, предшкал, шкал, паузхезитации и так далее;- в зависимости от темпа речи, от акцентно-ритмической структуры исегментного состава достаточная длительность речи диктора на фонограммеможет варьироваться от 30-40 секунд до нескольких минут.
Рекомендуемоечисло выделенных фрагментов каждого типа составляет 5-10;- с технической точки зрения различия в канале записи не оказываютсущественного влияния на значения параметров ЧОТ, при этом важными155факторами являются соотношение сигнал/шум (не менее 10-15 дБ) иотсутствие реверберации на обеих фонограммах.Врезультатеэксперимента№2установленынаиболеечастовстречающиеся ядерные мелодические модели в речи «дикторов», говорящихнаразныхнациональныхязыках(таджикскомицыганском),–«законченность» (нисходящее завершение) и «незаконченность» (восходящеезавершение).