Диссертация (1173184), страница 24
Текст из файла (страница 24)
19 Диаграмма максимального количества проанализированныхпризнаков испытуемыми группы №1 по отношению к числу всех признаковдля конкретного языка.Испытуемые группы №2 справились с задачей идентификации«дикторов» значительно хуже, по сравнению с испытуемыми группы №1.Результаты анализа заполненных исследовательских таблиц (карточек) ираспределения данных FR и FA для испытуемых группы №2 показали, чтодлялиц,неимеющихэкспертногоопыта,перцептивно-слуховоеисследование голоса и речи для последующей идентификации лиц вызываетряд существенных затруднений.На основе перцептивно-слухового метода исследования испытуемымигруппы №2 было установлено 3 лица (2 мужчины и 1 женщина), говорящихна цыганском и таджикском языках, что составило 25% от общего числа лиц,подлежащих идентификации.Для испытуемых группы №2 характерно спорадическое выявлениепросодических и экстралингвистических признаков голоса и речи, чтозатрудняетобозначениекакой-либозакономерностиприанализезаполненных лингвистических карточек испытуемыми группы №2.142Успешная идентификация лиц была проведена в 3 случаях из 12 натаджикском и цыганском языках, в процессе которой испытуемыми быловыделено и проанализировано для таджикского языка (N = 1) – от 92 до 98просодических и экстралингвистических признаков (71,3% – 75,9% отобщего количества признаков); для цыганского языка (N = 2) – от 95 до 102просодических и экстралингвистических признаков(73,6%– 79%отобщего количества признаков).
В остальных случаях испытуемые группы №2не смогли выявить и проанализировать идентификационно значимыепросодические и экстралингвистические признаки голоса и речи.Обработка остальных карточек «диктора» (в количестве 141 – 97,8% отобщего количества), помеченных как «отказ от идентификации», позволилаустановитькритерииневозможностипринятияидентификационногорешения.Отказ от возможности принятия идентификационного решениявозникает в следующих случаях:- испытуемый выделил недостаточное количество просодических иэкстралингвистическихпризнаков(менее70%проанализированныхпризнаков от общего количества);- испытуемый выделил достаточное количество просодических иэкстралингвистических признаков, однако выделенные признаки обладаютнедостаточно высокой значимостью и все имеют экспертную оценку«выражен»;- в заполненной исследовательской таблице (карточке «диктора») приобщемдостаточномколичествевыявленныхпросодическихиэкстралингвистических признаков менее 10 имеют оценку «ярко» - яркоепроявление признака;- выделенные испытуемым признаки не совпадают и/или противоречатдруг другу, при этом характер данных несовпадений – критический.Таким образом, подготовленные эксперты способны выявитьнекоторый объем просодических признаков и описать индивидуальные143особенности голоса и речи «дикторов», говорящих на незнакомом экспертуязыке,достаточныйдляидентификациииноязычногоговорящегоперцептивно-слуховым методом при условии жесткого соблюдения рядакритериев, описанных ниже [Курьянова 2018].При проведении эксперимента №1, включающего два этапа, былоустановлено следующее.Надежность конечного результата первичного опознавания «диктора»и правильность оценки идентификационных признаков в значительной мереопределяется квалификацией эксперта.Междуполнотойиточностьюописанияпросодическихиэкстралингвистических признаков голоса и речи иноязычного говорящего иопытом экспертной работы существует прямая зависимость.
При этомуровень владения экспертом языком, на котором говорит лицо, подлежащееидентификации, не вносит существенных различий при проведениисравнительногоисследованияперцептивно-слуховымметодомпопросодической группе признаков в рамках разработанного алгоритмаидентификации. При отсутствии навыков экспертной работы надёжность ивозможность проведения идентификации иноязычного диктора существенноснижается [Курьянова 2018].Наиболее надежным способом сравнения голоса и речи иноязычныхговорящих является синхронная (попарная) оценка выраженности каждогопризнака в обеих фонограммах.
Для получения надёжного решения следуетоценить проявление не менее 70-75% признаков, входящих в реестрзаданного алгоритма идентификации (общее количество просодических иэкстралингвистических признаков для сравнения перцептивно-слуховымметодом составляет в модуле идентификации SIS II – 130).Наибольшуюстепеньидентификационнойзначимостиимеетсовокупность выделенных экспертом признаков и проставленных им оценок,при этом вес каждого идентификационного признака в отдельности можетбыть разным, в том числе невысоким.144Помимо требований к качеству записи, важно учитывать и другиефакторы, влияющие на степень надёжности идентификационных выводов, вчастности,наналичиеистепеньвыраженностиотдельныхгрупппросодических и экстралингвистических признаков.Результаты распознавания заметно улучшаются при сопоставлениифонограмм, содержащих голос и речь, записанных в приближенныхситуационных условиях.Голос и речь человека под влиянием внешних факторов могутподвергатьсятехническихнекоторым(частохарактеристикзначительным)звукозаписикизменениям.ситуационнымКромефакторам,влияющим на изменение и искажение речевого сигнала, следует отнестиобстоятельства речевой деятельности: тип коммуникативного акта (монолог,диалог, телефонный разговор), стиль и форма речевого общения (беседа,обсуждение, спор, ссора, угроза и т.п.), контактность или дистантностьобщения, число участников речевого общения, время и место разговора,наличие требований и ограничений на поведение «диктора», характервзаимоотношений между коммуникантами (их ролевые отношения и типвоздействиядругнадруга);атакжевнутридикторскиефакторы,обусловленные поведением говорящего: эмоциональное состояние диктора(степеньэмоциональнойнасыщенности),егопсихо-физиологическоесостояние во время речевого акта.Так, эмоциональное состояние «диктора» является одним из главныхфакторов, влияющих на модификацию ряда признаков голоса и речи[Потапова, Потапов 2012; Потапова и др.
2015]. Например, при сильномвозбуждении увеличиваетсясреднее значение частоты основного тонаголоса (аудитивно воспринимается как более высокий голос), поэтомусравнение по статистическим параметрам основного тона голоса имеетсмысл производить только в том случае, если на сравниваемых фонограммах«диктор» находится в примерно одинаковом эмоциональном состоянии.Окружающая обстановка также способна вносить определенные изменения в145характеристики голоса и речи.
Как правило, если вокруг шумно, человекплохо слышит своего собеседника, в результате чего начинает говоритьгромче, что приводит к повышению частоты основного тона голоса (такназываемый ломбард-эффект). Таким образом, для адекватного восприятияна слух существенных для первичного опознавания характеристик голоса иречи и последующей идентификации следует оценить сопоставимостьречевого материала по качеству, форме представления, эмоциональному ифизиологическому состоянию диктора в момент речевого общения.Фонограммы, предназначенные для сравнения, должны содержатьпреимущественно эмоционально-нейтральную речь. В случае качественной истилистическойсопоставимостифонограммведущимфактором,определяющим надёжность сравнения, является фонетико-лингвистическаяпредставительностьфонограммидентификационноеисследованиеиопыт[Курьяноваэксперта,проводящего2011b;Голощапова,Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова2012а].III.3.
Экспериментально-фонетическое исследование речевыхвысказываний лиц, говорящих на иностранных языках,методом автоматизированного акустического анализаIII.3.1. Методика эксперимента №2Чтобы продолжить предварительное исследование, проведенное вэксперименте №1, и проверить упомянутые выше гипотезы, был выполненновый эксперимент (эксперимент №2).В соответствии с результатами эксперимента №1 для проведенияэксперимента №2 был сформирован обновленный экспериментальныйкорпус: из всего объема речевого материала (N=370) с учетом факторадлительности реплик лица, подлежащего идентификации, была произведена146выборкафонограмм,содержащихпреимущественнонейтральную спонтанную диалогическую иэмоционально-монологическую речь натаджикском и цыганском языках.Таким образом, испытуемым было предоставлено 18 фонограмм (сзаписанной речью 18 лиц), из которых 9 звуковых файлов составиликонтрольные звукозаписи голоса и речи лиц, говорящих на таджикском ицыганском языках в виде спонтанной речи в форме диалога, репликиинтересующего лица были предварительно отсегментированы (t = 45 мин35 с), и 9 опорных фонограмм – образцов, предназначенных длясравнительного исследования, в виде неподготовленного монолога (t = 7 ч9 мин).
В связи с возможными различиями в особенностях распределениязначений ЧОТ внутри каждой языковой группы, обусловленных гендернымфактором, экспериментальному исследованию и дальнейшей статистическойобработке подвергалась только речь дикторов-мужчин.Детальноэкспериментальныйкорпусконтрольныхфонограмм,предъявляемых группе испытуемых для проведения эксперимента №2,представлен в Таблице 4, экспериментальный корпус опорных фонограммпредставлен в Таблице 5.Таблица 4ЭКСПЕРИМЕНТАЛЬНЫЙ КОРПУС КОНТРОЛЬНЫХ ФОНОГРАММ (эксперимент №2)№ п/п Условноеобозначение123456789Фонограмма 1Фонограмма 2Фонограмма 3Фонограмма 4Фонограмма 5Фонограмма 6Фонограмма 7Фонограмма 8Фонограмма 9Гендернаягруппамуж.
(М1)муж. (М2)муж. (М3)муж. (М4)муж. (М5)муж. (М6)муж. (М7)муж. (М8)муж. (М9)ЯзыкфонограммыДлительностьфонограммы(отсегментированныхрепликодного лица)таджикскийтаджикскийтаджикскийтаджикскийтаджикскийцыганскийцыганскийцыганскийцыганский6 мин 42 с5 мин 56 с4 мин 57 с6 мин 36 с3 мин 53 с4 мин 46 с5 мин 26 с3 мин 54 с5мин 25 с147Таблица 5ЭКСПЕРИМЕНТАЛЬНЫЙ КОРПУС ОПОРНЫХ ФОНОГРАММ (эксперимент №2)№п/пУсловноеобозначениеГендернаягруппаВозрастдиктора1Амуж.422Бмуж.463Вмуж.344567ГДЕЖмуж.муж.муж.муж.4439323289ЗИмуж.муж.4338ОбразованиедиктораЯзыкфонограммыДлительностьфонограммысреднеспециальноесреднеспециальноесреднеспециальноесреднеесреднеесреднеесреднеспециальноесреднеесреднеспециальноетаджикский55 минтаджикский50 минтаджикский44 минтаджикскийтаджикскийцыганскийцыганский45 мин54 мин58 мин53 минцыганскийцыганский46 мин60 минТак как основной целью данного исследования было оценитьвозможность успешной идентификации лиц, говорящих на иностранномязыке, экспертом, носителем другого языка, к проведению эксперимента №2были привлечены профессиональные эксперты группы испытуемых №1.В связи с достаточно большим процентом ложного и неуверенногораспознавания «дикторов» и последующей ошибочной идентификацииговорящихперцептивно-слуховымметодомнепрофессиональнымиэкспертами, а также в соответствии с упомянутой выше основной задачейисследования было принято решение об ограничении круга аудиторов,поэтому к проведению эксперимента №2 дипломированные филологи безопыта экспертной работы не привлекались [Курьянова 2018].Такимобразом,вдальнейшемисследованииучаствовалипрофессиональные эксперты (N = 34), прошедшие специальную подготовку вМосковскомгосударственномлингвистическомуниверситетепоприкладному речеведению и имеющие право самостоятельного производстваэкспертиз по специальности «Идентификация по голосу и речи», которые для148удобствадальнейшейматематико-статистическойобработкирезультирующих данных эксперимента были разделены на группы:1) группа №1:профессиональные русскоговорящие эксперты, невладеющие исследуемыми языками, со стажем экспертной работы 5 лет иболее (N = 18);2) группа №2: профессиональные русскоговорящие эксперты, невладеющие исследуемыми языками, со стажем экспертной работы менее5 лет (N = 16).В эксперименте №2 двум группам испытуемых предлагалось провестиидентификационное сравнение голоса и речи «дикторов», говорящих наразных языках, на основе анализа мелодического контура синтагм.
С этойцелью на базе платформы SIS II испытуемым требовалось отсегментироватьреплики говорящего на синтагмы на каждой из предложенных фонограмм,проанализировать индивидуальные характеристики огибающей ЧОТ наразличных участках синтагмы и провести сравнительное идентификационноеисследование голоса и речи «диктора» на контрольной и опорнойфонограммах на основе сравнения параметров мелодического контура голоса(значений ЧОТ на разных участках синтагмы) сравниваемых «дикторов».Для выделенного фрагмента мелодического контура (огибающей ЧОТ)рассчитывались значение начальной, конечной, минимальной, средней имаксимальной частоты основного тона, время максимума и минимума(координата максимального/минимального значения в процентах от общейдлительности выделенного фрагмента), разница между максимальным иминимальным значением ЧОТ, скорость изменения ЧОТ, коэффициентизрезанности мелодического контура синтагмы, длительность выделенногофрагмента (в мс) [Курьянова 2011а].Разработанный метод позволяет эксперту анализировать и сравниватьосновныехарактеристикимелодическихструктур,представленныевчисленном виде – как наборы значений параметров ЧОТ для сопоставимыхучастковмелодическогоконтурасинтагмы(опорныхфрагментов)149[Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина2012; Голощапова, Курьянова 2012а].Подбор фрагментов мелодического контура, подлежащих сравнению,осуществлялся испытуемыми на основе аудитивного и визуального анализаречевого сигнала.