Диссертация (1173184), страница 23
Текст из файла (страница 23)
В этом случаеее значимость будет равна половине веса 1. Значимость четвертого случая,когда признак отсутствует в обеих фонограммах, будет равна весу 2.Впятой и шестой ситуациях – несовпадение признака на фонограммах –используется вес 3. В случае умеренной выраженности признака в одной изфонограмм – вес 3, а в случае яркой – удвоенный вес 3 [Научно-техническийотчет 2008; Научно-технический отчет 2011].Припроведенииидентификационногосравненияотдельновычисляются суммы положительных (вес 1 и вес 2) и отрицательных (вес 3)весов признаков. Первая, положительная сумма, говорит о степени сходствадикторов, а вторая, отрицательная,– о степени их различия [Курьянова2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012;Голощапова, Курьянова 2012а].Принципиальное значение для правильной перцептивно-слуховойоценки выраженности того или иного признака при анализе голоса и речи«диктора» имеет алгоритм сравнения, которым эксперт, носитель другогоязыка,пользуется при анализе речи иноязычного говорящего.
Припоследовательномподходеоцениваютсяпросодическиеиэкстралингвистические признаки голоса и речи «диктора» на первойфонограмме, а затем те же признаки его голоса и речи на второй фонограмме.При параллельном (синхронном) подходе наличие и выраженность каждогопризнака голоса и речи «диктора» оценивается попарно для обеихфонограмм.Посколькупоследовательноесравнениефонограммсвременны/м перерывом может привести к определенным расхождениям воценке идентичных явлений, испытуемым предлагалось провести анализфонограмм вторым способом – синхронно.
При этом в качестве наиболееоптимального был выбран подход, при котором испытуемым предлагалось135анализировать особенности голоса и речи по блокам: интонационныехарактеристики,просодическиехарактеристики,характеристикихезитационных пауз и так далее сначала в одной фонограмме, а затем вдругой [Курьянова 2011b; Голощапова, Курьянова 2011а; Курьянова,Елемешина 2012; Голощапова, Курьянова 2012а].Заполненныеисследовательскиенаосноветаблицыперцептивно-слухового(карточки«дикторов»),анализаподвергалисьавтоматической обработке, в процессе которой вычислялась степень сходстваи степень различия выявленного набора признаков на основе суммированиявесовых коэффициентов, соответствующих значимости признака.
Послевыставления для данного набора признаков отметок о наличии либоотсутствии и степени выраженности признака в сравниваемых фонограммахпроводилосьидентификационноесравнениесоответствующихисследовательских таблиц (карточек «дикторов») на основе суммированиявесовыхкоэффициентов,соответствующихзначимостипризнакавконкретной ситуации [Курьянова 2011b; Голощапова, Курьянова 2011а;Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].Степень сходства определялась количеством и значимостью (весом)совпавших признаков, а степень различия, количеством и значимостьюнесовпадений соответственно [Курьянова, Елемешина 2013]. На основеполученного соотношения формулировался вывод о принадлежностифонограмм одному или разным «дикторам» [Курьянова 2011b; Голощапова,Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова2012а].Сравнение осуществлялось автоматически с применением двухалгоритмов.
В первом алгоритме мера близости голосов «дикторов» насравниваемыхфонограммахпогруппепросодическихиэкстралингвистических совпавших и различающихся признаков вычисляласьс учетом их количества по отношению к общему количеству признаковшаблона, то есть оценивалась доля совпадений и доля несовпадений136относительно общей положительной и отрицательной сумм шаблона.
Второйалгоритм в модуле идентификации SIS II настроен на выявление и оценкунаиболее значимых из имеющихся совпадений и различий признаков. Такимобразом, при применении второго алгоритма учитывалась мера сходства.Общий результат сравнения вычислялся как среднее арифметическое отрезультатов работы двух алгоритмов [Курьянова 2011b; Голощапова,Курьянова 2011а; Курьянова, Елемешина 2012; Голощапова, Курьянова2012а].На этапе принятия решения на основе анализа совпавших инесовпавших признаков формируется мера совпавших признаков – FR и меранесовпавших признаков – FA.
Принятие решения о совпадении/различииголосовыххарактеристиксравниваемых«дикторов»порезультатампроведенного исследования проводится на основе сравнения величин FR иFA [Научно-технический отчет 2008; Научно-технический отчет 2011]. При:- FR>FA - характеристикиголосов сравниваемых «дикторов»совпадают по группе признаков, выделенных на данном этапе;- FR<FА - характеристикиголосов сравниваемых «дикторов»отличаются по группе признаков, выделенных на данном этапе;- FА≈FR - невозможно принять решение по выделенной группепризнаков [Курьянова 2011а].Разработанный алгоритм перцептивно-слухового анализа предлагалиспытуемымготовыймеханизмоценкизначимостисовпаденийинесовпадений признаков и получения итогового идентификационногорешения. Однако, как и во всяком не полностью автоматическом методе, всюподготовительную работу по оценке приемлемости речевого материала дляданного вида анализа, выделению признаков и оценке их выраженности всравниваемых фонограммах выполняли испытуемые.Математико-статистическаяобработкаэмпирическихданных,полученных в результате проведения второго этапа эксперимента №1,состояла в сравнительном анализе распределения данных FR и FA между137испытуемымиразныхгрупп,просчитывалсяпроцентбезошибочногораспознавания «диктора» и процент допущенных ошибок.III.2.4.Результаты экспериментального исследования №1(второй этап)Статистическая обработка данных для двух групп испытуемыхпоказала следующее.Результаты анализа заполненных исследовательских таблиц (карточек«дикторов») и распределения данных FR и FA для испытуемых группы №1показали, что для подготовленных экспертов (как носителей русского, так идля носителей таджикского языков), характерна адекватнаяоценкавыявленных признаков в голосе и речи дикторов, говорящих на таджикскоми цыганском языках.
На основе перцептивно-слухового метода исследованияиспытуемыми группы №1 было установлено 7 лиц (4 мужчины и 3женщины), говорящих на цыганском и таджикском языках, что составило58,4% от общего числа лиц, подлежащих идентификации.В остальных 41,6% случаев (N = 5) испытуемые не смогли успешноидентифицировать говорящих. При обработке исследовательских таблиц(карточек)былоустановлено,чтоприидентификации«дикторов»,говорящих на цыганском (N = 3) и таджикском (N = 2) языках, быладопущена ошибка ложного отклонения «диктора», вызванная достаточнобольшим количеством различающихся признаков.Для «диктора» 1, говорящего на цыганском языке, в сравненииучаствовало 113 признаков, не совпавших из которых составило 53 (46,9%от общего количества).
Для «диктора» 2, говорящего на цыганском языке, всравнении участвовало 106 признаков, не совпавших из которых составило47 (44,3% от общего количества). Для «диктора» 3, говорящего на цыганскомязыке, в сравнении участвовало 98 признаков, не совпавших из которыхсоставило 49 (50% от общего количества). Для «диктора» 4, говорящего на138таджикском языке, в сравнении участвовало 102 признака, не совпавших изкоторых составило 58 (56,8% от общего количества).
Для «диктора» 5,говорящего таджикском языке, в сравнении участвовало 116 признаков, несовпавших из которых составило 56 (48,2% от общего количества).Анализ материала, на котором проводилось сравнение, показал, что«дикторы» 1-5 – этнические таджики и цыгане, голос и речь которыхподлежалиидентификации,состояниях,чтовызвалонаходилисьсущественныевразныхразличияэмоциональныхвопределенныхпросодических характеристиках речи. В одном случае из пяти (диктор 2, речьдиктора характеризовалась как эмоционально-насыщенная с пометой«умеренно»)экспертывыделилибольшоеколичествогрупповыхнеинформативных признаков, в связи с чем было сформулированосообщение о невозможности принятия идентификационного решения.Исследованиедоминирующиеданныхфонограммпросодическиепозволилопризнаки,наиболееопределитьподверженныемодификациям при эмоциональном сдвиге.Для таджикского языка основные несовпадения обнаружились вследующих голосовых характеристиках речи «дикторов» (в порядкеубывания): мелодические характеристики (33,8% от общего количестванесовпавших признаков), темпоральные характеристики (17,7% от общегоколичества несовпавших признаков), уровень громкости (14,6% от общегоколичества несовпавших признаков), особенности паузации (7,8% от общегоколичества несовпавших признаков), качество артикуляции (6,8% от общегоколичества несовпавших признаков).Дляцыганскогоязыканаблюдаетсяаналогичнаятенденцияраспределения указанных признаков: мелодические характеристики (29,9%отобщегоколичестванесовпавшихпризнаков),темпоральныехарактеристики (18,3% от общего количества несовпавших признаков),уровень громкости (13,8% от общего количества несовпавших признаков),139особенности паузации (7,1% от общего количества несовпавших признаков),качество артикуляции (6,2% от общего количества несовпавших признаков).Диаграмма распределения зависимости просодических признаков отэмоционального состояния говорящего на цыганском и таджикском языкахпредставлена на рисунке 18.Рис.
18 Диаграмма распределения зависимости просодическихпризнаков от эмоционального состояния говорящего на таджикском ицыганском языках.Наряду с адекватной оценкой просодических средств в целом, длягруппы №1 в зависимости от опыта экспертной работы испытуемого былохарактерно выделение различного объема идентифицирующих признакови/или присвоение различной степени выраженности некоторым выявленнымпризнакам для одного и того же идентифицируемого «диктора».
При этомвыявленного некоторого объема индивидуальных признаков голоса и речиговорящихна иностранном языке было достаточнодляуспешнойидентификации перцептивно-слуховым методом.При обработке ответов испытуемых группы №1 установлено, чтонесмотря на различия, присущие исследуемым языкам, прослеживается140тенденция, согласно которой, подготовленные эксперты, не владеющиетаджикским и цыганским языками, в равной степени могут выявить ипроанализировать просодические особенности речи, что и подготовленныеэксперты, владеющие исследуемым языком или являющиеся носителямиязыка [Курьянова 2018].Так, испытуемые подгруппы «а» группы №1 смогли выявить ипроанализировать в исследуемых фонограммах на таджикском языке от 93 до113 просодических и экстралингвистических признаков (72% – 87,6% отобщего количества признаков); на цыганском языке – от 91 до 118просодических и экстралингвистических признаков (70, 5% – 91,4% отобщего количества признаков).Испытуемыеподгруппы«b»группы№1смогливыявитьипроанализировать в исследуемых фонограммах на таджикском языке от 95 до118 просодических и экстралингвистических признаков (73,6% – 91,4% отобщего количества признаков); на цыганском языке – от 92 до 109просодических и экстралингвистических признаков (71, 3% – 84,5% отобщего количества признаков).Испытуемыеподгруппы«с»группы№1смогливыявитьипроанализировать в исследуемых фонограммах на таджикском языке от 108до 122 просодических и экстралингвистических признаков (83,7% – 94,6% отобщего количества признаков); на цыганском языке – от 97 до 103просодических и экстралингвистических признаков 75, 1% – 79,8% отобщего количества признаков).Образец лингвистических карточек, содержащих реестр признаков,исследуемых при проведении перцептивно-слухового анализа, представлен вПриложении 3 к настоящему диссертационному исследованию.Диаграмма максимального количества проанализированных методомперцептивно-слухового анализа признаков испытуемыми группы №1 поотношению к числу всех признаков, предусмотренных для анализа даннымметодом в модуле SIS II, представлена на рисунке 19.141Рис.