Диссертация (1173184), страница 21
Текст из файла (страница 21)
Экспериментальный корпус отобран с учетомтех исследовательских задач, для решения которых предназначалосьпроведение эксперимента.Речевой материал, используемый для проведения эксперимента,содержитразличныеязыковыеособенности,наличиеконтекстов,способствующих проявлению индивидуальной вариативности голоса наисследуемом языке, стереотипы речевого поведения и ситуационные влияния(факторы, обусловленные ситуацией, в которой происходит звукозаписьречевогоматериала),существенныедляреализацииинформативныхпризнаков голоса, последующей идентификации «диктора» и выявлениястатистики адекватного распознавания говорящего на незнакомом экспертуязыке.
Представительность экспериментального корпуса обеспечивается тем,что«дикторы»представляютосновныедиалекты,наиболеераспространенные среди данных этнических групп; различные гендерные,возрастные и образовательные (по возможности) группы; находятся вразличномэмоциональномсостоянии(эмоционально-нейтральномиэмоционально-насыщенном); речевой материал представлен в виде какмногосинтагменных, так и коротких реплик различной коммуникативной120направленности: общие и частные вопросы, переспросы, ответные реплики,восклицания, просьбы, побуждения.
Коммуникативная направленностьреплик для таджикского языка определялась на основании переводов,выполненныхпрофессиональными филологом, экспертом, носителемтаджикского языка; для цыганского языка – на основании переводов,предоставленныхследственнымифоноскопическихэкспертиз.подразделениямиБольшаячастьпризвуковыхназначениифайловбыласпециально подобрана таким образом, чтобы фонограммы с записью одногои того же «диктора» максимально различались на слух и, наоборот,фонограммы с записью разных «дикторов» содержали похожие голоса.Одним из условий при подборе экспериментального материала былочёткое соблюдение типовых критериев пригодности фонограмм. Так как внекоторыхсовременныхзвукозаписывающихцифровыхустройствахиспользуются алгоритмы сжатия речевого сигнала, предполагающегосущественное «упрощение» звука путем удаления из него частотныхсоставляющих, находящихся за пределами восприятия человека, некоторыеиндивидуальные признаки речи существенно преобразуются, что делаетневозможным проведение идентификационных исследований по голосу иречи [Голощапова, Курьянова 2009b].
В связи с этим следование типовымкритериямпригодностифонограммпозволяетполучатьзвукозаписидостаточного качества для проведения идентификационных исследований поголосу и речи в полном объеме.Фонограммы, предъявляемые испытуемым, представлены как ввысокомкачестве(записьопорныхфонограммчерезмикрофонсиспользованием цифрового диктофона «Гном-Р», разработка ООО «Центрречевых технологий», г.
Санкт-Петербург), так и в типичном длятелефонного канала качестве (контрольные фонограммы, записанные встандарте GSM). Основные технические требования диктофона «Гном-Р»позволяют регистрировать фонограммы, соответствующие следующимхарактеристикам:121-частота дискретизации – 16000Гц;-разрядность АЦП/ЦАП – не менее 16 бит;-коэффициент нелинейных искажений сигнала – не более 0,1 % врабочем диапазоне частот;-отношение уровня сигнала к уровню шума – не менее 75 дБ;-пропускная способность канала – 8000 Гц;-неравномерность амплитудно-частотной характеристикивполосе частот 300-3400 Гц – не более 2 дБ;-стандарт записи – ИКМ 16 бит или запись по µ-закону.Качество звукозаписей, полученных на выходе телефонного канала,характеризуется следующими параметрами:-частота дискретизации – 8000Гц;-разрядность АЦП/ЦАП – не менее 16 бит;-отношение уровня сигнала к уровню шума – 20-30 дБ;-пропускная способность канала – 4000 Гц;-стандарт записи – ИКМ 16 бит или запись по µ-закону[Руководство по эксплуатации 2012].Длительность контрольной фонограммы составила не менее 6 мин; сопорной – не менее 25 минут.В связи с большим объемом проанализированного материала дляпроведения и описания экспериментально-фонетического исследования былиотобраны звукозаписи голоса и речи 40 лиц, говорящих на таджикском ицыганском языках.122III.2.
Экспериментально-фонетическое исследование речевыхвысказываний лиц, говорящих на иностранных языках,методом перцептивно-слухового анализаIII.2.1. Методика проведения эксперимента №1 (первый этап)На данном этапе исследования проводился перцептивно-слуховойанализ. Эксперимент №1 включал два этапа.Для проведения первого этапа эксперимента №1 испытуемым былопредоставлено 26 звуковых файлов, разделенных по следующим группам: 14контрольных звукозаписей голоса и речи лиц, говорящих на таджикском ицыганском языках в виде спонтанного диалога (общее количество лиц науказанных фонограммах – 28 (t = 2 ч 19 мин 08 с)), и 12 опорных фонограмм– образцов, предназначенных для сравнительного исследования, в виденеподготовленного монолога (количество лиц на указанных фонограммах –12 (t = 8 ч 19 мин)).Детальноэкспериментальныйкорпусконтрольныхфонограмм,предъявляемый испытуемым для проведения эксперимента №1, представленв Таблице 2, экспериментальный корпус опорных фонограмм представлен вТаблице 3.Таблица 2Экспериментальный корпус контрольных фонограмм (эксперимент №1)№ п/п Условноеобозначение12345678910Фонограмма 1Фонограмма 2Фонограмма 3Фонограмма 4Фонограмма 5Фонограмма 6Фонограмма 7Фонограмма 8Фонограмма 9Фонограмма 10Гендернаягруппамуж/ муж.муж/муж.жен/муж.муж/муж.жен/муж.муж/муж.жен/жен.жен/муж.муж/муж.муж/муж.ЯзыкфонограммыДлительностьфонограммытаджикскийтаджикскийтаджикскийтаджикскийтаджикскийтаджикскийтаджикскийцыганскийцыганскийцыганский12 мин 34с10 мин 52 с8 мин 27 с13 мин 13с6 мин 46 с9 мин 56 с8 мин 36 с10 мин 53с7 мин 10 с8 мин 06 с12311121314Фонограмма 11Фонограмма 12Фонограмма 13Фонограмма 14муж/муж.муж/муж.муж/жен.муж/муж.цыганскийцыганскийцыганскийцыганский6 мин 48 с11 мин 28 с10 мин 34 с13 мин 45 сТаблица 3Экспериментальный корпус опорных фонограмм (эксперимент №1)№п/пУсловноеобозначениеГендернаягруппаВозрастдиктора1Амуж.432Бмуж.393Вжен.364Гжен.4656789ДЕЖЗИмуж.муж.муж.жен.муж.37394235341011КЛмуж.муж.284012Ммуж.43ОбразованиедиктораЯзыкфонограммыДлительностьфонограммысреднеспециальноесреднеспециальноесреднеспециальноесреднеспециальноесреднеесреднеесреднеесреднеесреднеспециальноесреднеесреднеспециальноесреднеспециальноетаджикский45 минтаджикский40 минтаджикский30 минтаджикский54 минтаджикскийтаджикскийцыганскийцыганскийцыганский35 мин40 мин28 мин37 мин50 минцыганскийцыганский45 мин40 минцыганский55 минВ исследовании участвовала группа из 46 человек, которые былиразделены на 2 группы аудиторов согласно наличию/отсутствию у нихэкспертного опыта.
Чтобы оценить влияние на степень надежностипервичного распознавания не только разницы в опыте экспертной работы, нои, по возможности, знания/незнания аудиторами исследуемых языков, всостав реципиентов, принимающих участие в эксперименте, были введеныэксперты,носителитаджикскогоматематико-статистическойязыка.обработкиДляудобствадальнейшейрезультирующихданныхэксперимента первая группа реципиентов была разделена на подгруппы.Таким образом, были отобраны следующие подгруппы испытуемых:1241). Дипломированные филологи с наличием экспертного опыта(N = 34):а) русскоговорящиепрофессиональныеэксперты,невладеющиетаджикским и цыганским языками, со стажем экспертной работы от 4 до 10лет (N = 27);b) русскоговорящиепрофессиональныеэкспертысознаниемтаджикского языка, не владеющие цыганским языком, со стажем экспертнойработы 5 лет (N = 4);c) таджикоговорящие профессиональные эксперты со знанием русскогоязыка, не владеющие цыганским языком, со стажем экспертной работы 7 лет(N = 3);2).
Дипломированные филологи, не являющиеся профессиональнымиэкспертами, носители русского языка без знания таджикского и цыганскогоязыков (N = 12).Испытуемым не разрешалось советоваться друг с другом в ходеэксперимента. Индивидуальное выполнение задания являлось необходимымусловием при последующей обработке данных. Чтобы исключить любыевозможные неоднозначные толкования при проведении первого этапаэксперимента №1 была разработана инструкция, в соответствии с которойпроводилсяперцептивно-слуховойанализфонограмм.Приэтомиспытуемым рекомендовалось опираться при распознавании на критерии,предложенные в тексте инструкции. Каждый признак отражался в таблицах(карточках) перцептивно-слухового анализа и оценивался испытуемыми потрем степеням выраженности: признак не выражен, признак выражен(умеренная выраженность) и признак выражен ярко. Таким образом, наряду сзадачей первичного распознавания дикторов, испытуемые должны былиоценить вклад в надежность перцептивно-слухового анализа каждой извышеперечисленных характеристик [Курьянова 2018].
При подготовкеинструкции и исследовательских таблиц были использованы образцы анкет иинструкций,разработанныхР. К. Потаповойприпроведении125многочисленныхэкспериментовповосприятиюречи.ОбразецИнструкции №1 приведен в Приложении 2 к настоящей диссертационнойработе.Методикаобработкиматериаласматематическойстатистикизаключаласьвприменениемследующем.аппаратаПолученныерезультаты анализировались, просчитывался как процент безошибочногораспознавания «диктора», так и процент допущенных ошибок, а также былпроведен анализ наибольшей информативности определенных параметровпри первичном распознавании «диктора».
При обработке результатовэксперимента были выявлены некоторые просодические особенности вофразах, произнесенных мужчинами и женщинами, носителями таджикскогоязыка, говорящих на душанбинском койне (междиалектный язык, активноиспользующийся в разговорной речи населения г. Душанбе), что позволилосделать вывод о различияхв мелодическом оформлениив процессекоммуникации представителями разного пола. В рамках настоящегоэксперимента дальнейшей дифференциации по гендерным группам непроводилось. Выявление и описание различий в просодическом оформлениивысказываний,обусловленныхгендернойпринадлежностьюголоса,представляется задачей для дальнейших исследований.III.2.2.Результаты экспериментального исследования №1(первый этап)По результатам первого этапа эксперимента №1 могут быть выделенытри различных категории ответов.