Диссертация (1173184), страница 27
Текст из файла (страница 27)
Для отождествления лиц, говорящих на незнакомом эксперту языке,фонограмма должна обеспечивать представительность выделенных опорныхфрагментов для мелодического анализа голоса и речи.9. Решение идентификационных задач может строиться по принципуязыконезависимости: язык фонограмм не оказывает влияния на выборметодов и ход проведения исследований.10.Представленныеметодыявляютсяуниверсальнымидляспециалиста, обладающего специальными знаниями в области исследованияречевого сигнала.III.5.
Методические рекомендации по отбору материала длясравнительного исследованияДля правильного выявления индивидуализирующих просодическиххарактеристик голоса «диктора», разграничения относительно устойчивыххарактеристик от неустойчивых и определения степени надежности165сделанныхвыводов,экспертуважнознатьтеоретическиеосновыидентификации. Знание факторов, влияющих на индивидуальный характерголоса и речи, позволяет выявить идентифицирующие супрасегментныехарактеристики голоса и речи говорящего и получить оценку тождества либоразличия голосов сравниваемых «дикторов».Из многочисленных научных публикаций, описывающих реализациюкоммуникативного акта [Потапова 1997; Потапова 2001 а; Потапова 2002 с;Потапова 2006; Потапова 2010], известно, что на характер речи «диктора»,представленной в виде звукового файла, влияют две группы факторов:-индивидуальныехарактеристики«диктора»(анатомические,психологические, социальные, коммуникативные особенности, способности,компетенции, состояние, цели, мотивы, установки);-ситуация, сопровождающая коммуникацию (жанр, время и месторазговора, наличие требований и ограничений на поведение говорящих,акустическая среда, особенности звукозаписывающей аппаратуры и каналазаписи).При аудитивном анализе голоса и речи идентифицируемого «диктора»факторы обеих групп в той или иной мере проявляются в речи.Из судебно-экспертной практики известно, что наиболее надежнодиагностируемыми индивидуализирующими характеристиками голоса и речисчитаются характеристики, обусловленные индивидуальными особенностямиречевого аппарата каждого конкретного «диктора», который включает в себяорганы с различными физиологическими функциями.
В зависимости отвыполняемых функций органы, участвующие в звукообразовании, условноможно разделить на 3 крупных блока:- органы дыхания, участвующие в образовании воздушной струи(традиционно к ним относят легкие с бронхами и трахеей);- органы, участвующие в образовании звука (включают активные(подвижные: гортань, голосовые связки, язык, губы и т.д.) и пассивные(неподвижные: зубы, твёрдое нёбо, полость носа) органы артикуляции);166- органы, опосредованно воздействующие на качество речевого сигнала(грудная клетка, кости черепа как акустические резонаторы, косвенновлияющие на тембр звука).Органы, участвующие в звукообразовании, индивидуальны длякаждого человека и обладают своими особенностями.
Например, размер иформа активных органов речи, присущие конкретному лицу, изменяют объеми форму речевого тракта. У каждого человека индивидуален объем легких,различается размер и форма зубов, каждому характерен определенныйприкус и так далее, поэтому сама конфигурация речевого тракта уникальна,отлична от других. Таким образом, речевые навыки «диктора» (его речеваякомпетенция) наряду с анатомическими особенностями создают достаточноустойчивые индивидуализирующие характеристики голоса и речи.Для достижения достоверного идентификационного решения методоманализа мелодического контура на незнакомом эксперту языке должны бытьсоблюдены определенные условия.Сравнению фонограмм данным методом должен предшествоватьтщательный анализ речевого материала. Перед началом сравнительногоанализа сравниваемые фонограммы подлежат оценке на предмет их общейсопоставимости по стилю речи, эмоционально-модальной насыщенности ит.д.,порезультатамчегоопределяетсяоптимальныйдлякаждогоконкретного случая подход, то есть типы и состав участков мелодическогоконтура синтагмы, которые будут подлежать сравнению.Подготовка фонограммы к анализу параметров ЧОТ заключается ввизуальном анализе полученного в автоматическом режиме рисункаогибающей ЧОТ и корректировке возможных неточностей, посредствомналожения рисунка огибающей ЧОТ на кепстр сигнала.
Например, удалениюподлежат так называемые «ложные максимумы» и «ложные минимумы»,которые могут отражаться автоматическим выделителем на непроизвольныхголосовых модуляциях при напряжении голосовых связок непосредственноперед началом фонации или при ослаблении напряжения голосовых связок в167процессе фонации. Наличие указанных участков существенно влияет наусредненные значения параметров.Оптимальная минимальная длительность фонограммы для достижениянадежного идентификационного решениясоставляет не менее 40 с дляанализа синтагмы и её структурных компонентов; для фоноабзацевдлительность исследуемого фрагмента должна составлять не менее 60 с.
Приэтом следует отметить, что для достижения надежного идентификационногорешения важна не длительность сама по себе (за исключением фоноабзацев),а представленность анализируемых структур – ядерных тонов, предшкал,шкал, пауз хезитации и так далее.
Так, эффективным будет сравнение 5-10фрагментов, включающих синтагмы с восходящим или нисходящимзавершением с полноценной интонационной структурой, то есть содержащихвсеструктурныекомпонентысинтагмы,отражающиеразнообразныезначения параметров ЧОТ [Курьянова 2011b; Голощапова, Курьянова 2011а;Курьянова, Елемешина 2012; Голощапова, Курьянова 2012а].На снижение эффективности описываемого метода влияют высокийуровеньфоновогохарактеристикшума,голоса;затрудняющийобусловленноеадекватноекоммуникативнойвосприятиеситуациейускорение темпа речи, которое приводит к обнаружению ложных явлений,связанных с ослаблением артикуляции, не характерных для речи данного«диктора» в привычном темпе; недостаточное количество представленныхдля сравнения фрагментов огибающей ЧОТ и/или их реализационнаянепредставительность, то есть невозможность выделения структурныхкомпонентов синтагмы разного типа/подтипа.Припроведенииэкспериментовбылиустановленыграницыприменимости метода с точки зрения качества фонограмм.
Эффективностьметода напрямую зависит от реализационной представительности исопоставимости фонограмм.168Основными критериями качества фонограмм являются [Курьянова2011b; Голощапова, Курьянова 2011а; Курьянова, Елемешина 2012;Голощапова, Курьянова 2012а]:- отношение сигнал/шум;- уровень реверберации;- частотный диапазон;- длительностьанализируемыхречевыхфрагментовидентифицируемого диктора.Критериипригодностифонограммдляпроведенияидентификационных исследований представлены в таблице 7.Таблица 7Пороговые значения пригодности фонограммНаименование параметрадлительность реплик 1 лица нафонограммесреднее значение соотношениясигнал/шумсреднее значение частотногодиапазонавремя реверберацииЗачастуюэкспертухарактеризующиесяЗначение параметране менее 30-40 сне менее 10 дБ300-3400 Гцне более 0,6 сприходитсянизким качествомисследоватьзаписи,котороефонограммы,можетбытьобусловлено как использованием непрофессиональной звукозаписывающейтехники, так и сложными акустическими условиями звукозаписи.
На уровнеаудитивнойперцепциитакиефонограммыхарактеризуютсянизкойразборчивостью речи, а также высоким уровнем помех и большим временемреверберации, маскирующим полезный речевой сигнал.Идентификационное исследование фонограмм низкого качества имеетсвоиособенности.принимаетсяПорешениерезультатамооценкинеобходимостикачестваисключенияфонограммыизпроцессапоследующего идентификационного исследования тех участков сигнала, на169которых невозможно достоверное выделение идентификационных признаковиспользуемыми методами идентификации.Приработесфонограммаминизкогокачества рекомендуетсямаксимизировать участие эксперта в ходе проводимых исследований, где этоучастие допускается алгоритмом. Непосредственное квалифицированноеучастиеопытногоэкспертаможет компенсировать низкоекачествосравниваемых фонограмм.ЗАКЛЮЧЕНИЕНастоящеедиссертационноеисследованиепосвященопроблемеизучения влияния просодических моделей родного языка в сознанииэксперта на корректную идентификацию им иноязычных просодическихмоделей применительно к таджикскому и цыганскому языкам.