Диссертация (1145703), страница 5
Текст из файла (страница 5)
Современное состояние исследований в области комплекснойавтоматизируемой оценки изменений эмоционального состояния.В большинстве проводимых в настоящее время исследований связанных скомплексной оценкой изменений эмоционального состояния и в практическихреализациях таких систем используется многофакторная континуальная модельорганизации эмоционального пространства. Базовым различием можно считатьнабор регистрируемых параметров и их характер, вторым по значимости –выходные характеристики, определяемые принятой разработчиками структуройфакторного пространства эмоциональных состояний или классификациейдискретных эмоциональных состояний.Большинство работ в области автоматизированной регистрации измененийэмоциональногопространствосостоянияилииспользуютпредназначеныдлятрадиционноераздельнойдвухфакторноерегистрациизнакапереживаемого эмоционального состояния или его интенсивности.
Исключение,чаще всего, составляют работы связанные с анализом мимических реакцийбольшая часть которых использует дискретное пространство эмоциональныхсостояний (Yang, Yang, 2011; Hinoing, Wagner, Noth, 2009).Номенклатурапараметровиспользуемыхдляоценкиизмененийэмоциональных состояний достаточно многочисленна и может быть условно28разделена на психофизиологические и поведенческие. Психофизиологическиепараметры,всвоюэлектрофизиологические.рассматриваюточередь,Средиподразделяютсявегетативныхкожно-гальваническуюгемодинамику,изменениедиаметравариабельностьсердечногоритма,навегетативныепараметровреакцию,зрачка,периодчащевсегопериферическуюмгновеннуюдыханияиичастотуивзаимодействиедыхательного и сердечного ритмов (кардиореспираторная синхронизация).КромеКГР,изэлектрофизиологическихпараметров,болеедругихраспространены ЭЭГ и ЭМГ.
К категории поведенческих относятся системыоснованные на анализе паралингвистических характеристик, мимики и жестов(Abhang, 2016).Преимуществом поведенческих систем является технологическая простотарегистрациианализируемыхстандартныхметодоваудиопараметров,иобычновидеозаписи.дляэтогоВажнымдостаточнопреимуществомпсихофизиологических подходов является их устойчивость к сознательномуискажению, связанная с неосознаваемым характером изменения регистрируемыхпараметров (Peter, Ebert, Beikirch, 2009).Паралингвистические характеристики. Понятие паралингвистическиехарактеристики быстрее всего определяется от обратного, оно включает в себякомплекс особенностей речевых и языковых характеристик, не имеющихотношения к цели коммуникации и смыслу передаваемого сообщения.
Всоответствии с этим, в сферу внимания разработчиков паралингвистическихметодов выявления изменений эмоционального состояния, прежде всего,попадают некоторые явления изучаемые акустической фонетикой. Отдельнойобластью применения паралингвистических характеристик для выявленияизменений эмоционального состояния, не затрагиваемой в данной работе,является анализ текстовых сообщений (Ranganath, Jurafsky, McFarland, 2013)Основные паралингвистические характеристики, используемые для оценкиизменений эмоционального состояния могут быть приблизительно очерчены29следующим перечислением.
Распределение количества переходов через нулевуюлинию, распределение энергии сигнала, положение основной частоты, джиттер(jitter), шиммер (shimmer), динамика формантной структуры, энтропия спектра,асимметрия спектра, мел-кепстральные коэффициенты (MFCC, mel-frequencycepstrum coefficients) (Schuller et. al., 2011).Мимические движения.
Использование мимических движений для оценкиизменений эмоционального состояния – один из наиболее распространенныхподходов как в теоретическом плане, так и в области прикладных применений.Исследования мимики в эволюционном и кросскультурном аспекте послужилиоснованием для создания концепции дискретного эмоционального пространства(Donato et. al., 1999; Cohn, Ekman, 2005).Первоначальная задача, с которой сталкиваются разработчики прииспользовании мимических движений – это создание методов оценкиэкспрессивныхизмененийлица,позволяющихвыявлятьособенности,релевантные для регистрации аффективных реакций.
Имеющиеся, подходы крешению данной задачи объединяются в два основных направления –геометрическое моделирование и моделирование основанное на комплексноманализе унифицированных изображений лиц (appearance-based).К геометрическим подходам относятся деформируемые контурныешаблоны для выделения контуров глаз и губ, введенные А. Юлли с соавторами(Yuille, Cohen, Halliman, 1992) и М. Кассом с соавторами (Kass, Witkin,Terzopoulus, 1988).
Кроме этого, к геометрическим методам относятсямногомерное шкалирование выражений лица по положению ключевых точек(Kobayashi, Hara, 1993) и декомпозиция контуров на взвешенные суммы базовыхпримитивов (eigen faces) с использованием преобразования Карунена-Лоэва(Kirby, Sirovich, 1990).Моделиизображенийсвязанныелицскомплексным(appearance-based)ванализомкачествеунифицированныхпервоначальногоэтапа30предполагают приведение изображений лиц к унифицированному шаблону сиспользованием аффинных деформаций (Moghaddam, Pentland, 1998). Дляоценки лицевой динамики обычно используется метод главных компонент (PCA)или метод независимых компонент (ICA).Полученные в результате предварительного анализа лицевой экспрессиипаттерны рассматриваются как характеристические признаки определенныхизменений эмоционального состояния. Для количественной оценки изменений сточки зрения их эмоциональной значимости используются различные методыклассификации: искусственные нейронные сети (Kobayashi, Hara, 1993), машиныподдерживающих векторов (SVM, support vector machine) (Anderson, McOwan,2006), скрытые марковские модели (HMM) (Otsuka, Ohya, 1998).Электромиография.
Регистрация биоэлектрической активности связаннойс функционированием скелетной мускулатуры является распространеннымметодом оценки аффективных процессов. Электромиография является наиболееблизкиманалогомиспользуемоговданнойработеметодаоценкиэмоциональных состояний с использованием акселерометрической регистрациифизиологическоготремора.Имеетсятехнологическаявозможностьосуществления регистрации тремора посредством выделения соответствующихкомпонентов из первичной электромиограммы (Elble, Randall, 1976).Вместесиспользованиятем,распространеннаяэлектромиографическихвнастоящееметодоввремяпрактикаавтоматизированногораспознавания эмоциональных состояний демонстрирует акцент на работу сдлительными процессами и оценку тонических реакций на основе мониторингамышечного тонуса.
Чаще всего, такая методика используется для оценки уровнястресса (Katsis et. al., 2008; Healey, Picard, 2005) или, например, анализаэмоциональныхсостоянийвызванныхпрослушиваниеммузыкальныхфрагментов (Kim, Andre, 2008).Даже если в работе используется какая либо форма частотно-временного31представления данных, обычно вейвлет-преобразование, то это все равно непредполагаетреконструкциюфизиологическоготремора.вызванныхНаиболеепереходныххарактеристикраспространеннымвариантомдальнейшего анализа данных является использование классификаторов на основенейронных сетей или машины поддерживающих векторов (Yang, Yang, 2011).Системы основанные на использовании вегетативных реакций.
Важнымпреимуществом, связанным с использованием вегетативных параметров дляоценки эмоциональных состояний, является высокое взаимное соответствиезнака и уровня их изменений с субъективными оценками, получаемыми вдвухфакторной модели. Показано, что изменения некоторых параметров кожногальванической реакции, вариабельности сердечного ритма, периода дыхания идиаметр зрачка показывают высокий уровень корреляции с изменениемэмоционального состояния по традиционной двухфакторной модели (Picard,Vyzas, Healey, 2001; Katsis, Katertsidis, Fotiadis, 2010).Кожно-гальваническаяреакция.Кожно-гальваническаяреакцияхарактеризуется как один из наиболее информативных параметров, с точкизрения анализа эмоциональных изменений (Winton, Putnam, Krauss, 1984).
Вразличных экспериментальных контекстах показано, что абсолютные значенияамплитуды кожно-гальванической реакции обнаруживают высокий уровенькорреляции с субъективной оценкой изменений интенсивности переживаемыхэмоциональных состояний безотносительно к их знаку. Например, придемонстрациистандартизированныхэмоциональнозначимыхзрительныхстимулов электрическое сопротивление кожи возрастало вне зависимости отзнака вызываемых эмоциональных изменений. При демонстрации эмоциональнонейтральных стимулов аналогичных изменений не возникало (Lang et. al., 1993;Winton, Putnam, Krauss, 1984).При прослушивании эмоционально значимых звуков (Bradley, Lang, 2000)и музыкальных фрагментов (Gomez, Danuser, 2004) с различной степеньюэмоциональной значимости, выраженность вызванных изменений сопротивления32кожи обнаруживала положительную корреляцию со степенью эмоциональнойзначимости используемых стимулов.
Аналогичные результаты получены придлительнойрегистрациивызванныхизмененийсопротивлениякожисиспользованием видеоклипов (Christie, Friedman, 2004).Частота сердечных сокращений и вариабельность сердечного ритма.Изменение мгновенной частоты сердечного ритма является распространеннымпараметром используемым для оценки вызванных изменений эмоциональныхсостояний. Показано, что изменения частоты сердечных сокращений могутвозникать в ответ на применение вызывающих дискомфорт воздействий типаиспользованной Г. Вилсоном внезапной деградации качества демонстрируемогоиспытуемому аудиовизуального контента (Wilson, 2001).