Диссертация (1147492), страница 2
Текст из файла (страница 2)
Провести с помощью искусственной нейроннойсети глубокого обучения моделирование распознавания мимики в пороговых условияхнаблюдения.7Объект исследования: крупномасштабная нейронная сеть головного мозга человека.Предмет исследования: закономерности перестройки крупномасштабной нейроннойсети при распознавании лиц в условиях неопределенности.Гипотезы исследования:1.Пороги распознавания мимики и поворотов головы будут отличаться взависимости от количества измененных пикселей изображения.2.В задачах распознавания лиц, в условиях высокой степени неопределенности,испытуемые будут ощущать эмоциональную напряженность и беспокойство, что найдетотражение в шкалах психологического интегративного теста на определение тревоги.3.Число измененных вокселей в сравниваемых картах откликов мозга, по даннымфМРТ, на изменение мимики и поворотов головы, может быть связано с порогамираспознавания, выявленными в психофизической серии исследования.4.Принятие решения о различных свойствах стимулов осуществляется путемперераспределения активности между областями мозга.
Структуры мозга, обеспечивающиеважнейшиекогнитивныеоппонентности,т.е.процессы,осуществляютвзаимодействуютрешенияпопопринципумножественнымсинхронностикритериямиипоконфликтующим оценкам.5.Существенными факторами неопределенности, вызывающими значительнуюперестройку крупномасштабной нейронной сети, является смена инструкции и низкаявероятность повтора стимула. В условиях высокой вероятности повтора стимула эффектпривыкания к мимике будет выражен сильнее в сравнении с условиями предъявления с низкойвероятность повтора тестовых изображений.Теоретическуюиметодологическуюосновуисследованиясоставили:психофизические законы и принципы (П. Бугер, Э.
Вебер, Г. Фехнер, С. Стивенс), принципыпереработки информации в сенсорных системах (Дж. Эдриан, Н. В Barlow., Ф.В. Кемпбелл, Д.Хьюбел, В.Д. Глезер, И.И. Цуккерман, Н.Н. Красильников), учение о системном характеревысших психических функций и их динамической локализации в головном мозге (И.П. Павлов,Б.П. Бабкин, Е. Кононова, А.А. Ухтомский, Д.Х. Джексон, Е.П., В. М. Бехтерев, Кок, А.Р.Лурия, Н.П. Бехтерева, П.К. Анохин), подход к исследованию восприятия (Б.Ф. Ломов, В.А.Барабанщиков, В.Н. Носуленко, Е.С.
Самойленко), теоретические и методологическиепредставления психологии эмоций (К. Изард, П. Экман, У. Фризен), концепция восприятия ираспознавания выражений лица (В.А. Барабанщиков, Е. С. Михайлова, Е. Г Хозе, В.В. Бабенко,О.А. Королькова, К.И Ананьева), теория нейронных сетей (Хебб, Ф. Розенблатт, Fukushima, Дж.Хопфилд, Von der Malsburg, Т.Кохонен), технология глубокого обучения искусственныхнейронных сетей (K.
Fukushima, A. Krizhevsky, Y. LeCun, C. F. Cadieu).8Методы исследования. Выборку составили 119 испытуемых в возрасте от 19 до 44 лет,средний возраст 26,44,7 лет. В основном, выборку составили студенты СПбГУ, ИТМО,СПбПУ.В психологической и психофизиологической серии приняло участие 29 испытуемых (13мужчин и 16 женщин), возрастной диапазон и мужчин и женщин от 22 до 29 лет (среднийвозраст мужчин 26,11,2 года, средний возраст женщин 24,91,9, средний возраст по группе25,41,7).В первой серии фМРТ-исследования приняло участие 14 испытуемых (10 мужчин и 4женщины), возрастной диапазон и мужчин и женщин от 21 до 27 лет (средний возраст мужчин24,42,1 года, средний возраст женщин 22,51,3 средний возраст по группе 23,92,1).Во второй серии исследования приняло участие 24 испытуемых (8 мужчин и 16женщин), возрастной диапазон и мужчин и женщин от 19 до 33 лет (средний возраст мужчин24,52,8 года, средний возраст женщин 24,83,2, средний возраст по группе 24,73).В третьей серии исследования приняло участие 23 человека (13 мужчин и 10 женщин),возрастной диапазон и мужчин и женщин от 22 до 44 лет (средний возраст мужчин 307,9 года,средний возраст женщин 30,46,2, средний возраст по группе 30,27,1).Исследованиепроводилинесколькимиметодами.Дляоценкииобобщениясовременного состояния проблемы провели анализ существующей литературы.
Для оценкипорогов восприятия мимических выражений лиц и градаций поворота головы использовалитрадиционные психофизические методы измерения порогов (Бардин, 1976). Для выявленияуровня тревоги у испытуемых использовали психодиагностический метод «Интегративный тесттревожности» (Бизюк, 1995). Распределение активности в головном мозге человека принаблюдении лиц определяли с помощью метода функциональной магнитно-резонанснойтомографии (Friston, 1994-1997). Для решения задачи моделирования выбрали архитектуруглубокой нейронной сети VGG Face (Parkhi et al., 2015), обученной задаче распознавания лиц надатасете из 2,6 млн.
изображений, собранных в интернете.Научнаяновизнаисследования.Впервыевкомплексномисследовании,спривлечением психофизических, психологических, фМРТ и нейротехнологических методов,изучены закономерности перестройки крупномасштабных нейронных сетей головного мозгачеловека при пороговых изменениях мимики лица и поворотов головы. Показано, чтонаблюдается одновременный значимый рост показателей правильных ответов испытуемых,числа измененных пикселей изображения, и числа активированных вокселей головного мозга взависимости от градаций выраженности признаков.
Впервые, методом фМРТ, определенминимум информации, необходимый для распознавания мимики. Показано, что в пороговых9условиях наблюдается статистически значимое увеличение уровня BOLD-сигнала практическиво всех областях головного мозга человека, обеспечивающих распознавание, принятие решенияи организацию двигательного ответа. Данное увеличение сопровождается усилениемситуативной тревоги у испытуемых. Исследована перестройка сети при изменении инструкциии адаптации к повторным предъявлениям одного и того же тестового изображения. Методоманализа BOLD-сигнала показано, что структуры мозга, обеспечивающие важнейшиекогнитивные процессы, взаимодействуют по принципу оппонентности, т.
е. осуществляютрешения по множественным критериям и по конфликтующим оценкам. На основе полученныхрезультатов проведено моделирований распознавания мимики в условиях неопределенности спомощью искусственной нейронной сети VGG Face.Теоретическая и практическая значимость исследования. Результаты исследованияимеют фундаментальное междисциплинарное значение. В теоретическом плане полученныерезультатымогутбытьприменимыдлярешениязадачвобластипсихологииипсихофизиологии. В практическом плане - для разработки искусственных нейронных сетейглубокого обучения, способных эффективно проводить распознавание в пороговых условияхнаблюдения. Особое значение, данное направление имеет в области разработки системвизуального контроля, осуществляющих мониторинг потока людей на стратегических объектахнаблюдения, в эргономике при профессиональном отборе, в психиатрической клинике длясоздания новых маркеров, а также в реаниматологии при разработке нейротехнологийальтернативной коммуникации.Положения диссертации, выносимые на защиту1.Наблюдаются отличия порогов распознавания мимики и порогов распознаванияповорота головы от количества измененных пикселей в тестовом изображении.
Отмечаетсяодновременный значимый рост показателей правильных ответов испытуемых, измененныхпикселей в тестовых изображениях и числа активированных вокселей головного мозга взависимости от градаций выраженности признаков.2.В задачах распознавания лиц в условиях высокой степени неопределенностииспытуемые ощущают эмоциональную напряженность и беспокойство, что отражено в шкалахпсихологического интегративного теста определения тревоги.3.Инструкция и адаптация к конкретной форме лица оказывают существенноевлияние на перестройку крупномасштабной нейронной сети распознавания лиц.
Перестройканейронной сети определяется инструкцией, стимулами–изображениями, их физическими,геометрическимиисемантическимихарактеристиками,обеспечивающимивосприятие,узнавание, понимание и планирования ответных действий. Структуры мозга, обеспечивающие10распознавание лиц, взаимодействуют по принципу синхронности и оппонентности, т. е.осуществляют решения по множественным критериям и по конфликтующим оценкам.Апробацияивнедрениерезультатовисследования.Основныеположениядиссертационного исследования были представлены и обсуждены на российских имеждународных конференциях: «Нейробиология интегративных функций мозга» (СанктПетербург, Россия 2013), «Шестая и седьмая международная конференция по когнитивнойнауке» (Калининград, Светлогорск, Россия 2014, 2016), «Прикладная оптика» (СанктПетербург, 2014, 2016), «Нейронаука в психологии, медицине, образовании» (Санкт-Петербург,Россия 2014), «Лицо человека в науке, искусстве и практике» (Москва, Россия 2014),«Естественно-научныйподходвсовременнойпсихологии»(Москва,Россия2014),«Технологическая перспектива в рамках Евразийского пространства: новые рынки иточки экономическогороста»(Санкт-Петербург,2015,2016),«BNA2015»(Эдинбург,Шотландия, 2015), «Нейронаука для медицины и психологии» (Санкт-Петербург, Россия 2015),«Лицо человека в пространстве общения» (Москва.
Россия 2016), «Ананьевские чтения-2016.Психология – вчера, сегодня, завтра» (Санкт-Петербург. Россия 2016), «Video and audio signalprocessing in the context of Neurotechnologies» (Санкт-Петербург, Россия, 2016).Материалы работы и ее результаты реализованы при выполнении двух грантовРоссийского научного фонда: «Психофизиологические и нейролингвистические аспектыпроцесса распознавания вербальных и невербальных паттернов» (Санкт-Петербургскийгосударственный университет, проект № 14-18-0213) и «Технологии оптимизации ивосстановления когнитивных функций человека виртуальной средой (Институт физиологии им.И.П.
Павлова Российской академии наук, проект № 14-15-00918).Публикации. По теме диссертационного исследования опубликовано 22 работы, в томчисле 7 в изданиях, рекомендованных ВАК для опубликования результатов диссертационныхисследований.Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения,списка литературы и приложение. Основной текст диссертации изложен на 130 страницах,содержит 27 таблиц и 49 рисунков.11Глава 1 ОБЗОР ЛИТЕРАТУРЫ1.1 Психофизиологические механизмы распознавания лицаСпособность зрительной системы по «мельчайшим», то есть находящимся на порогераспознаваниялица,точноопределитьэмоциональноесостояниечеловекакажетсяудивительной, но происходит повседневно.