Автореферат (1147491), страница 2
Текст из файла (страница 2)
Провести спомощью искусственной нейронной сети глубокого обучения моделированиераспознавания мимики в пороговых условиях наблюдения.Объект исследования: крупномасштабная нейронная сеть головногомозга человека.Предмет исследования: закономерности перестройки крупномасштабнойнейронной сети при распознавании лиц в условиях неопределенности.6Гипотезы исследования:1.Пороги распознавания мимики и поворотов головы будутотличаться в зависимости от количества измененных пикселей изображения.2.В задачах распознавания лиц, в условиях высокой степенинеопределенности, испытуемые будут ощущать эмоциональную напряженностьи беспокойство, что найдет отражение в шкалах психологическогоинтегративного теста на определение тревоги.3.Число измененных вокселей в сравниваемых картах откликов мозга,по данным фМРТ, на изменение мимики и поворотов головы, может бытьсвязано с порогами распознавания, выявленными в психофизической серииисследования.4.Принятиерешенияоразличныхсвойствахстимуловосуществляется путем перераспределения активности между областями мозга.Структуры мозга, обеспечивающие важнейшие когнитивные процессы,взаимодействуют по принципу синхронности и оппонентности, т.е.осуществляют решения по множественным критериям и по конфликтующимоценкам.5.Существенными факторами неопределенности, вызывающимизначительную перестройку крупномасштабной нейронной сети, является сменаинструкции и низкая вероятность повтора стимула.
В условиях высокойвероятности повтора стимула эффект привыкания к мимике будет выраженсильнее в сравнении с условиями предъявления с низкой вероятность повторатестовых изображений.Методы исследования. Выборку составили 119 испытуемых в возрастеот 19 до 44 лет, средний возраст 26,4±4,7 лет. В основном, выборку составилистуденты СПбГУ, ИТМО, СПбПУ.В психологической и психофизиологической серии приняло участие 29испытуемых (13 мужчин и 16 женщин), возрастной диапазон и мужчин иженщин от 22 до 29 лет (средний возраст мужчин 26,1±1,2 года, среднийвозраст женщин 24,9±1,9, средний возраст по группе 25,4±1,7).В первой серии фМРТ-исследования приняло участие 14 испытуемых (10мужчин и 4 женщины), возрастной диапазон и мужчин и женщин от 21 до 27лет (средний возраст мужчин 24,4±2,1 года, средний возраст женщин 22,5±1,3средний возраст по группе 23,9±2,1).Во второй серии исследования приняло участие 24 испытуемых (8мужчин и 16 женщин), возрастной диапазон и мужчин и женщин от 19 до 33лет (средний возраст мужчин 24,5±2,8 года, средний возраст женщин 24,8±3,2,средний возраст по группе 24,7±3).В третьей серии исследования приняло участие 23 человека (13 мужчин и10 женщин), возрастной диапазон и мужчин и женщин от 22 до 44 лет (среднийвозраст мужчин 30±7,9 года, средний возраст женщин 30,4±6,2, среднийвозраст по группе 30,2±7,1).7Исследование проводили несколькими методами.
Для оценки иобобщения современного состояния проблемы провели анализ существующейлитературы. Для оценки порогов восприятия мимических выражений лиц иградаций поворота головы использовали традиционные психофизическиеметоды измерения порогов (Бардин, 1976). Для выявления уровня тревоги уиспытуемых использовали психодиагностический метод «Интегративный тесттревожности» (Бизюк, 1995). Распределение активности в головном мозгечеловека при наблюдении лиц определяли с помощью метода функциональноймагнитно-резонансной томографии (Friston, 1994-1997). Для решения задачимоделирования выбрали архитектуру глубокой нейронной сети VGG Face(Parkhi et al., 2015), обученной задаче распознавания лиц на датасете из 2,6 млн.изображений, собранных в интернете.Научная новизна исследования. Впервые в комплексном исследовании,спривлечениемпсихофизических,психологических,фМРТинейротехнологических методов, изучены закономерности перестройкикрупномасштабных нейронных сетей головного мозга человека при пороговыхизменениях мимики лица и поворотов головы.
Показано, что наблюдаетсяодновременный значимый рост показателей правильных ответов испытуемых,числа измененных пикселей изображения, и числа активированных вокселейголовного мозга в зависимости от градаций выраженности признаков. Впервые,методом фМРТ, определен минимум «информации», необходимый дляраспознавания мимики. Показано, что в пороговых условиях наблюдаетсястатистически значимое увеличение уровня BOLD-сигнала практически во всехобластях головного мозга человека, обеспечивающих распознавание, принятиерешения и организацию двигательного ответа. Данное увеличениесопровождается усилением ситуативной тревоги у испытуемых.
Исследованаперестройка сети при изменении инструкции и адаптации к повторнымпредъявлениям одного и того же тестового изображения. Методом анализаBOLD-сигнала показано, что структуры мозга, обеспечивающие важнейшиекогнитивные процессы, взаимодействуют по принципу оппонентности, т. е.осуществляют решения по множественным критериям и по конфликтующимоценкам. На основе полученных результатов проведено моделированийраспознавания мимики в условиях неопределенности с помощьюискусственной нейронной сети VGG Face.Теоретическая и практическая значимость исследования.
Результатыисследования имеют фундаментальное междисциплинарное значение. Втеоретическом плане полученные результаты могут быть применимы длярешения задач в области психологии и психофизиологии. В практическомплане - для разработки искусственных нейронных сетей глубокого обучения,способных эффективно проводить распознавание в пороговых условияхнаблюдения. Особое значение, данное направление имеет в области разработкисистем визуального контроля, осуществляющих мониторинг потока людей на8стратегических объектах наблюдения, в эргономике при профессиональномотборе, в психиатрической клинике для создания новых маркеров, а также вреаниматологииприразработкенейротехнологийальтернативнойкоммуникации.Положения диссертации, выносимые на защиту1.Наблюдаются отличия порогов распознавания мимики и пороговраспознавания поворота головы от количества измененных пикселей в тестовомизображении.
Отмечается одновременный значимый рост показателейправильных ответов испытуемых, измененных пикселей в тестовыхизображениях и числа активированных вокселей головного мозга взависимости от градаций выраженности признаков.2.В задачах распознавания лиц в условиях высокой степенинеопределенности испытуемые ощущают эмоциональную напряженность ибеспокойство, что отражено в шкалах психологического интегративного тестаопределения тревоги.3.Инструкция и адаптация к конкретной форме лица оказываютсущественное влияние на перестройку крупномасштабной нейронной сетираспознавания лиц. Перестройка нейронной сети определяется инструкцией,стимулами–изображениями,ихфизическими,геометрическимиисемантическими характеристиками, обеспечивающими восприятие, узнавание,понимание и планирования ответных действий.
Структуры мозга,обеспечивающие распознавание лиц, взаимодействуют по принципусинхронности и оппонентности, т. е. осуществляют решения помножественным критериям и по конфликтующим оценкам.Апробация и внедрение результатов исследования. Основныеположения диссертационного исследования были представлены и обсужденына российских и международных конференциях: «Нейробиологияинтегративных функций мозга» (Санкт-Петербург, Россия 2013), «Шестая иседьмая международная конференция по когнитивной науке» (Калининград,Светлогорск, Россия 2014, 2016), «Прикладная оптика» (Санкт-Петербург, 2014,2016), «Нейронаука в психологии, медицине, образовании» (Санкт-Петербург,Россия 2014), «Лицо человека в науке, искусстве и практике» (Москва, Россия2014), «Естественно-научный подход в современной психологии» (Москва,Россия 2014), «Технологическая перспектива в рамках Евразийскогопространства: новые рынки и точки экономического роста» (Санкт-Петербург,2015, 2016), «BNA2015» (Эдинбург, Шотландия, 2015), «Нейронаука длямедицины и психологии» (Санкт-Петербург, Россия 2015), «Лицо человека впространстве общения» (Москва.
Россия 2016), «Ананьевские чтения-2016.Психология – вчера, сегодня, завтра» (Санкт-Петербург. Россия 2016), «Videoand audio signal processing in the context of Neurotechnologies» (Санкт-Петербург,Россия, 2016).9Материалы работы и ее результаты реализованы при выполнении двухгрантовРоссийскогонаучногофонда:«Психофизиологическиеинейролингвистические аспекты процесса распознавания вербальных иневербальныхпаттернов»(Санкт-Петербургскийгосударственныйуниверситет, проект № 14-18-0213) и «Технологии оптимизации ивосстановления когнитивных функций человека виртуальной средой (Институтфизиологии им. И.П.
Павлова Российской академии наук, проект № 14-1500918).Публикации. По теме диссертационного исследования опубликовано 22работы, в том числе 7 в изданиях, рекомендованных ВАК для опубликованиярезультатов диссертационных исследований.Структура и объем диссертации. Диссертация состоит из введения, 4глав, заключения, списка литературы и приложение. Основной текстдиссертации изложен на 130 страницах, содержит 27 таблиц и 49 рисунков.ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫВо введении представлены актуальность, цель, задачи, гипотезы, объекти предмет диссертационной работы; обозначены методы исследования,показана научная новизна, теоретическая и практическая значимость работы исформулированы основные положения, выносимые на защиту.В Главе 1 приводится обзор литературы по теме исследования.Проводится критический анализ современных исследований, посвященныхрассмотрению и сопоставлению основных подходов к изучению проблемраспознавания изображений лиц в условиях неопределенности.