Диссертация (1147543), страница 14
Текст из файла (страница 14)
Для наиболее общей49категории сцен авторы предложили дихотомии признаков «внутри помещения-вне помещения»и «природный-урбанистический». Уровень вышестоящих сцен был разработан с учетомпризнаков общего уровня – ими стали изображениния природных и урбанистических объектов всценах (озеро, пляж, дом, школа). Для описания сцен с изображением машин в большей степенииспользовались характеристики «движения», описания были «акивными». Для описанияизображений песка и воды участниками использовались более спокойные характеристки. Длябазового уровня использовались категории – начальная и средняя школы.
Описания последнихкатегорий были самыми сложными для участников и были в большей степени сделаны с опоройна памятьВ современные исследования категоризации природных сред принято создавать свойнабор стимулов и категоризировать их с учетом катогрий разработанных Tversky and Hemenwayуровней и выделенных ими закономерностей.
Так, эксперименты Thorpe et al. (1996) показали,что респонденты при восприятии реалистических изображений быстрее идентифицировалиобъекты вышестоящего уровня (транспортные средства/животные), чем объекты базовогоуровня (автобусы/собаки) в сложном визуальном образе (Macé, Joubert, Nespoulous, & FabreThorpe, 2009; Praβ, Grimsen, König, & Fahle, 2014).
Аналогичные результаты были показаны висследованиях Kadar & Ben-Shahar, 2012; Rousselet, Joubert, & Fabre-Thorpe, 2005. В этихэкспериментах задача респондентов состояла в то, что после предъявления изображения,респондентам предлагалось выбрать правильный вариант ответа из двух альтернатив, например,улица или пляж. Участники исследовании быстрее различали общие урбанистические иприродные сцены, чем базовый уровень - моря и горы.В исследованиях Crouzet, Joubert, Thorpe, & Fabre Thorpe, 2012; Praβ et al., 2014 показановлияние фактора одушевленности объектов изображения на скорость опознания всегоизображения.Хотя в геометрической прогрессии растет число исследований скорости распознаванияреалистических изображений, нам мало известно о механизмах, которые поддерживают этувозможность.Теориипредварительногооптимальноговизуальногоопытакодированиямогутбытьутверждают,использованы,чточтобыспособностиоблегчитьвычислительную нагрузку визуальной обработки.Таким образом, можно сделать следующие выводы.
Вероятней всего у человекасуществуют пределы возможностей распознания визуальных стимулов; предварительныйвизуальный опыт облегчает восприятие стимулов.501.3.2. Теории локального и глобального анализа в восприятии фрагментарных иреалистичных изображенийПроблема восприятия и распознавания образов остается одной из важнейших проблемсовременной науки, в рамках которой одно из центральных мест занимает вопрос локального иглобальногоанализаизображений.Cовременныеисследованияимеюткомплексныймеждисциплинарный подход. В исследовании данного вопроса принимают участие когнитивныепсихологи, психофизиологии и нейрофизиологи.
В рамках проблемы восприятия ираспознавания образов могут быть выделены два подхода в исследовании восприятияизображенийзрительнойсистемой:определениеглобальныхстатистическихсвойствизображений и выделение локальных информативных признаков высшего порядка. Эти подходыописывают два различных механизма, которые могут быть задействованы для распознаванияобъектов: механизмы глобального описания и локального описания изображения.
Выявлениевозрастных особенностей сложно организованных стимулов, требующих выделения либоцелостного изображений (глобальный признак) либо его деталей (локальный признак) имеетважное значение для понимания механизмов, лежащих в основе реализации этой функции наразных этапах онтогенетического развития. Локальное описание изображения осуществляетсяна основе локальных признаков, глобальное – на основе статистических характеристикцелостного изображения (Красильников, Шелепин, 1996, 1997; Шелепин и др., 2008).
Согласноимеющимся в литературе данным глобальные признаки распознаются быстрее и процесс ихобработки более автоматизирован, в отличие от локальных признаков, для распознаваниякоторых требуется участие систем произвольного избирательного внимания (Boer, Keuss,1982).Вместе с тем, на опознание глобальной и локальной информации существенное влияниеоказывают размеры стимула, контрастность изображения и последовательность в которыйпредъявлялись стимулы (Han, Weaver, Murray, Kang, Yund, Woods,2002).
Например, былопоказано, что время ответа в тех случаях, если опознаваемый уровень совпадал с предыдущимбыло значительно быстрее, независимо от того глобальным или локальным он был. Подобноеявление было названо «level_repetition Effect».Остается открытым вопрос, при решении каких задач какой из этих подходовдоминирует, как происходит построение целостного образа.Психофизические и нейрофизиологические исследования локального и глобальногоанализа в зрительной системе посвящены изучению: пространственных механизмов связыванияи временных процессов, взаимодействия между нейронами, в результате которых происходитформирование образа (Шошина, Шелепин, 2013; Calderone et al., 2013; De la Rosa et al., 2011;51Conci et al., 2011; Шелепин и др., 2008; 2009).
Усилия исследований психофизиологов инейрофизиологовсосредоточенынадвухнаправлениях:наизучениипринциповсогласованности оптических свойств неполных изображений и их представлений в зрительнойсистеме человека (Красильников, Шевелев, 1996, Field, 1987) и на изучении временныхпроцессов в нейронной сети, обеспечивающих связывание фрагментарных элементов в единоецелое (Подвигин, Багаева, Подвигина, 2005).От нейрофизиологических исследований локального и глобального анализа вернемся кпсихологическимисследованиях,проводимымврулекатегоризацииреалистическихизображений.
Для объяснения столь быстрого процесса категоризации было предложено дваподхода: объект-центрированный и сцена-центрированный.Содержание объект-центрированного подхода близко к описанию локального подхода. Врамках этого подхода основной фокус на содержании изображения. В рамках второго подходафокусировкапроисходитнаконтекстеизображения,причемкаждаяпредложеннаяхарактеристика в рамках этого подхода относится не к конкретному объекту изображения, а ковсему изображению в целом («естественный—искусственный»,«угловатый—гладкий»,«открытый—закрытый»).Данные изображения (рисунок 1, Oliva A., Torralba A.,2002) являются примерами разницыописаний между объект-центрированным и сцена-центрированным (scene-centered) подходами.Первое описание каждой картинки принадлежит объект-центрированной парадигме, на немпредставлен список объектов присутствующих на изображении (люди, машины, небо, лампа ит.д.).
Второе описание каждой картинки выполнено в рамках сцена-центрированного подходаРисунок 1. Примеры объект-центрированного и сцена-центрированного описания(иллюстрация из Oliva A., Torralba A. (2002). Scene-centered description from spatial envelopeproperties, in 2nd Workshop on Biologically Motivated Computer Vision (BMCV) (Tübingen,Germany).Исследования Oliva & Torralba являются классическим примером сцена-центрированногоконтекстного подхода ‘‘scene-centered approach’’. Авторы вводят нескольких относительно52простых фильтров, работающих без обратной связи.
Отсутствием обратных связей можетобъясняться высокая скорость обработки, а также то, что она оказывается возможной даже вусловиях отвлечения внимания. Работая с частотным спектром изображений, не зависящим отточной пространственной локализации и идентичности отдельных объектов, эти фильтры«позволяют оценивать зрительные сцены одновременно по нескольким глобальным измерениям«протосемантикисцен»:«естественный—искусственный»,«угловатый—гладкий»,«открытый—закрытый» и т.д» (Величковский, 2006, с.227). Авторы описывают процесскластеризации конкретных изображений в координатах семантического пространства какпримеры «интерьера дома», «морского пейзажа», «городских построек», «горного пейзажа».Важно еще раз подчеркнуть, что в рамках данного подхода общий смысл сцены можетбыть выделен глобально до детального восприятия отдельных наполняющих ее предметов.
Такаявозможность быстрой семантической классификации осмысленных сцен, по-видимому, иобуславливает особую успешность их восприятия и запоминания. Б.М. Величковский даетследующую интерпретацию данного механизма, «быстрые и полностью однонаправленные, тоесть осуществляемые в режиме bottom-up, процессы глобальной семантической классификациипозволяют в рамках известной семантической категории (схемы, или фрейма) осуществлятьнаправленную проверку идентичности вероятного предметного заполнения сцены.
Глобальныеизмерения оптимизируют движения внимания при зрительном поиске, обеспечивают нужноешкалирование гранулярности внимания, позволяют предвосхитить вероятные особенностиочертаний предметов и их пространственной локализации» (Величковский, 2006, с.228). Вместес другими эффектами контекста, в частности, наряду с так называемыми прайминг-эффектами,семантическая категоризация позволяет ситуативно модифицировать параметры априорной«заметности» тех или иных фрагментов сцены, существенно дополняя, таким образом, в предметной осмысленной среде действие классических факторов перцептивной организации(Torralba, 2005).Главный аргумент против ‘‘scene-centered approach’’ заключается в том, что пониманиесути изображения происходит настолько быстро, что невозможно так быстро произвестипространственную обработку компонентов изображения (Biederman, 1972; Biederman et al., 1982;Potter, 1975; Rousselet et al., 2005).В отечественной науке результаты исследований узнавания и категоризации естественныхсцен были систематизированы и объяснены в рамках теории микрогенеза В.М.
Величковского.В.М. Величковский описывает результаты эксперимента Potter, Staub & O'Connor, (2004) какпромежуточные фазы микрогенеза восприятия, длящиеся от 80 до 200мс. Эти промежуточныефазы, по мнению автора, как бы отвечают на вопрос «На что это похоже?».53Согласно теории микрогенеза, восприятие предмета начинается с его динамическойлокализации в трехмерном окружении, затем происходит спецификация его общих очертаний и,наконец, инвариантное восприятие тонких внутренних деталей (Величковский, 1973; 1982).Базовый цикл микрогенеза восприятия может занимать до 300 мс и требует участия внимания.Таким образом, через треть секунды после предъявления зрительный образ предмета лишьвпервые формируется, а отнюдь не прекращает свое существование.В рамках теории микрогенеза простое объяснение получает маскировка стимула.
Онавозникает из-за ошибочной спецификации маскирующего стимула после правильнойлокализации тестового. Другими словами, происходит подмена объекта: при предъявлениитестового объекта мы обращаем на него внимание и определяем его местонахождение (в течениепримерно 100 мс), но при переходе на ступень детальной спецификации его индивидуальныххарактеристик, таких как цвет и форма, находим в соответствующей области уже другой объект,который и воспринимается нами вместо первого (Enns, Di Lollo, 2000; Enns,2004).Таким образом, ученые постепенно приходят к выводу о существовании глобальнойдвухуровневой архитектуры восприятия: сначала объект воспринимается как относительнонедифференцированное, но локализованное в трехмерном пространстве нечто, затем — какпредмет с индивидуальными признаками, такими как цвет и форма (Hillyard & Anllo-Vento, 1998;Enns & Di Lollo, 2000; Величковский, 2006).1.4.