Диссертация (1147543), страница 13
Текст из файла (страница 13)
Таким образом, процесс категоризации состоит из четырех этапов: собственно зрительноевосприятие, анализ и переработка воспринятого, принятие решения о воспринятом и ответ.Дальнейшая работа в этой области шла в нескольких направлениях. Другие известныеисследователи пытались выяснить, какие элементы образа оказывают решающее влияние и несутинформацию об общем смысле изображения. Любопытно, что их выводы относительнозрительного восприятия сцены согласуются со слуховыми исследованиями пониманияпредложений и слов. В.М. Величковский указал на то, что «общий смысл» ситуации влияет нарешение многих других перцептивных задач, если они имеют выраженную «эндогенную»(причем не только когнитивную, но и эмоциональную) составляющую, как это происходит вслучае целенаправленного зрительного поиска и обнаружения.
Так, Бидерман (Biederman, 1972)с соавторами показали, что понимание «общего смысла» увиденного ухудшается в случаесмыслового несоответствия изображенных вместе объектов. Они определили несколькофизических (поддержка, вмешательство) и семантических (вероятность, должность, размер)параметров, которым должны удовлетворять воспринимаемые объекты в сцене.
Автором былиразработаны своеобразные синтаксические и грамматические правила языка зрительноговосприятия (Бидерман, 1982). Исследователи пришли к выводу, что для восприятия объектов, атакже отношений между объектами достаточно фиксации одного взгляда (Бидерман, 1982),причем независимо от ожидания и опыта испытуемого (Бидерман и др., 1983). Также нахождениецелевого предмета (ключевой семантический объект) в сложной предметной сцене резко затрудняется при нарушении ее общей пространственно-смысловой организации, даже если локальноеокружение, положение и ориентация самого предмета при этом остаются неизменными(Biederman, Glass & Stacy, 1973).
В.М. Величковский также в своих исследованиях показал, чтоважнымиусловиямидляточноговосприятияявляютсяцелостностьипредметнаяправдоподобность «полностью абстрактные изображения и предметные сцены, поставленные«на голову» или расчлененные на несколько переставленных кусков, не обнаруживают и долиуспешностиузнаванияэкологическиестественногоматериала»(Величковский,2006,с.214). Существуют убедительные доказательства того, что обработка объектов зависит отконтекстной информации, но до сих пор не ясен вопрос о первоначальности восприятия объектовили контекста (Ganis & Кутас, 2003; Хендерсон, 1992; Henderson & Холлингворт, 1999;Холлингворт & Хендерсон, 1998). Boyce, Pollatsek и Рейнер (1989) показали, что объекты труднееопределить, когда они расположенны на неадекватном или неожиданном фоне.46Узнавание предметных сцен оказывается весьма успешным при повороте изображенийотносительно вертикали, не нарушающем законы гравитации (Величковский, 2006).
Этосвидетельствует «о целостности процессов сравнения, которые явно не сводятся кпоэлементному совмещению тестовой сцены и репрезентаций памяти» (Величковский, 2006,с.214).Однако с развитием ЭВМ эксперименты в этом направлении становились все болеесложными и демонстрировали все более невероятные результаты. Торп (Thorpe) с соавторами(1996) показали, что присутствие на фотографии животного (или автомобиля) может бытьбыстро обнаружено человеком, всего лишь за 150 мс и нейрофизиологические корреляты этогообнаружения наблюдаются в префронтальной области коры головного мозга.
Большинствоисследований в данном направлении опираются на уровневую концепцию восприятия: низкий,средний и высокий уровни. Согласно данной парадигмеисследования показывают, чтосенсорный уровень распознавания (низкий уровень) предшествует обнаружению и пониманиюсемантически значимых стимулов сцены – высокий уровень (Johnson & Olshausen, 2003;VanRullen & Thorpe, 2001). Другие данные свидетельствуют о том, что семантически значимыевоспринятые объекты могут, в свою очередь, оказывать влияние на более низкие уровни, данныйфеномен получил название объект зависимой сегментации (Peterson & Gibson, 1993, 1994;Peterson & Kim, 2001).
Недавно, Grill-Spector and Kanwisher (2005) обнаружили, что людиоказываются точны как при категоризации объектов в сцене, так и при узнавании объекта внесцены. Ученые пришли к выводу, что оба процесса нуждаются в одинаковом количествеинформации, а именно в одинаковом времени нейронной обработки. Ключевой вопрос состоит всоотношении времени восприятия объектов в сцене и восприятия сцены в целом.ИсследованияM.Fabre-Thorpe,A.Delorme,C.Marlot,S.Thorpe(2001)продемонстрировали очень высокую точность и высокую скорость зрительной системы вклассификации различных видов объектов, таких как животные, люди, транспортные средстваили продукты питания.
В данном эксперименте изображения, предъявляемые на 20мс, быликатегоризированы людьми с высокой степенью успешности (94%), причем скорость реакциинаходилась в пределах 400мс с задержкой времени ответа на 250мс (Delorme, Richard, & FabreThorpe, 2000; Fabre-Thorpe et al., 2001; Fabre-Thorpe, Richard, & Thorpe, 1998; Rousselet, Mace´, &Fabre-Thorpe, 2003; Thorpe, Fize, & Marlot, 1996; VanRullen & Thorpe, 2001). Время реакциивключало время обработки изображения, принятие решение и механический ответ (Bacon-Mace´,Mace´, Fabre-Thorpe, & Thorpe, 2005; VanRullen & Thorpe, 2001). В экспериментах Филипповойбыло продемонстрировано, что изображения, предъявляемые на подпороговом уровне (30 мс), нетолько воспринимаются, но и семантически обрабатываются [Филиппова, 2006].47N. Bacon-Macé, M.J.-M.
Macé, M. Fabre-Thorpe, S. J. Thorpe (2005) в эксперименте накатегоризацию природных сцен продемонстрировали влияние варьирования времени показамаски от 6 до 106 мс на успешность категоризации. Экспериментаторы выяснили, чтонаибольшие сложности в категоризации объектов респонденты испытывали при предъявлениимаски на время от 25 до 106 мс. В этом случае резко снижалось число правильных ответов. Крометого, время предъявление маски повлияло на время реакции респондентов. Чем меньше былопредъявление маски (6, 12, 19, 25 и 31 мс), тем дольше было время реакции в сравнении современем предъявления (44, 81 и 106 мс). Авторы делают вывод о том, что само времяпредъявления маски рассматривается респондентами, как этап анализа перцептивнойинформации и принятия решения.
Таким образом, существует сильное влияние маски на среднеевремя реакции, но начальная часть распределения, соответствующий ранних откликов, незатрагивается.Эксперименты на категоризацию объектов реалистичных сцен очень важны, они даютпонять временные ограничения в скорости обработки реальных объектов. Проблема этихэкспериментов в том, что они игнорируют семантическую связь между объектами, однако вдействительности «контекст» изображения (поле вокруг) помогает нам категоризировать самобъект. Действительно, в картинах природных сцен, объекты никогда не изолированы, и мывидим их на фоне в окружении других объектов и различных контекстных элементов.Описанные выше выводы были получены в результате экспериментов быстройкатегоризации естественных сцен. Суть метода исследования заключается в парадигмепринудительного выбора, в которой после предъявления изображений дан краткий списоквозможных ответов (Biederman, Rabinowitz, Glass, & Stacy, 1974).Любопытное исследование было проведено L.
Fei-Fei, A. Iyer,Ch. Koch, P. Perona (2007), врамках которого респондентам предлагалось написать свободный отчет об увиденныхизображениях. Время предъявления варьировалось от 27 до 500мс (27мс, 40мс, 53мс, 67мс, 80мс,107мс, 500мс). Результаты этого эксперимента показали, что для восприятия несемантическойинформации, связанной со светом и тенью, а также цветом требуется меньше времени, чем дляидентификации объектов или отношений между объектами, что противоречит данным GrillSpector and Kanwisher (2005).Важно отметить, что объектная категоризацияпредставлена различными уровнямииерархической организации семантической информации (Rosch, Mervis, Gray, Johnson, & BoyesBraem, 1976). Классическое исследование Rosch и др.
(1976) определило базовый уровень вкачестве наиболее доступного, простого для визуальной идентификации и категоризации(например, категория собак опознается быстрее, чем категория животных или золотистый48ретривер). В классических экспериментах объекты предъявлялись вне сцены, однакосовременныеисследованияреалистическихнацеленыизображений.Внапониманиесовременныхзакономерностейисследованияхбыстройкатегоризациикатегоризацииреалистических изображений используется модель иерархической категоризации для узнаванияи идентификации объектов Э. Рош в модификации Tversky and Hemenway (1983)дляреалистичных природных сред.В серии своих исследований Tversky and Hemenway описаели общие принцыпывосприятия сцен, объектов вне суны и внутри сцены.
Экспериментальные исследования авторовподтвердили гештальт-тезис о то, что восприятие целостной конфигурации часть—целое —является решающим фактором в определении базового уровня. Основной вывод авторовзаключается в том, что базовый уровень отличается от всех других уровней типом признаков,ассоциирующихся с категорией на этом уровне. Это прежде всего касается признаков, связанныхс частями целого. Причина этого в том, что способ, которым объект «разделяется» на части,определяет многие другие вещи. Во-первых, части обычно соотносятся с функциями, поэтомунаше знание о функциях обычно связано с знанием о частях. Во-вторых, части определяют общийвид и, следовательно, особенности его восприятия и его мысленного образа.
В-третьих, мыобычно взаимодействуем с вещами через их части, поэтому деление часть—целое играетглавную роль в выборе той или иной двигательной программы, которую мы используем привзаимодействии с объектом (Tversky and Hemenway, 1983).Tversky and Hemenway также показали, что человек проецирует структуру часть-целое насобытия, поэтому наши представления о категориях объектов структурируются по образу иподобию наших представлений о сцене, в которой находится объект.В работе Tversky and Hemenway (Tversky, Hemenway, 1982) было показано, что припереработке знакомых и незнакомых объектов изменяются коэффициенты при аргументах,описывающих сходство и различие. В случае аналитического способа переработки возрастаетудельныйвес общих признаков, тогда как холистическая переработка оказываетсячувствительной к признакам различия.Tversky and Hemenway (1983) реплицировали дизайн эксериментов Э.Рош для сцен и наеё основе разработали классификацию уровней для природных сред: общие сцены, вышестоящий(высший) уровень, базовый уровень.
Результаты несколько разнились с классическими. Задачаучастников экспериментов заключалась в том, чтобы дать характеристики предъявляемымизображения. На основе этих характеристик и их обощения авторы составили семантическиедеревья. Сложность и новизна экспериментов Tversky and Hemenway заключалась в том, что в ихзаданиях заключались как категории объектов, так и характеристики сцен.