Диссертация (Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка), страница 3
Описание файла
Файл "Диссертация" внутри архива находится в папке "Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка". PDF-файл из архива "Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Ранние этапы процесса чтенияв большинстве случаев остаются вне области интересов ученых. Мы можемвыделить только несколько исключений [Арутюнян, 2017; Коршунов, 2013b;Лауринавичюте и др., 2016].В результате исследования сформулированы и выносятся на защитуследующие положения.1. Информация о длине слова, полученная при обработке боковым зрением,используется когнитивной системой не только для выбора места следующейфиксации, но и для ограничения списка возможных кандидатов прилексическом доступе.2.
Буквы в словах в языке с промежуточным типом орфографии вычленяютсяпараллельно.3. При активации менее частотного слова-соседа с заменой одной буквыорфографическая обработка ускоряется, а слово-сосед с перестановкой двухбукв не замедляет орфографическую обработку слова даже при большейчастотности. Это позволяет нам судить о том, как идет процесс отборакандидатов при лексическом доступе: можно сделать вывод, что13отвергнутыевысокочастотныекандидатыподавляютсянедостаточноэффективно.4. По крайней мере в русском языке центральные буквы в слове обладаютбольшей значимостью для доступа в ментальный лексикон, чем крайниебуквы.5.
Морфологическаяобработкапроисходитнаоченьраннемэтапе,параллельно с распознаванием графического облика слова.6. РазработаннаябазаданныхсStimulStatвеб-интерфейсом(stimul.cognitivestudies.ru), содержащая более 50 тысяч лемм (и более 1,7млн. словоформ), позволяет подбирать слова и получать информацию поболее чем 70 психолингвистическим параметрам, а также может бытьрекомендована для использования в психолингвистических экспериментахширокого спектра.Достоверность полученных результатов обеспечивается значительнымобъемомсобранногоматериаласиспользованиемсертифицированногооборудования и компьютерного обеспечения (проведено 7 экспериментов, вкоторых приняло участие в общей сложности 467 носителей русского языка) иприменением современных статистических методов для его обработки.Апробацияработы.Отдельныеаспектыиосновныеположениядиссертационного исследования обсуждались на многих отечественных имеждународных конференциях и семинарах.
В их числе Шестая и Седьмаямеждународная конференция по когнитивной науке (Калининград, Россия, 2014 г.и Светлогорск, Россия, 2016 г.), Четвертая конференция «Когнитивная наука вМоскве: новые исследования» (Москва, Россия, 2017 г.), Международныефилологические конференции преподавателей и аспирантов (Санкт-Петербург,Россия, 2014 и 2017 гг.), Международные конференции по компьютернойлингвистике и интеллектуальным технологиям «Диалог» (Москва, Россия, 2015 и2017 гг.), Workshop on Reading in Cyrillic (Москва, Россия, 2015 г.), Вторая14конференция-школа «Проблемы языка: взгляд молодых ученых» (Москва, Россия,2013 г.), II Международная научная конференция «Язык и метод. Русский язык влингвистических исследованиях ХХI века: Лингвистический анализ на граниметодологического срыва» (Краков, Польша, 2014 г.), 20th Conference of theEuropean Society for Cognitive Psychology (Потсдам, Германия, 2017 г.), The 7thTutorial and Research Workshop on Experimental Linguistics (ExLing 2016) (СанктПетербург, Россия, 2016 г.), International Morphological Processing Conference(Триест, Италия, 2017 г.).
Работа выполнялась в рамках научных проектов,поддержанных грантами РГНФ №14-04-00586 и №14-04-12034, РНФ №14-1802135. По теме диссертации опубликовано 12 работ, в том числе две публикации визданиях, включенных в перечень российских рецензируемых научных журналови изданий, рекомендованных для опубликования основных научных результатовдиссертации [Алексеева, Слюсарь, 2017a; Алексеева, Слюсарь, 2017b], и тристатьи, опубликованные в изданиях, включенных в индексы цитирования Web ofScience/Scopus [Слюсарь, Алексеева, 2017; Alexeeva, Frolova, Slioussar, 2017;Alexeeva, Slioussar, Chernova, 2018].Объем и структура работы.
Диссертация состоит из введения, четырехглав, заключения, списка литературы, списка источников и семи приложений.Ввиду того, что визуальное распознавание слов на ранних этапах процесса чтенияявляется чрезвычайно обширной областью, нам представляется невозможнымобъединить все исследования в общем обзоре литературы. По этой причине мыанализируемлитературу,релевантнуюдлякаждойизизбранныхдляисследования проблем, в начале каждой из четырех глав. Общий объем работысоставляет 230 страниц, основное содержание изложено на 211 страницах исодержит 17 рисунков и 12 таблиц, приложения занимают 19 страниц.
Списоклитературы состоит из 220 наименований, включающих 183 наименования наиностранных языках. Список источников состоит из 8 наименований.15Глава 1. Длина слов при чтении текстов1.1 ОБЗОР ЛИТЕРАТУРЫ1Процесс чтения включает в себя сложное взаимодействие зрительноговосприятия, окуломоторных процессов (движений глаз) и лингвистическойобработки. При чтении, как и при обработке любой другой визуальнойинформации, наши глаза постоянно находятся в движении: краткосрочныеостановки (фиксации), продолжительностью обычно от 60 до 600 миллисекунд (всреднем 200-250 мс 2 ), чередуются с очень быстрыми, порядка 500°/с и выше,баллистическими скачками (саккадами). Скорость саккад настолько велика, чтово время скачков человек ничего не воспринимает (это называется саккадическимподавлением).
Вся визуальная обработка происходит во время фиксаций[Фёдорова, 2008; Rayner, 1998]. Саккады обычно длятся 20-50 мс (в зависимостиот того, насколько далеко нужно переместить глаза) и покрывают в среднем 7-9символов (включая пробелы) 3 . Около 10-15% саккад являются регрессиями, тоесть возвратами к уже прочитанному.Читая текст, люди непосредственно фиксируют взгляд приблизительно на70% слов в тексте, остальная часть слов пропускается. Это характерно, преждевсего, для коротких (легких для обработки) слов. На сложных для обработки1Исследуемые в данной главе вопросы были рассмотрены в нашей статье [Алексеева, Слюсарь, 2017a].Работа выполнена в соавторстве.
Автороство разделено, согласие авторов на использование результатов иматериалов публикации в тексте диссертации получено.2Все цифры, здесь и далее, если не указано иного, соответствуют ситуации внимательного чтения текстасредней сложности взрослыми носителями английского языка.3Вне зависимости от расстояния до монитора и размера шрифта [Schotter, Angele, Rayner, 2011]16словах (низкочастотных, плохо предсказуемых и др.) читающие обычнофиксируют взгляд несколько раз (это называется рефиксацией).
Наличиепропусков и рефиксаций не позволяет использовать единственно общее времяпрочтения для полного отражения процессов распознавания слов читающими,поэтому в настоящее время применяют целый набор мер, основанных на понятиидлительности фиксаций: длительность первой фиксации, независимо от того,сколько раз затем на слове зафиксировался взгляд (first fixation duration);длительность единственной фиксации (single fixation duration); время первогопрохода, т. е. сумма всех фиксаций на слове во время первого прочтения, включаярефиксации (gaze duration); общее время прочтения (total viewing time), в котороевходят все фиксации на слове, включая фиксации после регрессии к этому слову идр.
[Rayner, 2009]. Первые три меры соответствуют ранним стадиям обработкислова, последняя мера отражает процессы, происходящие на поздних стадияхпроцесса распознавания [Oxford handbook of eye movements, 2011, с. 754]. Средидругих мер, описывающих движения глаз при чтении, следует упомянутьколичество фиксаций на слове, размер саккады (в символах) и относительноеместо первой фиксации, вычисляемое как координата Х места первой фиксации (впикселях), поделенная на длину слова (в пикселях).Глаз находится в постоянном движении в связи с тем, что четкостьвоспринимаемого изображения является максимальной лишь в небольшойобласти сетчатки — ее называют центральной ямкой или фовеей — гдесконцентрировано наибольшее количество светочувствительных рецепторов[Барабанщиков, Жегалло, 2014]. Фовея соответствует области изображенияразмером до 2 угловых градусов зрительного поля (2°) относительно точкификсации (3–4 символа), на расстоянии от 2 до 5° (до 15–20 символов) находитсяобласть парафовеи с менее четкой разрешающей способностью, за пределами 5°визуальных углов — область периферии, где человек практически ничего невоспринимает [Rayner, 1998; Schotter, Angele, Rayner, 2011].17В связи с неоднородностью поля восприятия встает вопрос: во времякаждой фиксации мы распознаем только ту часть текста, которая соответствуетфовеальной области, или в функциональное поле читающего также попадаютслова, которые находятся в парафовее, справа от точки фиксации (принаправлении чтения слева направо)? Ответить на этот вопрос стало возможным,когда появились методики, позволяющие регистрировать движения глаз вреальном времени и проводить различные манипуляции с текстом (например,изменять текст) прямо во время осуществления саккад, то есть тогда, как человекничего не воспринимает из-за саккадического подавления (см.