Диссертация (Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка". PDF-файл из архива "Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Слова были подобраны таким58образом, что целевая буква была представлена в слове только один раз, в то времякак остальные буквы могли повторяться.Рисунок 4. Целевые стимулы для экспериментов 2, 3, 4 и 5 (поиск символа в последовательности).Таким образом, всего в эксперименте было использовано 615 реальныхслов русского языка. Поскольку общее количество единиц оказалось достаточнобольшим, мы разбили все стимулы на 5 экспериментальных листов. В каждомэкспериментальном листе предъявлялись все 33 буквы, но только в одной из пятивозможных позиций. Из-за отсутствия или недостатка слов для некоторых парбуква/позиция(см.выше),невозможнобылораспределитьсловапоэкспериментальным листам равномерно.
Кроме того, отбирая слова для каждогоэкспериментального листа, мы старались сделать так, чтобы в каждой позициибыло одинаковое число букв, передающих гласный звук (10 букв в русском языке— гласные) и одинаковое число букв, имеющих выносной элемент (9 буквсодержат выносной элемент). В итоге в первом экспериментальном листесодержалось 116 единиц, во втором — 124, в третьем — 130, в четвертом — 124 ив пятом — 121.Задача на зрительный поиск предполагает, что помимо случаев, когдаискомый символ содержится в исходной последовательности, должны бытьслучаи (филлеры), в которых он будет отсутствовать. В качестве филлеров мыиспользовали слова из предыдущего по номеру экспериментального листа, но сдругой (отсутствующей в слове) искомой буквой.59После того, как мы сформировали экспериментальные листы для реальныхслов русского языка, мы обратились к конструированию произносимыхпсевдослов.
Для этого мы написали специальный скрипт на языке Python. На входэтому скрипту подаются уже отобранные реальные слова в паре с буквой, длякоторой они были найдены, и позицией этой буквы, а также список всехвозможных биграмм (двух смежных букв), которые встречаются в Частотномсловаре русского языка, вместе с позицией нахождения этой биграммы в слове.Скрипт случайным образом генерирует псевдослово из реального слова такимобразом, чтобы, во-первых, псевдослово содержало ключевую букву в той жепозиции, что и реальное слово; во-вторых, чтобы слоговая структура (CVCCV дляслова кошка, где C – согласная10, V – гласная) псевдослова и ключевого словабыла идентична; и, в-третьих, чтобы каждые две подряд идущие буквы (биграммы)в полученном псевдослове содержались в каком-нибудь другом реальном слове изЧастотного словаря русского языка в той же позиции.
Приведем пример одногосгенерированного псевдослова: для слова тюбик было сконструировано словофюран. Как видно, оба слова обладают слоговой структурой CVCVC, имеютбукву ю во второй позиции, слово фюран состоит из четырех биграмм фю, юр, ра,ан, которые встречаются в следующих словах русского языка в аналогичныхпозициях:фюрер,Цюрих,экран,декан.Сформированныепсевдословаотсматривались авторами на предмет благозвучия (при необходимости скриптзапускался заново).
Также мы добавили по два псевдослова парам буква/позиция,для которых не было найдено реальных слов.Сгенерированныепсевдословабылираспределеныпо5экспериментальным листам в соответствии с исходными словами, для которыхони были подобраны. Так же как у реальных слов, филлеры представляли собой10Буквы ь и ъ мы также отнесли к согласным.60стимулы из предыдущего по номеру экспериментального листа, но с другой(отсутствующей в псевдослове) искомой буквой.В результате мы получили 10 экспериментальных листов, которые былислучайным образом распределены между 100 участниками.2.2.1.3 ПроцедураЭксперимент проводился в тихом помещении, каждый испытуемыйтестировался индивидуально.
При проведении эксперимента использовалосьпрограммное обеспечение E-prime (Psychology Software Tools). В каждой пробеискомая буква предъявлялась в центре экрана на 1000 мс, далее следовал пустойэкран (500 мс). Затем предъявлялся буквенный ряд (слово или псевдослово вцентре дисплея), он оставался на экране до ответа испытуемого (см. Рисунок 5).Участников просили нажать на клавишу ‘/’ при обнаружении стимульной буквы вряду, и клавишу ‘z’ при ее отсутствии. Решение необходимо было принимать какможно точнее и быстрее.
Буква и стимульная последовательность предъявлялисьв нижнем регистре белым цветом на черном фоне (шрифт Georgia). Мыиспользовали 36 кегль для показа ключевой буквы и 18 кегль для стимульнойпоследовательности11.11Временные интервалы и способ показа стимулов в целом были такими же, как в исследовании[Pitchford, Ledgeway, Masterson, 2008]. Отличия заключались в выборе шрифта (Georgia в нашем vs. Geneva уН. Питчфорда и коллег), регистра (нижний у нас vs. верхний у Н. Питчфорда и коллег) и размере шрифтастимульной последовательности (18 у нас vs.36 у Н. Питчфорда и коллег).61Буква содержится в стимульнойпоследовательностиПредъявлениебуквыжБуква отсутствует в стимульнойпоследовательностижПустой экранПредъявлениебуквенного ряда1000 мс.500 мс.пожарсезондо ответа (макс.2000 мс.)Рисунок 5.
Порядок предъявления стимулов в задаче на зрительный поиск в экспериментах 2, 4 и 5 (поиск символа впоследовательности).Эксперимент был разбит на четыре блока приблизительно по 60 проб.Распределение стимулов по блокам и показ стимулов внутри блока осуществлялсяслучайным образом для каждого испытуемого. После каждого блока следовалперерыв, во время которого испытуемый мог взять паузу на неограниченноеколичество времени. Следующий блок начинался, как только испытуемыйнажимал любую кнопку ответа (клавишу ‘/’ или клавишу ‘z’).Программное обеспечение регистрировало ответ испытуемых и времяреакции.
Если испытуемые принимали решение относительно некоторого стимуладольше, чем за 2000 мс, то такой ответ исключался из дальнейшего анализа.Порог взят из ранее рассмотренного исследования [Pitchford, Ledgeway, Masterson,2008]. Всего из анализа был удален 1% таких ответов. Для выявления выбросов«снизу» мы использовали диаграмму размаха («ящик с усами»). Выбросов62«снизу» обнаружено не было.
Все испытуемые преодолели порог в 80%правильных ответов.2.2.1.4 Анализ данных и результатыСреднее количество ошибок среди проб, в которых искомая буквасодержалась в стимульной последовательности, составило 5,4% (в первойпозиции – 6,7%, во второй позиции – 6,1%, в третьей позиции – 5,0%, в четвертойпозиции – 5,2%, в пятой позиции – 4,3%). Из-за такого невысокого уровня ошибокмы не проводили дальнейший статистический анализ для изучения возможноговлияния позиции, предъявленной буквы и типа стимульной последовательностина количество ложноотрицательных промахов.Мы провели два анализа с использованием смешанных линейных моделейдля определения отношений между скоростью опознания буквы в стимульномряду (зависимой переменной), ее позицией, качеством буквы и типомпоследовательности(этитрифакторапредставляютсобойнезависимыепеременные). Мы использовали среду R и библиотеку lme4 [Bates и др., 2017] дляпроведения статистического анализа и построения смешанных линейных моделей.В библиотеке lme4 не реализован расчет p-уровней для моделей с интервальнымизависимыми переменными (такими, как время реакции) из-за теоретическойнеоднозначности при расчете числа степеней свободы [Четвериков, 2015].
Однакозначимость независимых переменных и их взаимодействий можно определитьпосредством двухстороннего t-теста. Если |t| > 1,96, то разница между уровнямифакторов значимы [Angele и др., 2015; Hohenstein, Kliegl, 2014a]. Графики былипостроены при помощи библиотеки ggplot2 для среды R на основе частичныхэффектов(partialeffects).Подчастичнымиэффектамиподразумеваютсярезультаты моделей без дисперсии, связанной со случайными факторами, а такжефакторами и взаимодействиями, которые был введены в модели в качествеконтроля. Выделение частичных эффектов было осуществлено при помощифункции keepef [Hohenstein, Kliegl, 2014b].63В обоих анализах модели содержали фиксированные и случайные эффекты.Фиксированные эффекты представляли собой три предиктора (позиция буквы,тип последовательности и качество буквы), а также два двойных взаимодействия:междупозициейикачествомбуквыимеждупозициейитипомпоследовательности.
Тип последовательности был закодирован как «скользящий»контраст (sliding contrast), этот контраст позволил сравнить скорость реакциимежду соседними уровнями (исходным уровнем в этом случае было выбранопсевдослово). Качество буквы кодировалось как контраст sum (sum contrast), этотконтраст позволил выявить, опознаются ли конкретные буквы значимо быстрееили медленнее по сравнению со средней задержкой перед ответом по всем буквам.Что касается позиции буквы в последовательности, то в первом анализе она былавведена в виде ковариата (порядковой переменной), представленного какцентрированнаяфункциячетвертойстепени.Этопозволилопроверитьзначимость линейного, квадратичного, кубического и биквадратного компонентовпри поиске символа в буквенной последовательности.
Во втором анализе позициябуквы в последовательности была введена в модель в качестве фиксированногоэффекта с 5 уровнями. Она кодировалась как «скользящий» контраст (slidingcontrast), этот контраст позволил сравнить скорость реакции в соседних позициях.Что касается случайных эффектов, наша базовая модель содержала толькослучайные эффекты для среднего (intercept) по каждому испытуемому истимульной последовательности. Далее для определения оптимальной модели мыпошли по пути «снизу-вверх»: мы добавляли новый случайный эффект исравнивали модели с разным количеством случайных эффектов при помощиотношения правдоподобия (likelihood ratio test) [Yan и др., 2014].