Диссертация (Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка), страница 12
Описание файла
Файл "Диссертация" внутри архива находится в папке "Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка". PDF-файл из архива "Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
Оптимальнаямодель в первом анализе содержала случайные эффекты для среднего (intercept)по каждому испытуемому и стимульной последовательности, а также случайныйнаклон для каждого испытуемого по позиции следования буквы (без корреляциимежду параметрами). Во втором анализе оптимальная модель включала только64случайные эффекты для среднего (intercept) по каждому испытуемому истимульной последовательности.Для получения нормальности распределения остатков мы применилиобратную трансформацию к зависимой переменной (-1/скорость реакции) [Masson,Rabe, Kliegl, 2017].
Необходимость применения такой трансформации показалметод Box-Cox [Box, Cox, 1964].На рисунке 6 (эксперимент 2) представлена скорость поиска символов вбуквенном ряду в зависимости от позиции, в которой данный символ находился вэтой последовательности, а на рисунке 7 изображена средняя скорость ответа нату или иную букву в тех же условиях (учитываются только правильные ответы).65Рисунок 6.
Среднее время реакции при зрительном поиске буквы в зависимости от ее расположения в буквеннойпоследовательности и типа буквенной последовательности в экспериментах 2, 3, 4 и 5 (поиск символа в последовательности).66Рисунок 7. Среднее время реакции при зрительном поиске той или иной буквы русского алфавита в зависимости от типастимульной последовательности в эксперименте 2 (поиск символа в последовательности).Первыйанализвыявилзначимыеквадратичный(b = -1,920e-03,SE = 4,514e-04, t = -4,25) и биквадратный компоненты (b = -2,029e-03, SE = 3,779e04, t = -5,37), однако линейный эффект не оказался значимым (b = -2,253e-04,SE = 5,306e-04, t = -0,42). Второй анализ показал, что буквы в первой (b = 6,315e05, SE = 1,298e-05, t = 4,87) и пятой позициях (b = 5,208e-05, SE = 1,133e-05,t = 4,60) распознаются быстрее, чем соседние буквы (во второй и четвертойпозициях соответственно).
Третья позиция идентифицируется лучше, чем вторая(b = 4,362e-05, SE = 1,064e-05, t = 4,10) и четвертая (b = 3,304e-05, SE = 1,150e-05,67t = 2,87). Таким образом, можно констатировать, что линия поиска букв в русскомязыке представляет собой М-образную кривую (см. Рисунок 6, эксперимент 2) исовпадает с той, которая была найдена для английского и французского языков[Green, Meara, 1987; Hammond, Green, 1982; Krueger, 1970; Ktori, Pitchford, 2008;Ktori, Pitchford, 2009; Mason, 1982; Tydgat, Grainger, 2009].Что касается качества буквы (см.
Рисунок 7 и Таблицу 2, эксперимент 2),было обнаружено, что скорость реакции на буквы ё, о, ш, ф, ж, б, й, р, д, х, щзначительно выше12 , а на буквы ь, ы, л, п, к, и, ъ, ч, н, я, а, э — ниже посравнению со средним временем реакции по всем буквам (728 мс). Это говорит отом, что при низкоуровневой обработке слова важно не только то, гдерасположена буква в ряду, но и то, какая это буква.
Чтобы проверить гипотезуМ. Ктори и Н. Питчфорда о том, что эффект качества букв связан с частотнымихарактеристиками орфографии, мы посчитали корреляцию между среднейскоростью реакции на каждую букву в каждой позиции и позиционнойчастотностью буквы [Pitchford, Ledgeway, Masterson, 2008]. М. Ктори иН. Питчфордавсвоемисследовалиполучилизначимуюотрицательнуюкорреляцию между данными мерами, причем эта взаимосвязь была обусловленаглавным образом скоростью реакции в крайних буквах.Для определения позиционной частотности мы посчитали количествопятибуквенных слов из Частотного словаря русского языка [Ляшевская, Шаров,2009], содержащих ту или иную букву в одной из пяти позиций, и разделили наобщее количество слов, содержащихся в словаре [Pitchford, Ledgeway, Masterson,2008]. Нам не удалось обнаружить значимой корреляции: коэффициенткорреляции Пирсона между средними временами реакции и логарифмированной12Значимости у факторов «тип последовательности» и «качество буквы» в двух анализах практическисовпали.
Поэтому здесь и далее мы приводим результаты только из первого анализа.68позиционной частотностью практически не отличался от нуля: r = -0,08 (N = 165),p > 0,5 (двусторонний тест).Таблица 2. Среднее время реакции и полученные параметры смешанных линейных моделей для каждой буквы в эксперименте 2и 3 (поиск буквы в последовательности).БабвгдеёжзийклмнопрстуфхцчшщъыьэюяМSDЭксперимент 2bSE7527017207387067386446947267537047507647357536707577097327357486937047467536917237757687887577227382532482282422222351962252422422662282542442402382382372602202752342092492462352542252382722472332203,523e-05-6,663e-053,079e-061,932e-05-3,831e-051,761e-05-1,755e-04-6,739e-05-6,981e-065,254e-05-8,107e-055,607e-056,237e-051,272e-054,304e-05-1,397e-046,221e-05-3,928e-05-3,488e-061,414e-051,381e-05-7,562e-05-3,845e-053,012e-054,680e-05-8,546e-05-4,845e-059,686e-051,060e-041,080e-046,148e-05-1,328e-053,820e-051,788e-051,853e-051,863e-051,848e-051,863e-051,830e-051,835e-051,839e-051,840e-051,860e-052,793e-051,870e-051,841e-051,874e-051,829e-051,837e-051,869e-051,776e-051,862e-051,869e-051,829e-051,869e-051,862e-052,055e-051,886e-051,855e-052,364e-053,851e-052,787e-052,636e-053,132e-051,865e-051,910e-05tМ1,97-3,60,171,05-2,060,96-9,56-3,66-0,382,82-2,93,003,390,682,35-7,613,33-2,21-0,190,760,76-4,05-2,061,472,48-4,61-2,052,523,84,11,96-0,712,00104710039909821022103999398896410991056102610821020107093110579919781013100093310191106107310441080113410991107105510271035SDЭксперимент 3bSEt2352002162082421902312282182542012342612372312402322062412422161632322382462612252422282292402312505,183e-06-2,745e-05-2,371e-05-3,532e-05-1,208e-058,599e-06-5,477e-05-4,292e-05-4,115e-057,234e-055,639e-069,407e-063,058e-051,268e-054,741e-05-1,282e-042,348e-05-5,284e-05-4,401e-05-1,907e-05-4,370e-05-6,191e-05-9,194e-066,682e-051,672e-052,421e-056,365e-051,008e-045,406e-057,032e-051,213e-05-4,687e-06-2,153e-050,34-1,91-1,8-2,45-0,910,60-3,96-3,09-3,175,310,390,722,430,903,37-8,151,64-3,88-3,25-1,36-3,04-4,59-0,694,641,191,694,396,53,684,540,89-0,32-1,191,507e-051,438e-051,316e-051,442e-051,324e-051,430e-051,384e-051,388e-051,299e-051,363e-051,461e-051,304e-051,260e-051,413e-051,409e-051,573e-051,435e-051,362e-051,354e-051,405e-051,438e-051,348e-051,339e-051,439e-051,409e-051,436e-051,449e-051,551e-051,468e-051,548e-051,356e-051,446e-051,806e-05Значимые эффекты выделены жирным.
Обозначения: Б – буква, М – среднее значение, SD – стандартное отклонение; параметры моделей: b – наклон, SE – стандартная ошибка, t – t-критерий.69Проанализировав качество «быстрых» и «медленных» букв, мы пришли квыводу, что, возможно, выступающие и свисающие элементы букв, а такженаличие больших закругленные компонентов повышают скорость распознаваниябуквы; а те буквы, которые являются частью других букв, опознаются сзадержкой (напр. буква ь входит в состав буквы ы). Таким образом, мы можемпредположить, что эффект качества буквы может быть результатом визуальнойпредставления буквы.
Мы протестировали это предложение при помощи мерывизуальной сложности буквы, предложенной в [Pelli и др., 2006]. Эта мера —периметрическая сложность буквы, вычисляемая как квадрат внешнего ивнутреннего периметра, деленного на количество черных пикселей в составебуквы, — активно применяется в исследованиях визуального распознаваниясимволов (например, [Chang, Chen, Perfetti, 2017]). Коэффициент корреляцииСпирмана между средней скоростью реакции на буквы и периметрическойсложностью буквы оказался значимым: r = -0,41 (N = 33), p = 0,017 (двусторониийтест). В связи с этим мы можем утверждать, что эффект качества буквы связанскорее с визуальными характеристиками буквы, чем с частотными.Нашимследующимрезультатомсталовыявлениезначимоговзаимодействия между качеством и позицией буквы: χ2(128) = 226,04, p < 0,0001(при сравнении моделей с ключевым взаимодействия и без ключевоговзаимодействия согласно критерию правдоподобия).
Этот результат значит,функция поиска неоднородна и отличается от буквы к букве. Вследствие этого мыпровели отдельный компонентный анализ для каждой буквы русского алфавита(см. Рисунок 8 и Приложение В).70Рисунок 8. Среднее время реакции при зрительном поиске для каждой буквы в зависимости от ее расположения в буквеннойпоследовательности и типа буквенной последовательности в эксперименте 2 (поиск символа в последовательности).71КакможновидетьвприложенииВ,значимыйотрицательныйбиквадратный компонент выражен только у букв в, л, ц, э (М-образная функцияпоиска), буквы д,р,ф,ъ характеризуются значимым отрицательнымквадратичным компонентом.
Только при поиске буквы к прослеживаетсяпоследовательносканированиеотначалапоследовательностикконцу.Большинство букв (21 из 33), по нашим данным, не имеют ни одноговыраженного компонента.Последнийрезультаткасаетсялексическогостатусастимульнойпоследовательности. Хотя испытуемые в целом опознавали букву в реальномслове на 12 мс быстрее, чем в произносимом псевдослове (в среднем: 722 мс и734 мс соответственно), статистический анализ не показал значимости междуданными группами (b = -5,066e-07, SE = 4,961e-05, t = -0,01). Взаимодействиемежду типом последовательности и позицией буквы также не достиглозначимости, так как модель, включающая данное взаимодействие, не привнесласущественного улучшения в действие алгоритма по сравнению с моделью безкритическоговзаимодействиясвидетельствуетвпользу(χ2(4) = 6,61,того,чтоp = 0,16).лексическийЭтотрезультатстатусбуквеннойпоследовательности не оказывает влияния на стратегию идентификации символав задаче на зрительный поиск.2.2.1.5 Обсуждение полученных результатовРезультаты эксперимента показали преимущество крайних и центральнойпозиций в вербальных рядах, составленных из букв русского алфавита, в задачезрительного поиска.
Функция поиска соответствует М-образной кривой, так каквариативность данных лучше всего описывается через биквадратную иквадратичную функции. Линейный компонент не достиг значимости. Такимобразом,можноговорить,чтомыповторилирезультатыпредыдущихэкспериментов для английского и французского языков [Hammond, Green, 1982;Mason, 1982; Pitchford, Ledgeway, Masterson, 2008; Tydgat, Grainger, 2009] и нашли72основания полагать, что в русском языке преобладает параллельное кодированиебукв.Мы также получили, что идентичность искомой буквы оказывает влияниена скорость выполнения задачи, а лексический статус последовательности — нет.Выявленное нами, а также испанскими исследователями [Acha, Perea, 2010]отсутствие разницы между поиском буквы в реальном слове и произносимомпсевдослове свидетельствует о том, что для изучения низкоуровневой обработкисловвовремячтениявозможноиспользоватьболееестественныепоследовательности букв.
Эффект качества буквы, вероятнее всего, связан свизуальными характеристиками стимула, а не со статистическими особенностямиорфографии русского языка, так как среднее время реакции на ту или иную буквунегативно коррелирует с визуальной сложностью буквы [Pelli и др., 2006], амежду позиционной частотностью и скоростью реакции взаимосвязь найти неудалось [Pitchford, Ledgeway, Masterson, 2008].Вернемся к главному результату нашего эксперимента. Параллельноесканирование явным образом постулируется в теории Дж. Грейнджера и коллег[Chanceaux, Grainger, 2012; Grainger, Tydgat, Isselé, 2010; Tydgat, Grainger, 2009].При этом замедление во второй и четвертой позиции объясняется черезухудшение остроты зрения к концам последовательности, а эффективностьпоиска в крайних позициях связывается с меньшей силой боковой интерференцииот соседних букв.