Диссертация (1148722), страница 11

Файл №1148722 Диссертация (Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка) 11 страницаДиссертация (1148722) страница 112019-06-292019-06-29СтудИзба

Распознавание слов на ранних этапах процесса чтения экспериментальное исследование на материале русского языка

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 11)

Слова были подобраны таким58образом, что целевая буква была представлена в слове только один раз, в то времякак остальные буквы могли повторяться.Рисунок 4. Целевые стимулы для экспериментов 2, 3, 4 и 5 (поиск символа в последовательности).Таким образом, всего в эксперименте было использовано 615 реальныхслов русского языка. Поскольку общее количество единиц оказалось достаточнобольшим, мы разбили все стимулы на 5 экспериментальных листов. В каждомэкспериментальном листе предъявлялись все 33 буквы, но только в одной из пятивозможных позиций. Из-за отсутствия или недостатка слов для некоторых парбуква/позиция(см.выше),невозможнобылораспределитьсловапоэкспериментальным листам равномерно.

Кроме того, отбирая слова для каждогоэкспериментального листа, мы старались сделать так, чтобы в каждой позициибыло одинаковое число букв, передающих гласный звук (10 букв в русском языке— гласные) и одинаковое число букв, имеющих выносной элемент (9 буквсодержат выносной элемент). В итоге в первом экспериментальном листесодержалось 116 единиц, во втором — 124, в третьем — 130, в четвертом — 124 ив пятом — 121.Задача на зрительный поиск предполагает, что помимо случаев, когдаискомый символ содержится в исходной последовательности, должны бытьслучаи (филлеры), в которых он будет отсутствовать. В качестве филлеров мыиспользовали слова из предыдущего по номеру экспериментального листа, но сдругой (отсутствующей в слове) искомой буквой.59После того, как мы сформировали экспериментальные листы для реальныхслов русского языка, мы обратились к конструированию произносимыхпсевдослов.

Для этого мы написали специальный скрипт на языке Python. На входэтому скрипту подаются уже отобранные реальные слова в паре с буквой, длякоторой они были найдены, и позицией этой буквы, а также список всехвозможных биграмм (двух смежных букв), которые встречаются в Частотномсловаре русского языка, вместе с позицией нахождения этой биграммы в слове.Скрипт случайным образом генерирует псевдослово из реального слова такимобразом, чтобы, во-первых, псевдослово содержало ключевую букву в той жепозиции, что и реальное слово; во-вторых, чтобы слоговая структура (CVCCV дляслова кошка, где C – согласная10, V – гласная) псевдослова и ключевого словабыла идентична; и, в-третьих, чтобы каждые две подряд идущие буквы (биграммы)в полученном псевдослове содержались в каком-нибудь другом реальном слове изЧастотного словаря русского языка в той же позиции.

Приведем пример одногосгенерированного псевдослова: для слова тюбик было сконструировано словофюран. Как видно, оба слова обладают слоговой структурой CVCVC, имеютбукву ю во второй позиции, слово фюран состоит из четырех биграмм фю, юр, ра,ан, которые встречаются в следующих словах русского языка в аналогичныхпозициях:фюрер,Цюрих,экран,декан.Сформированныепсевдословаотсматривались авторами на предмет благозвучия (при необходимости скриптзапускался заново).

Также мы добавили по два псевдослова парам буква/позиция,для которых не было найдено реальных слов.Сгенерированныепсевдословабылираспределеныпо5экспериментальным листам в соответствии с исходными словами, для которыхони были подобраны. Так же как у реальных слов, филлеры представляли собой10Буквы ь и ъ мы также отнесли к согласным.60стимулы из предыдущего по номеру экспериментального листа, но с другой(отсутствующей в псевдослове) искомой буквой.В результате мы получили 10 экспериментальных листов, которые былислучайным образом распределены между 100 участниками.2.2.1.3 ПроцедураЭксперимент проводился в тихом помещении, каждый испытуемыйтестировался индивидуально.

При проведении эксперимента использовалосьпрограммное обеспечение E-prime (Psychology Software Tools). В каждой пробеискомая буква предъявлялась в центре экрана на 1000 мс, далее следовал пустойэкран (500 мс). Затем предъявлялся буквенный ряд (слово или псевдослово вцентре дисплея), он оставался на экране до ответа испытуемого (см. Рисунок 5).Участников просили нажать на клавишу ‘/’ при обнаружении стимульной буквы вряду, и клавишу ‘z’ при ее отсутствии. Решение необходимо было принимать какможно точнее и быстрее.

Буква и стимульная последовательность предъявлялисьв нижнем регистре белым цветом на черном фоне (шрифт Georgia). Мыиспользовали 36 кегль для показа ключевой буквы и 18 кегль для стимульнойпоследовательности11.11Временные интервалы и способ показа стимулов в целом были такими же, как в исследовании[Pitchford, Ledgeway, Masterson, 2008]. Отличия заключались в выборе шрифта (Georgia в нашем vs. Geneva уН. Питчфорда и коллег), регистра (нижний у нас vs. верхний у Н. Питчфорда и коллег) и размере шрифтастимульной последовательности (18 у нас vs.36 у Н. Питчфорда и коллег).61Буква содержится в стимульнойпоследовательностиПредъявлениебуквыжБуква отсутствует в стимульнойпоследовательностижПустой экранПредъявлениебуквенного ряда1000 мс.500 мс.пожарсезондо ответа (макс.2000 мс.)Рисунок 5.

Порядок предъявления стимулов в задаче на зрительный поиск в экспериментах 2, 4 и 5 (поиск символа впоследовательности).Эксперимент был разбит на четыре блока приблизительно по 60 проб.Распределение стимулов по блокам и показ стимулов внутри блока осуществлялсяслучайным образом для каждого испытуемого. После каждого блока следовалперерыв, во время которого испытуемый мог взять паузу на неограниченноеколичество времени. Следующий блок начинался, как только испытуемыйнажимал любую кнопку ответа (клавишу ‘/’ или клавишу ‘z’).Программное обеспечение регистрировало ответ испытуемых и времяреакции.

Если испытуемые принимали решение относительно некоторого стимуладольше, чем за 2000 мс, то такой ответ исключался из дальнейшего анализа.Порог взят из ранее рассмотренного исследования [Pitchford, Ledgeway, Masterson,2008]. Всего из анализа был удален 1% таких ответов. Для выявления выбросов«снизу» мы использовали диаграмму размаха («ящик с усами»). Выбросов62«снизу» обнаружено не было.

Все испытуемые преодолели порог в 80%правильных ответов.2.2.1.4 Анализ данных и результатыСреднее количество ошибок среди проб, в которых искомая буквасодержалась в стимульной последовательности, составило 5,4% (в первойпозиции – 6,7%, во второй позиции – 6,1%, в третьей позиции – 5,0%, в четвертойпозиции – 5,2%, в пятой позиции – 4,3%). Из-за такого невысокого уровня ошибокмы не проводили дальнейший статистический анализ для изучения возможноговлияния позиции, предъявленной буквы и типа стимульной последовательностина количество ложноотрицательных промахов.Мы провели два анализа с использованием смешанных линейных моделейдля определения отношений между скоростью опознания буквы в стимульномряду (зависимой переменной), ее позицией, качеством буквы и типомпоследовательности(этитрифакторапредставляютсобойнезависимыепеременные). Мы использовали среду R и библиотеку lme4 [Bates и др., 2017] дляпроведения статистического анализа и построения смешанных линейных моделей.В библиотеке lme4 не реализован расчет p-уровней для моделей с интервальнымизависимыми переменными (такими, как время реакции) из-за теоретическойнеоднозначности при расчете числа степеней свободы [Четвериков, 2015].

Однакозначимость независимых переменных и их взаимодействий можно определитьпосредством двухстороннего t-теста. Если |t| > 1,96, то разница между уровнямифакторов значимы [Angele и др., 2015; Hohenstein, Kliegl, 2014a]. Графики былипостроены при помощи библиотеки ggplot2 для среды R на основе частичныхэффектов(partialeffects).Подчастичнымиэффектамиподразумеваютсярезультаты моделей без дисперсии, связанной со случайными факторами, а такжефакторами и взаимодействиями, которые был введены в модели в качествеконтроля. Выделение частичных эффектов было осуществлено при помощифункции keepef [Hohenstein, Kliegl, 2014b].63В обоих анализах модели содержали фиксированные и случайные эффекты.Фиксированные эффекты представляли собой три предиктора (позиция буквы,тип последовательности и качество буквы), а также два двойных взаимодействия:междупозициейикачествомбуквыимеждупозициейитипомпоследовательности.

Тип последовательности был закодирован как «скользящий»контраст (sliding contrast), этот контраст позволил сравнить скорость реакциимежду соседними уровнями (исходным уровнем в этом случае было выбранопсевдослово). Качество буквы кодировалось как контраст sum (sum contrast), этотконтраст позволил выявить, опознаются ли конкретные буквы значимо быстрееили медленнее по сравнению со средней задержкой перед ответом по всем буквам.Что касается позиции буквы в последовательности, то в первом анализе она былавведена в виде ковариата (порядковой переменной), представленного какцентрированнаяфункциячетвертойстепени.Этопозволилопроверитьзначимость линейного, квадратичного, кубического и биквадратного компонентовпри поиске символа в буквенной последовательности.

Во втором анализе позициябуквы в последовательности была введена в модель в качестве фиксированногоэффекта с 5 уровнями. Она кодировалась как «скользящий» контраст (slidingcontrast), этот контраст позволил сравнить скорость реакции в соседних позициях.Что касается случайных эффектов, наша базовая модель содержала толькослучайные эффекты для среднего (intercept) по каждому испытуемому истимульной последовательности. Далее для определения оптимальной модели мыпошли по пути «снизу-вверх»: мы добавляли новый случайный эффект исравнивали модели с разным количеством случайных эффектов при помощиотношения правдоподобия (likelihood ratio test) [Yan и др., 2014].

Характеристики

Тип файла

PDF-файл

Размер

4,6 Mb

Материал

Тип материала

Кандидатская диссертация

Предмет

Филология

Высшее учебное заведение

СПбГУ

Список файлов диссертации

raspoznavanie-slov-na-rannih-jetapah-processa-chtenija-jeksperimentalnoe-issledovanie-na-materiale-russkogo-jazyka.rar

Автореферат.pdf

Выписка из протокола заседания диссертационного совета.pdf

Диссертация.pdf

Информация об официальном оппоненте 2.pdf

Информация об официальном оппоненте.pdf

Отзыв ведущей организации.pdf

Отзыв на автореферат 2.pdf

Отзыв на автореферат 3.pdf

Отзыв на автореферат.pdf

Отзыв научного руководителя.pdf

Отзыв официального оппонента 2.pdf

Отзыв официального оппонента.pdf

Прочти меня!!!.txt

Сведения о ведущей организации.pdf

Сведения о результатах публичной защиты.pdf

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.