Диссертация (1097366), страница 26
Текст из файла (страница 26)
Вес связей между элементами структуры постоянно меняется впроцессе обучения. Главной целью коннекционистских исследованийявляется нахождение правильной структуры и набора сил связей междуэлементами сети для выполнения той или иной задачи. В отечественнойпсихологии и смежных науках присутствуют только ограниченныепопытки применения коннекционистских моделей, в основном в светеизучения порождения речи в родном и иностранных языках (Ахутина,1989; Лепская, 1997).
В западной психологии коннекционизм представляетсобой влиятельное течение, выраженное сотнями (если не тысячами)работ. Существуют коннекционистские модели чтения.Ярким примером коннекционистких моделей чтения являетсямодель,разработаннаяМаркомСайденбергомиколлегамидляанглийского языка (Seidenberg, 2005). Ключевой принцип этой модели —присутствие отдельно взятыx групп или уровней «нейронов», то естьединиц обработки информации, которые объединены по функциональнымпризнакам—уровнямпроизношения/звучания(фонология,Ф),159графической репрезентации слов (орфография, О) и семантики (смысловоезначение, З).
Эти репрезентации распределены, то есть сложныекогнитивные процессы возникают без привлечения структурированныхсимволических элементов, а посредством взаимодействия ограниченногочислa базовых единиц внутри уровня, приспособленных для того, чтобыпредставлять неограниченный набор структур (подобно тому, как алфавитпозволяетвоспроизвестинеограниченноеколичествослов).Фонологическая репрезентация может включать сегменты (фонемы) илиих элементы (отдельные фонoлогические характеристики), напримерхарактеристикуОрфографическая«фрикативный»илирепрезентацияможет«палатализованный»содержатьбуквызвук.илиихвизуальные характеристики.
Порядок элементов всегда значим (то естькот и ток не должны отождествляться). Помимо уровней ввода и выводаинформации («инпут» — информация, входящая в систему, и «аутпут» —переработанная информация, которая выдается на выходе из системы),система также обычно содержит некоторый промежуточный уровеньскрытых единиц, которые, собственно, и обеспечивают обучаемостьсистемы и позволяют осуществлять более сложное картирование, чем то,которое бы позволялось при прямом соответствии входящей и выходящейинформации. Переработка включает активацию единиц, соответствующуюхарактеристикам«инпута»(например,правописаниеслова)ипозволяющую волне активации докатиться до «отпута» (например,произношение слова) посредством активации связующих единиц.
Каждаясвязь(connection,характеризуетсяотсюданекоторым—сonnectionism,коэффициентом,коннекционизм)моделирующимпотокактивации. Все эти элементы создают простую «фид-форвард» —«впередбегущую волну» активации, то есть волну, движение которойможет осуществляться только в одном направлении — вперед (то есть от«инпутa» — через слой скрытыx элементов — в «аутпут»). Более сложныесистемы возникают за счет добавления связок между единицами внутри160одного слоя и между единицами уровней входа и выхода, обратной связи(от скрытых элементов к орфографии), дополнительных скрытых слоев,единиц информации, представляющих контекст, в котором данноеконкретное слово появляется чаще всего, и других вычислительныхэлементов.Перед коннекционистской моделью ставится задача, с которойсталкивается каждый начинающий читатель: посмотрев на написанноеслово, определить его произношение и значение.
С точки зренияконнекционистской сети эта задача состоит в нахождении правильногонабора коэффициентов aктивации. Несколько обучающих принциповиспользуются для того, чтобы подогнать коэффициенты, основываясь напримерах. Некоторые из этих принципов напрямую связаны с тем, какпроисходит обучение на нейронном уровне; другие принципы отражаютто, что происходит на вычислительном уровне, абстрагируясь отнейрофизиологических деталей.Принципиальное допущение модели заключается в том, чтодостижение системой соответствия между написанием слова и егозвучанием является примером статистического научения (Altmann, 2002).Bо многих исследованиях (Harm, Seidenberg, 1999, 2004; Plaut, McClelland,Seidenberg et al., 1996; Seidenberg, McClelland, 1989) и на материаленескольких языков (Pagliuca, Monaghan, 2010; Sera, Elieff, Forbes et al.,2002) было показано, что модель может научиться правильно читатьтысячи слов.
Модель учится на наборах слов; множество разных слов сразличными паттернами правописания предъявляется модели в качестве«инпута». Основываясь на этих тренировочных словах, модель создаетразветвленные сети коэффициентов. При произношении каждого словаизначально используются все коэффициенты и, по мере предъявления слов(то есть в ходе тренировки системы), коэффициенты меняются, все большеи больше дифференцируясь, особенно для единиц, которые часто приводятк неправильному произношению. Таким образом, модель может работать161как с «типичными» (то есть читаемыми по правилам), так и с«нетипичными» (то есть читаемыми согласно исключениям) словами.Однако модель, задачей которой является простое нахождениесоответствия между графической и звуковой репрезентациями слова,представляет собой ограниченный интерес. То, что стоит за процессомкартирования (перевода графемы в фонему и обратно), значимо только вконтексте понимания (то есть определения смысла) прочитанного.Поэтому главной задачей коннекционистской модели чтения являетсязадачаустановления(вычисления,втерминахмодели)значениядекодированного слова.
Когда процесс чтения только формируется, модельи, соответственно, юный читатель полагаются в основном на путь О—Ф—З. Однако с увеличением опыта как модель, так и формирующийсячитатель все больше и больше начинают ориентироваться на путь О—З.При этом путь О—Ф—З не исчезает, он используется в том случае, когдана пути модели (и читателя) встречается неузнаваемое слово; такое словосначала надо озвучить и только потом понять.
Так, оба пути всегда вготовности,ното,какойизнихактивируется,определяетсяхарактеристиками перерабатываемых слов (то есть их статистическимихарактеристиками): частотой их встречаемости (например, опала — словонизкочастотное) и тем, насколько их правописание соответствуетправилам или нет (например, солнце — слово, написание которого несоответствуют правилам). Сама модель является репрезентацией этихстатистических закономерностей, а ее алгоритм научения — это способовладения знанием, основанным на этих статистических закономерностях.Несмотря на свое большое значение в зарубежной психологии,коннекционистская модель чтения никогда в российской психологии нерассматривалась. Необходимо отметить, что, в силу ее лингвистическойориентации просто «заимствовать» эту модель нельзя.
Русский ианглийский языки лингвистически достаточно далеки друг от друга,162поэтому модель должна быть модифицирована и адаптирована к русскомуязыку.Один из возможных методов адаптации, через которые эти моделидолжны продвигаться, переходя от языка к языку, — изменение матрицкоэффициентов, соединяющих компоненты Ф, О и З модели. Так, вотличие от английского, картирование пути О—Ф в большинстве своемопределяется правилами и характеризуется относительно небольшимколичествомисключений;однакопутьФ—Осодержитбольшоеколичество исключений из правил. Так при «переводе» на русский язык(или разработке русской версии) модель Ф—О—З является асимметричной(Kornev, Rakhlin, Grigorenko, 2011).
Другим путем является введение вмодельновыхморфологическиеэлементов,(М)напримеррепрезентацииэлементов,языка.Этиописывающихрепрезентацииразвиваются за счет промежуточных единиц в модели; они опосредуютсвязи между Ф, О и З и определяют морфологическую структуру и степеньморфологической регулярности/нерегулярности каждого слова, чтобы,опознав нерегулярное слово, разложить его на морфемы (этот навыкназывается морфологическим осознанием). Таким образом, лексическаяактивация — это активация корня слова, а не всего слова (Stockall, Marantz,2006). Русский язык имеет богатую морфологию, и большинство категорийслов не может употребляться без флективных36 элементов.
Кроме того,существуетбогатаясистемаприставочно-суффикснойосновесловообразования,(например,основаннаяглагольныенаприставки,выражающие направление движения или аспектуальные характеристикидействия). Следовательно, этот промежуточный уровень переработкиинформации при моделировании русского языка является очень важным. Врусском, где правописание организовано преимущественно на основепринципов морфологической устойчивости (Grigorenko, 2003; Grigorenko,36Флективные элементы, или флексии, — морфологические частицы, составляющие основу инфлекционнойморфологии. Флексии — это форманты, сочетающие сразу несколько значений.
Например, в слове «добрый»окончание -ый указывает на именительный падеж, единственное число, мужской род. В различных словоформахокончание -ый заменяется другим.1632005b), оба пути, О—Ф и Ф—О ориентируются на промежуточныйуровеньМ, которыйспособствуетправильнойидентификациии,соответственно, правильному ознáчиванию слова (см. главу 2).В контексте типичного онтогенеза чтения хорошо развитые навыкидекодирования, соответствующие богатому словарному запасу, и система,в целом характеризуемая сильными фонологическими, орфографическимии морфологическими навыками, приводят к точному и эффективномупониманию прочитанного. Однако при дизонтогенезе чтения каждый изперечисленных компонентов может «выпасть» из системы, нарушая еефункционирование.§ 7.2. ИсследованиеВ данной работе (и в данной главе) коннекционистская модельчтениявпервыеоперационализированадлярусскогоязыка.Какуказывалось выше, в силу особых характеристик русского как языкатрехкомпонентная модель Ф—О—З, разработанная для английского,модифицирована в модель Ф—М—О—З для русского путем введениядополнительной морфологической составляющей М.Участники.