Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (1185448), страница 26
Текст из файла (страница 26)
сами сдавали традиционные экзамены). Процедуры принятия решения ииспользуемые ими критерии не связаны со специальными знаниями и навыками (напр., аналитической работойс информационными потоками). Смысловая структура текстов (выборок текстов) данной предметной области вбольшинстве случаев неоднородна и предполагает конкуренцию критериев, т.к. включает в себя в качествеподтем как минимум три: окончание школы – сдача ЕГЭ – поступление в вуз. Второй эксперимент проводилсячерез 2,5 месяца после первого с той же бригадой информантов (добавился один новый). Методика проведенияэксперимента должна была минимизировать влияние индивидуальных ассоциативных связей.
Собраннаябригада участвовала в двух экспериментах. В промежутке результаты эксперимента с информантами необсуждались. Сопоставительный анализ протоколов второго эксперимента исключают возможность влияния наего результаты первого эксперимента; таким образом, мы считаем, что экспериментальный дизайнудовлетворяет требованиям чистоты эксперимента.6781На основании результатов определения испытуемыми периода в эксперименте1 («ЕГЭ») можно выделить четыре класса (по убыванию числа правильных исогласованных ответов информантов):1. Февраль, март, сентябрь (подготовка экзамена и подведение итогов);2.
Январь (подготовка экзамена);3. Апрель, август (подготовка экзамена и подведение итогов);4. Май, июнь, июль (неопределенность проведение экзамена/подведение итогов).Свертки, предъявленные испытуемым в ходе Эксперимента 2 («единыйгосударственный экзамен»), дали другое распределение правильных и согласованныхответов испытуемых:1. июль, февраль (подведение итогов и подготовка, соответственно);2. апрель (проведение экзаменов вместо подготовки);3. январь, май, сентябрь (подготовка, проведение, и подведение итогов,соответственно);4. июнь (подготовка экзамена вместо проведения, но сравнительно высокаясогласованность);5.
август, март (подведение итогов и подготовка, соответственно).Анализ тем текстов разных выдач показывает, что однозначное определениепериода и месяца не обязательно должны соответствовать друг другу. Срокипроведения ЕГЭ колеблются от апреля до июля (согласно приказу «Об утверждениисроковиединогорасписанияпроведения…»(http://www1.ege.edu.ru/content/view/475/36/):o досрочное проведение – апрель,o для основной массы выпускников 2009 года – июнь (а также 26 и 29мая),o для выпускников прошлых лет – июль.Выборочный анализ текстов выдач по рассматриваем запросам (месяцы апрельиюль) показывает, что выдача на запрос «единый государственный экзамен» вбольшей степени ориентированы на «проблемные» случаи, а на запрос «ЕГЭ» – натипичные.
Для «апреля» (Эксперимент 2) проблемным является досрочноепроведение ЕГЭ (высокая согласованность и сравнительно неплохое восстановлениемесяца). Для июня и июля – сдача ЕГЭ выпускниками прошлых лет (неравноеположение выпускников 2009 года и прошлых лет, т.е. более сложные условия дляпоследних).
Поэтому «июнь» дает большее внимание к подготовке, а июль кподведению итогов.Задача краткого обсуждения результатов сверток по коллекциям документов,сформированным двумя сходными запросами, позволил дать анализ, прежде всего,лингвистической природе коллекции. Например, проследить (1) роль шкалыинформационная насыщенность vs. воздействие на адресата, (2) взаимодействие ипереплетение тем и подтем сложного сюжетного объекта, (3) композиционнуюструктуру сюжета, выстраивающуюся по законам нарратива. Все эти параметрыявляются, прежде всего, лингвистическими и информационными. Отметим, чтошкала от информационно насыщенного текста до текста, реализующего воздействиена адресата, была (в данной предметной области) задана, прежде всего, на уровнезапроса.Применяя нарративную метафору, можно рассмотреть девять сверток (длякаждого из периодов, которому соответствовала одна выборка) как компоненты82единой смысловой структуры высокого уровня, характеризующейся динамичнойсменой ситуаций (при том, что каждая из этих ситуаций сама имеет сложнуюсмысловую структуру).
Тогда свертку «январь» можно описать как преамбулу (фазуориентации), «февраль» как основу завязывания сюжета, «сентябрь» – как коду(мораль всей истории). Именно эти компоненты нарратива ведут себя сходнымобразом и для запроса «ЕГЭ», и для запроса «единый государственный экзамен».Наиболее сюжетными и неоднозначными оказались свертки «апрель–июль», накоторых происходит развитие сюжета.
Анализ результатов экспериментовдемонстрирует разные сюжетные линии. Степень «воздействия на адресата» (напр.,убеждения) задает разные направления: типичное положение дел (для«информационных текстов») или проблемные случаи (для «текстов воздействия наадресата»).Методы экспериментальной лингвистики – психолингвистики и лингвистикитекста – находят свое применение в исследовании нового для лингвистики объекта.Список используемой литературы1. Aborn M. еt al. Sources of contextual constraint upon words in sentences // J.
of Exp. Psychology. 1959,vol. 57.2. Alderson J. C. Native and non-native speaker performance on cloze tests // Language Learning. 1980,vol.30.3. McNamara, D.S., Kintsch, E., Songer, N.B., & Kintsch, W.. Are good text always better? Textcoherence, background knowledge, and levels of understanding in learning from text.
Cognition andInstruction, 1996, 14, 1-43.4. Bachman L. F. Performance on cloze tests with fixed-ratio and rational deletions // TESOL Quarterly.1985, vol. 19.5. Barlow M., Kemmer S. (eds) Usage-based models of language. Stanford, Calif.: CSLI Publications.2000.6. Biber D. Variation Across Speech and Writing – Cambridge:Cambridge Univ. Press, 1988.7. Boguslavsky I., Iomdin L., Sizov V. Multilinguality in ETAP-3.
Reuse of Linguistic Resources //Proceedings of the Workshop “Multilingual Linguistic Resources. 20th International Conference onComputational Linguistics» – Geneva, 20048. Boguslavsky I., L. Iomdin, V. Sizov. Interactive enconversion by means of the ETAP-3 system //Proceedings of the International Conference on the Convergence of Knowledge, Culture, Language andInformation Technologies – Alexandria, 20039. Chafe W. Discourse, consciousness, and time. The flow and displacement of conscious experience inspeaking and writing – Chicago:University of Chicago Press, 199410. Church K., Hanks, P., ‘Word association norms, mutual information, and lexicogra-phy’, ComputationalLinguistics, 16(1), 22–29. 199011.
Church, K., W. Gale, P. Hanks and D. Hindle 1991 Using statistics in lexical analysis. In U. Zernik edLexical Acquisition. Englewood Cliff, NJ: Erlbaum. 115-64.12. Church, K., W. Gale, P. Hanks and D. Hindle Using statistics in lexical analysis. In U. Zernik ed LexicalAcquisition. Englewood Cliff, NJ: Erlbaum. 115-64. 199113. Clark H. H. Arenas of Language Use – Chicago: Univ.
ChicagoPress, 199314. Cloze tests in English, Thai, and Vietnamese. Native and non-native performance 1972;15. Croft W. Radical Construction Grammar. Syntactic theory in typological perspective. Oxford: OxfordUniversity Press. 2001.16. Croft W., Cruse A. Cognitive Linguistics. Cambridge: Cambridge University Press. 2004.17. Crowder R.
G., Morton J. Precategorical Acoustic Storage // Perception and Psychophysics. 1969, №518. Сиротко-Сибирский С. А. О проблеме понимания текста в лингвистике и психолингвистике // …Слово отзовется: памяти А. С. Штерн и Л. В. Сахарного – Пермь, 200619. Daudaravicius V. Automatic identification of lexical units.
// Computational Linguistics and Intelligenttext processing CICling-2009, Meksikas, Meksika. 2010a.8320. Daudaravičius V. The Influence of Collocation Segmentation and Top 10 Items to Keyword AssignmentPerformance. In proceedings of Computational Linguistics and Intelligent text processing CICling-2010,Iasi, Romania. Lecture Notes in Computer Science. Springer-Verlag.648–660. 2010б.21. Daudaravicius, V., Marcinkeviciene, R.: Gravity Counts for the Boundaries of Collocations.International Journal of Corpus Linguistics 9(2), 321–348.
200422. Fillenbaum S. et al. The predictability of words and their grammatical classes as a function of rate ofdeletion from a speech transcript // J. of Verbal Learning and Verbal Behavior. 1963, vol. 223. Fillmore Ch. J. Inversion and constructional inheritance.// Webelhuth G., Koenig J., Kathol A. (eds.).Lexical and constructional aspects of linguistic explanation. Stanford, Ca: CSLI. 113-128. 1999.24. Fillmore Ch. J., Kay, P.. Construction Grammar Coursebook. Manuscript, University of California atBerkeley Department of linguistics.
1993.25. Fillmore Ch. J., Lee-Goldman R. R., and Rhodes R. The FrameNet Constructicon // Sign-BasedConstruction Grammar. Stanford: CSLI Publications / H.C. Boas & I.A. Sag (eds.) 201126. Fillmore Ch., J., Kay P., O’Connor M. C. Regularity and idiomaticity in grammatical constructions: Thecase of Let alone. // Language 64, 3.
501-538. 1988.27. Firbas J. On defining the theme in functional sentence analysis // Travaux linguistiques de Prague, vol.1. 196628. Firbas, J. Functional Sentence Perspective in Written and Spoken Communication. Studies in EnglishLanguage – Cambridge: CambridgeUniversity Press, 199229. Firth, J.R.: 1957. Papers in Linguistics 1934–1951.
London.30. Firth, J.R.: 1968.Selected Papers of J.R. Firth, 1952–1959. London.31. Fletcher C. R., Bloom C. P. Causal reasoning in the comprehension of simple narrative texts // J. Mem.Lang. 1988, 1932. Fodor J. A. The Modularity of Mind – Cambridge (Mass.), 198333. Fox B. Discourse structure and anaphora – Cambridge: Cambridge Univ. Press, 198734. Fried M., Östman J. 2004.