Автореферат (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»))
Описание файла
Файл "Автореферат" внутри архива находится в папке "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)". PDF-файл из архива "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст из PDF
ФГБОУ ВПО «Санкт-Петербургский государственный университет»На правах рукописиКовригина Любовь ЮрьевнаНЕГАУССОВОЕ МОДЕЛИРОВАНИЕ ЛЕКСИКО-СТАТИСТИЧЕСКОЙСТРУКТУРЫ ВАРИАТИВНОГО ТЕКСТА(НА ПРИМЕРЕ «СКАЗАНИЯ О МАМАЕВОМ ПОБОИЩЕ»)Специальность 10.02.21 – Прикладная и математическая лингвистикаАвтореферат диссертациина соискание ученой степени кандидата филологических наукСанкт-Петербург – 2014Работа выполнена на кафедре математической лингвистики федеральногогосударственного бюджетного образовательного учреждения высшегопрофессионального образования «Санкт-Петербургский государственныйуниверситет»Научный руководитель:Чебанов Сергей Викторович,доктор филологических наук,ФГБОУ ВПО «Санкт-Петербургский государственный университет»,профессорОфициальные оппоненты:Спивак Дмитрий Леонидович,доктор филологических наук,Институт мозга человека РАН,лаборатория коррекции психического развития и адаптации,ведущий научный сотрудник,Северо-Западное отделение Российского научно-исследовательского институтакультурного и природного наследия им.
Д.С.Лихачева,директорОрехов Борис Валерьевич,кандидат филологических наук,ФГАОУ ВПО «Национальный исследовательский университет«Высшая школа экономики»,факультет филологии, доцентВедущая организация:ФГБОУ ВПО «Тюменскийгосударственный университет»Защита состоится “11” февраля 2015 г. в ____ часов на заседании советаД 212.232.23 по защите диссертаций на соискание степени докторафилологических наук, на соискание степени кандидата филологических наукпри ФГБОУ ВПО «Санкт-Петербургский государственный университет» поадресу: 199034, Санкт-Петербург, Университетская наб. д.11, ауд._____.С диссертацией можно ознакомиться в Научной библиотеке им. М.
ГорькогоСанкт-Петербургского государственного университета (г. Санкт-Петербург,Университетскаянабережная,д.7/9)инасайте:http://spbu.ru/science/disser/dissertatsii-dopushchennye-k-zashchite-i-svedeniya-ozashchite/details/12/246Автореферат разослан «___» ___________ 2014 г.Ученый секретарь диссертационного совета,кандидат филологических наук2Манерова К.В.ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.К настоящему времени лингвостатистика достигла определённой степенизрелости. Это выражается в наличии, по крайней мере, трех областейисследований, которые находятся в тесной взаимосвязи друг с другом.Во-первых, это изучение статистики языковых единиц разных уровней(фонем, букв, слогов, морфем, словоформ, лексем, словосочетаний,синтаксических конструкций) в текстах самой разной природы и ихфрагментах.
Начавшись в 1930-х гг. с работ Дж. К. Ципфа, подобныеисследования продолжаются по настоящее время, а их результатом являетсяформирование представления о резкой неравночисленности единиц разныхуровней в тексте, накопление всё более точных количественных характеристикэтих распределений для тех или иных лингвистических объектов (современныхи древних текстов, технической документации и художественной литературы,спонтанной устной речи и поэтических текстов с жесткой структурой, такойкак у сонетов и канцоны, и т.д.).Во-вторых, это широкий круг практических разработок, основанных наизучении статистики лексических единиц.
Прежде всего, это частотные словариразных национальных языков, профессиональных и социальных диалектов,идиолектов отдельных авторов (Засорина, 1977, Творогов, 1984, Ляшевская,Шаров, 2009, Гребенников, Мартыненко, 1999, 2011, Шайкевич, Андрющенко,Ребецкая, 2003, Алексеев, 2004, Kučera, Francis, 1967, Urai, Ando, 2003) и т.д.Такие словари являются основой для решения широкого круга прикладныхзадач – лингводидактики (учебные частотные словари ― Алексеев, 1998, Зубов,1990), стилеметрии (Мартыненко, 1988), атрибуции анонимных ипсевдонимных текстов (Марусенко, 1990), в том числе, для целейосуществления судебно-криминалистических экспертиз и т.д.В-третьих, это теория лингвостатистических распределений, котораяформируется на стыке теории вероятности и математической статистики,лингвистики и лингвостатистики, психолингвистики и эстетики и т.д.
Несмотряна примерно восьмидесятилетнее развитие этой области, она полна дискуссий ипротиворечий, представляя собой поле жесткой борьбы порою резкоразличающихся точек зрения (Арапов, Шрейдер, 1978, Бычков, 1986,Пиотровский, Бектаев, Пиотровская, 1977, Herdan, 1964).Одной из самых острых проблем теории лингвостатистическихраспределений является вопрос об их гауссовости или негауссовости(Мартыненко, 1978, 1988, Чебанов, 2012, Popescu, Mačutek, Altmann, 2009).
Приэтом надо отметить, что в большинстве случаев этот вопрос обсуждается собращением к выборкам языкового материала большего или меньшего объема(при том, что современные принципы и практика корпусной лингвистикипозволяет оперировать с объемом материала, измеряемым миллионамисловоупотреблений), и вопрос в большой мере сводится к обсуждениюрепрезентативности тех или иных выборок этого материала (Беликов, Копылов,Пиперски, 2013).Вместе с тем, как на это обращал внимание еще Ципф (Zipf 1935, 1949), апозднее отмечали другие исследователи (Налимов, 1979, Арапов, Шрейдер,31978) лингвостатистические распределения дают представление не о статистикеотдельных репертуарных единиц (морфем, лексем, словаря) в языке, но об ихстатистике в тексте.
В таком случае, лингвостатистические распределенияоказываются инструментом изучения не языка, а речи, текста. Тем не менее,изучение статистики текста остается до сих пор делом новаторским, не вполнеконцептуально проясненным, хотя и пересекается с работами по интенсивноразвивающейся ныне лингвистике текста.Однако, если говорить о лингвостатистике текста, то ситуация как стеоретической, так и с практической точки зрения не является абсолютноясной.Дело в том, что при всем разнообразии (Филиппов, 2003) текстов,наиболее изучаемыми являются авторские художественные тексты нового иновейшего времени, тиражируемые с помощью традиционной гутенберговскойполиграфии, обеспечивающей идентичность разных отпечатков одного тиража.Ситуация же с устными и рукописными текстами, произведениямисамиздата,современнойгородской(авторской)песней,текстами,циркулирующими в интернете, и т.д.
оказывается совсем иной. Для такихтекстов не существует эталонного, окончательного, подлинного авторскоговарианта, который и должен быть предметом исследования с позицийлингвистики текста.Прецеденты рассмотрения таких текстов были и ранее (Лихачев, 2001,Корона, 1999, Пропп, 2003). Однако, целенаправленно концентрируясь наизучении таких текстов, Ю.В.Доманский обосновывает представление о том,что они должны рассматриваться в качестве особого класса текстов –вариативных текстов, трактуемых им следующим образом «категория варианта… важна уже потому, что в неклассической художественности произведение нереализуется только в каком-то одном варианте, а представляет из себясовокупность текстуальных (в широком смысле) манифестаций, каждая изкоторых обладает относительно самостоятельными смыслами.
Это сближаетсловесность парадигмы неклассической художественности с фольклором идревней литературой» (Доманский, 2006). Такими текстами являются и сказки(см. на эту тему работы В.Я.Проппа), рукописные тексты Средневековья,многие тексты замкнутых профессиональных и полупрофессиональныхсообществ и т.д.По отношению к таким текстам возникает новый круг задач из областилингвистики текста, которые лишь отчасти пересекаются с задачами,рассматриваемыми в текстологии, – как в авторско-гутенберговской, так и всредневековой (Лихачев, 2001). Очевидно, что описание особенностейвариативных текстов – серьезная самостоятельная задача, решение которойпредполагает формирование обширной самостоятельной исследовательскойпрограммы.В контексте же лингвостатистических исследований может бытьпоставлен вопрос об особенностях лингвостатистических распределенийвариативных текстов.
Этот вопрос тем более интересен, что не было не толькокаких-то попыток его изучения на конкретном материале, но он даже не4ставился в такой форме. Предлагаемая же постановка вопроса позволяет поновому обсуждать всю лингвостатистическую проблематику.В связи с этим важно иметь в виду то, что к настоящему временисложилось несколько методологически различных подходов к описаниюстатистической структуры текстов и других поликомпонентных объектовК настоящему времени сложилось несколько методологически различныхподходов к описанию статистической структуры текстов и другихполикомпонентных объектов – внутренних систем по терминологииЮ.А.Шрейдера (Шрейдер, 1977).Начало таким исследованиям заложили работы В.Парето, Дж.Юла,Дж.Виллиса, Дж.Ципфа, Б.Мандельброта (конца XIX – первой половиныXX вв.), обнаруживших сходный тип распределения, репрезентирующийрезкую неравномерность численности объектов. Несмотря на неадекватностьаппроксимации для отдельных участков кривой эмпирического распределения,наиболее известным оказалось ранговое распределение Ципфа (гипербола, или,как оно называется в лидирующей сейчас отечественной школе Б.И.Кудрина, –Н-распределение).В практике описания подобных ранговых и спектровых распределенийприменяется множество аппроксимирующих функций, каждая из которыхможет быть оспорена.