Автореферат (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)". PDF-файл из архива "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
В. Фуфаева(Фуфаев, 1996, 2006, 2010), аналогичный модели изменения словаря во времениМ. В. Арапова и М.М.Херц (Арапов, Херц, 1972), но разработанныйсовершенно независимо;― методы описания ценозов посредством модели простых чисел ипойнтер-точки R Б. И.
Кудрина (Кудрин, 1974, 2002, 2007), сложившиесявнутри ценологического подхода;― методика Г. Я. Мартыненко, с выделением в структуре неоднороднойсовокупности «ядра» и «периферии» (Мартыненко, 1978, 2009);― принцип максимума диссимметрии Ю. А. Шрейдера-М. В. Арапова(Арапов, Шрейдер, 1978), ориентированный на отражение целостностиструктуры объекта;― методика В.
П. Маслова (Маслов, 2006а, б), направленная наулучшение аппроксимации эмпирических данных распределением Ципфа,принятым в качестве эталонного;― методика Г. Альтманна, И.-И. Попеску и Я. Машутека, основанная навыделении функциональных зон в ранговом распределении (Popescu, Mačutek,Altmann, 2009).2. Сравнение результатов применения этих методов к одному и тому жематериалу – «Сказанию о Мамаевом побоище».3.Установлениесодержательнойинтерпретацииполученныхколичественных характеристик.Следует отметить, что модели В. В. Фуфаева и Т. Г.
Петроваприменяются их авторами для анализа временных рядов, а другиерассматриваемые «статические» модели не содержат жестких ограничений надобавление «динамической» компоненты и допускают переход к анализутемпоральных изменений объекта. Однако оказывается крайне сложнымосуществить анализ временных рядов в чистом виде на материале «Сказания оМамаевом побоище» из-за существования транзитивного полиморфизма(Мейен, 1978; о применении транзитивного полиморфизма к литературномуматериалу см. работу В.В.Короны – Корона, 1999).Включение диахронических моделей в план исследования потребовалоформулирования принципиально новых требований к отбору исследуемого9материала, так что для достижения поставленных целей оказались наиболеепригодными тексты, квалифицируемые как вариативные, т.е. существующие вомножестве равноценных вариантов.Текст, подходящий для такого исследования, должен иметь некотороеколичество зафиксированных промежуточных стадий, «следов» процессаизменения.
Поэтому речь идет об исследовании вариантов одного текста (см.главу 2). Таким текстом и является текст «Сказания».Материалом исследования послужили 8 списков «Сказания» (описаниесм. в таблице 1).Таблица 1 ― Списки «Сказания», привлеченные для исследованияВремяДатировкаОсобенности№ Название редакциивозникновеи шифр спискаредакцииния редакцииТиповые списки редакций в хронологическом порядке1 Основная (ОР)не ранее 1-йXVI в.,Редакция,наиболеечетверти XV в. РНБ O.IV.22близкая к протографу2 Летописная (ЛР)конец XV –XVI в.,Летописная повесть +нач. XVI вв.СПбОИИ №251 ОР3 Киприановская (КР)1526-1530 гг.XVI в.,Структура ЛетописнойБАН 32.14.8повести + сокращеннаяОР,возниклавцерковнойсреде,прославлениемитрополита Киприана4 Распространеннаядо началаXIX в.,ОР + 2самостоятель(РР)XVII в.РНБ Q.IV.354ныеповести«Опосольстве Захария»,«О новгородцах»5 Редакция в составеок. 1680 г.конец XVIII в., ПоследовательноеКиевского СинопсисаРНБ Собр.сокращениеОР,(РС)Колобова,местами вставки№336Нетиповые и компилятивные списки6 СокращенныйнеXVII в., РНБИскусное сокращениевариантустановленоQ.XVII.70текста РРРаспространеннойредакции7 КомпилятивныйнеXIX в., РНБКомпилятвариантустановленоO.IV.46РаспространеннойРаспространеннойредакции, в которомредакциипрочитывается11других источников.8 БеллетризованныйнеXIX в.,ОР, опущены молитвывариант ОсновнойустановленоРНБ Собр.+ поздние вставкиредакцииМихайловского, № Q.509Эти списки включают типовые списки редакций (по Л.
А. Дмитриеву –Тихомиров, Ржига, Дмитриев, 1959, Дмитриев, 1982; номера 1-5 в таблице 1) исписки, представляющие интерес для изучения статистических различий10между: а) полным текстом редакции и текстом, представляющим еесистематическое сокращение (номера 4 и 6); б) полным текстом и текстом,сокращенным с целью беллетризации (номера 1 и 8); в) текстом, близким кавторскому, и компилятивным текстом (номера 4 и 7).Объектом исследования является множество статистических моделейтекстов «Сказания», создаваемых при представлении текста какполикомпонентного объекта. Предмет исследования составляет характер истепень сходства / различия этих моделей (метамодель вариативного текста«Сказания»).В полном соответствии с междисциплинарностью, как одной из основныхособенностей математической лингвистики, в качестве рабочей гипотезы былапринята квазиуниверсальность и квазиэквивалентность разных приемовизучения компонентного состава, что обеспечивает частичную сопоставимостьрезультатов, получаемых с их помощью.Новизна работы определяется тем, что автором впервые произведенаапробация концептуально разных методов моделирования компонентнойструктуры (как в статике, так и в динамике) на одном и том же монографическиобработанном материале.
Результаты, полученные автором, позволяютрасширить эмпирическую базу для дальнейших исследований. Кроме того,получен ряд новых ценных фактов о количественных коррелятахсодержательных особенностей вариантов текста (выявление скореллированногоизменения частоты словоупотреблений фиксированных частотных зонраспределения лексики как индикатор идеологически целенаправленной правкитекста, динамика числа hapax legomena (определяемых в настоящей работе, какслова, встретившиеся в рассматриваемом тексте по одному разу) как индикаторстилистической трансформации текста и т.д.Кроме того, впервые были получены количественные данные оцелостном вариативном тексте, изменявшемся на протяжении 400 лет (до этогов диахронии изучались только частотные характеристики отдельных лексем).Определение статистических свойств вариативного текста, выявлениестатистических коррелятов изменений, вносимых в текст в процессе созданияредакций, переработок, компиляций, составляют несомненную новизну даннойработы.Автором создан претендующий на репрезентативность микрокорпус из 8исследованных вариантов текста «Сказания», включающий 5 неизданныхсписков «Сказания», впервые представленных автором по единым правилам вмашиночитаемой форме.В процессе работы над диссертацией использованы методы а)представления рукописного текста в машиночитаемом виде в соответствии сметодикой проекта СКАТ, б) статистической обработки текста, в)сопоставления результатов статистической обработки, г) выявленияинвариантов.
Расчеты и исследования производились с помощью пакетаAttestat, встроенного в Microsoft Excel, пакета Statgraphics, макросов VisualBasic для Microsoft Excel, системы Mathcad, процедур, реализованных на11языках программирования С и Python, системы для обработки естественногоязыка NooJ, морфологического анализатора mystem (Яndex).На защиту выносятся следующие положения:1. Для лингвостатистического анализа «Сказание» выступает какпредставитель особого типа объектов – вариативного текста, количественныехарактеристики которого впервые получены в настоящей работе.2.
Использование разных методов лексико-статистического анализаобнаруживает у изученных списков «Сказания» следующие особенности:а) для списков, написанных скорописью, уменьшается диагностическийпараметр β, который чувствителен к изменению интенсивности использованияграфических дублетов в рукописи;б) компонентная структура церковной Киприановской редакции наиболееотлична от других версий «Сказания» по базовым лексико-статистическимхарактеристикам (относительная частота в тексте слова с рангом 1 – союза и,доля hapax legomena в словаре и тексте, отношение объема словаря к объемутекста), её месту на диаграммах «энтропия-анэнтропия», динамике приростаскользящего коэффициента вариации, что объясняется обилием предлогов иусложненными синтаксическими конструкциями;в) компонентная структура беллетризованного списка претерпеваетизменения в процессе беллетризации, связанные с целенаправленнымудалением из текста религиозной лексики, что влияет на форму Sраспределения (оцениваемую увеличением угла наклона одной из его ветвей коси абсцисс).3.
Пойнтер-точка R и правая граница монотонности приростаскользящего коэффициента вариации спектрового (видового) распределениялибо совпадают, либо близки и выделяют наиболее высокочастотную лексику.Точка h Хирша пригодна для отсеивания служебной лексики и формированиясписка стоп-слов. Полнозначные слова, имеющие частоту больше h в ранговыхраспределениях ЧС лексем «Сказания», относятся к религиозной лексике,именам собственным и титулатуре.4. Методики изучения динамики разночастотных компонентовВ.В.Фуфаева и М.В.Арапова-М.М.Херц дают частично сопоставимыерезультаты, а их совмещение на стабильной зоне S-распределения выявляетлексику, маркирующую вставные повести в вариантах Распространеннойредакции и установляет количественные индикаторы идеологической правкитекста – его беллетризации (по списку собрания Михайловского, Q.509).5.
Статистическая структура текста обладает высокой устойчивостью,которая проявляется в сохранении относительных частот классов разныхчисленностей при сокращении текста.6. Коэффициент конкордации Кендэла применим для установленияоднородности выборки и чувствителен к введению в выборку инородноготекста.Теоретическая значимость работы заключается в построенииметамодели рассматриваемых способов анализа текста, обеспечивающей12сопоставимость результатов, получаемых с помощью разных методик на одноми том же материале. Тем самым удается частично прояснить соотносимостьполучаемых результатов. В работе впервые осуществлена постановка задачи остатистическом исследовании структуры вариативного текста, что открываетпринципиально новые перспективы лингвостатистических исследований.Практическую ценность представляет возможность оптимизациипроцедурыисследованиякомпонентнойструктурытекстакакполикомпонентного объекта и выявление границ универсальности /специфичности таких процедур, а также основанная на этом оптимизацияситуативного выбора тактики исследования при статистическом изучениитекстов как поликомпонентных объектов.