Автореферат (1148604), страница 3

Файл №1148604 Автореферат (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)) 3 страницаАвтореферат (1148604) страница 32019-06-292019-06-29СтудИзба

Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 3)

В. Фуфаева(Фуфаев, 1996, 2006, 2010), аналогичный модели изменения словаря во времениМ. В. Арапова и М.М.Херц (Арапов, Херц, 1972), но разработанныйсовершенно независимо;― методы описания ценозов посредством модели простых чисел ипойнтер-точки R Б. И.

Кудрина (Кудрин, 1974, 2002, 2007), сложившиесявнутри ценологического подхода;― методика Г. Я. Мартыненко, с выделением в структуре неоднороднойсовокупности «ядра» и «периферии» (Мартыненко, 1978, 2009);― принцип максимума диссимметрии Ю. А. Шрейдера-М. В. Арапова(Арапов, Шрейдер, 1978), ориентированный на отражение целостностиструктуры объекта;― методика В.

П. Маслова (Маслов, 2006а, б), направленная наулучшение аппроксимации эмпирических данных распределением Ципфа,принятым в качестве эталонного;― методика Г. Альтманна, И.-И. Попеску и Я. Машутека, основанная навыделении функциональных зон в ранговом распределении (Popescu, Mačutek,Altmann, 2009).2. Сравнение результатов применения этих методов к одному и тому жематериалу – «Сказанию о Мамаевом побоище».3.Установлениесодержательнойинтерпретацииполученныхколичественных характеристик.Следует отметить, что модели В. В. Фуфаева и Т. Г.

Петроваприменяются их авторами для анализа временных рядов, а другиерассматриваемые «статические» модели не содержат жестких ограничений надобавление «динамической» компоненты и допускают переход к анализутемпоральных изменений объекта. Однако оказывается крайне сложнымосуществить анализ временных рядов в чистом виде на материале «Сказания оМамаевом побоище» из-за существования транзитивного полиморфизма(Мейен, 1978; о применении транзитивного полиморфизма к литературномуматериалу см. работу В.В.Короны – Корона, 1999).Включение диахронических моделей в план исследования потребовалоформулирования принципиально новых требований к отбору исследуемого9материала, так что для достижения поставленных целей оказались наиболеепригодными тексты, квалифицируемые как вариативные, т.е. существующие вомножестве равноценных вариантов.Текст, подходящий для такого исследования, должен иметь некотороеколичество зафиксированных промежуточных стадий, «следов» процессаизменения.

Поэтому речь идет об исследовании вариантов одного текста (см.главу 2). Таким текстом и является текст «Сказания».Материалом исследования послужили 8 списков «Сказания» (описаниесм. в таблице 1).Таблица 1 ― Списки «Сказания», привлеченные для исследованияВремяДатировкаОсобенности№ Название редакциивозникновеи шифр спискаредакцииния редакцииТиповые списки редакций в хронологическом порядке1 Основная (ОР)не ранее 1-йXVI в.,Редакция,наиболеечетверти XV в. РНБ O.IV.22близкая к протографу2 Летописная (ЛР)конец XV –XVI в.,Летописная повесть +нач. XVI вв.СПбОИИ №251 ОР3 Киприановская (КР)1526-1530 гг.XVI в.,Структура ЛетописнойБАН 32.14.8повести + сокращеннаяОР,возниклавцерковнойсреде,прославлениемитрополита Киприана4 Распространеннаядо началаXIX в.,ОР + 2самостоятель(РР)XVII в.РНБ Q.IV.354ныеповести«Опосольстве Захария»,«О новгородцах»5 Редакция в составеок. 1680 г.конец XVIII в., ПоследовательноеКиевского СинопсисаРНБ Собр.сокращениеОР,(РС)Колобова,местами вставки№336Нетиповые и компилятивные списки6 СокращенныйнеXVII в., РНБИскусное сокращениевариантустановленоQ.XVII.70текста РРРаспространеннойредакции7 КомпилятивныйнеXIX в., РНБКомпилятвариантустановленоO.IV.46РаспространеннойРаспространеннойредакции, в которомредакциипрочитывается11других источников.8 БеллетризованныйнеXIX в.,ОР, опущены молитвывариант ОсновнойустановленоРНБ Собр.+ поздние вставкиредакцииМихайловского, № Q.509Эти списки включают типовые списки редакций (по Л.

А. Дмитриеву –Тихомиров, Ржига, Дмитриев, 1959, Дмитриев, 1982; номера 1-5 в таблице 1) исписки, представляющие интерес для изучения статистических различий10между: а) полным текстом редакции и текстом, представляющим еесистематическое сокращение (номера 4 и 6); б) полным текстом и текстом,сокращенным с целью беллетризации (номера 1 и 8); в) текстом, близким кавторскому, и компилятивным текстом (номера 4 и 7).Объектом исследования является множество статистических моделейтекстов «Сказания», создаваемых при представлении текста какполикомпонентного объекта. Предмет исследования составляет характер истепень сходства / различия этих моделей (метамодель вариативного текста«Сказания»).В полном соответствии с междисциплинарностью, как одной из основныхособенностей математической лингвистики, в качестве рабочей гипотезы былапринята квазиуниверсальность и квазиэквивалентность разных приемовизучения компонентного состава, что обеспечивает частичную сопоставимостьрезультатов, получаемых с их помощью.Новизна работы определяется тем, что автором впервые произведенаапробация концептуально разных методов моделирования компонентнойструктуры (как в статике, так и в динамике) на одном и том же монографическиобработанном материале.

Результаты, полученные автором, позволяютрасширить эмпирическую базу для дальнейших исследований. Кроме того,получен ряд новых ценных фактов о количественных коррелятахсодержательных особенностей вариантов текста (выявление скореллированногоизменения частоты словоупотреблений фиксированных частотных зонраспределения лексики как индикатор идеологически целенаправленной правкитекста, динамика числа hapax legomena (определяемых в настоящей работе, какслова, встретившиеся в рассматриваемом тексте по одному разу) как индикаторстилистической трансформации текста и т.д.Кроме того, впервые были получены количественные данные оцелостном вариативном тексте, изменявшемся на протяжении 400 лет (до этогов диахронии изучались только частотные характеристики отдельных лексем).Определение статистических свойств вариативного текста, выявлениестатистических коррелятов изменений, вносимых в текст в процессе созданияредакций, переработок, компиляций, составляют несомненную новизну даннойработы.Автором создан претендующий на репрезентативность микрокорпус из 8исследованных вариантов текста «Сказания», включающий 5 неизданныхсписков «Сказания», впервые представленных автором по единым правилам вмашиночитаемой форме.В процессе работы над диссертацией использованы методы а)представления рукописного текста в машиночитаемом виде в соответствии сметодикой проекта СКАТ, б) статистической обработки текста, в)сопоставления результатов статистической обработки, г) выявленияинвариантов.

Расчеты и исследования производились с помощью пакетаAttestat, встроенного в Microsoft Excel, пакета Statgraphics, макросов VisualBasic для Microsoft Excel, системы Mathcad, процедур, реализованных на11языках программирования С и Python, системы для обработки естественногоязыка NooJ, морфологического анализатора mystem (Яndex).На защиту выносятся следующие положения:1. Для лингвостатистического анализа «Сказание» выступает какпредставитель особого типа объектов – вариативного текста, количественныехарактеристики которого впервые получены в настоящей работе.2.

Использование разных методов лексико-статистического анализаобнаруживает у изученных списков «Сказания» следующие особенности:а) для списков, написанных скорописью, уменьшается диагностическийпараметр β, который чувствителен к изменению интенсивности использованияграфических дублетов в рукописи;б) компонентная структура церковной Киприановской редакции наиболееотлична от других версий «Сказания» по базовым лексико-статистическимхарактеристикам (относительная частота в тексте слова с рангом 1 – союза и,доля hapax legomena в словаре и тексте, отношение объема словаря к объемутекста), её месту на диаграммах «энтропия-анэнтропия», динамике приростаскользящего коэффициента вариации, что объясняется обилием предлогов иусложненными синтаксическими конструкциями;в) компонентная структура беллетризованного списка претерпеваетизменения в процессе беллетризации, связанные с целенаправленнымудалением из текста религиозной лексики, что влияет на форму Sраспределения (оцениваемую увеличением угла наклона одной из его ветвей коси абсцисс).3.

Пойнтер-точка R и правая граница монотонности приростаскользящего коэффициента вариации спектрового (видового) распределениялибо совпадают, либо близки и выделяют наиболее высокочастотную лексику.Точка h Хирша пригодна для отсеивания служебной лексики и формированиясписка стоп-слов. Полнозначные слова, имеющие частоту больше h в ранговыхраспределениях ЧС лексем «Сказания», относятся к религиозной лексике,именам собственным и титулатуре.4. Методики изучения динамики разночастотных компонентовВ.В.Фуфаева и М.В.Арапова-М.М.Херц дают частично сопоставимыерезультаты, а их совмещение на стабильной зоне S-распределения выявляетлексику, маркирующую вставные повести в вариантах Распространеннойредакции и установляет количественные индикаторы идеологической правкитекста – его беллетризации (по списку собрания Михайловского, Q.509).5.

Статистическая структура текста обладает высокой устойчивостью,которая проявляется в сохранении относительных частот классов разныхчисленностей при сокращении текста.6. Коэффициент конкордации Кендэла применим для установленияоднородности выборки и чувствителен к введению в выборку инородноготекста.Теоретическая значимость работы заключается в построенииметамодели рассматриваемых способов анализа текста, обеспечивающей12сопоставимость результатов, получаемых с помощью разных методик на одноми том же материале. Тем самым удается частично прояснить соотносимостьполучаемых результатов. В работе впервые осуществлена постановка задачи остатистическом исследовании структуры вариативного текста, что открываетпринципиально новые перспективы лингвостатистических исследований.Практическую ценность представляет возможность оптимизациипроцедурыисследованиякомпонентнойструктурытекстакакполикомпонентного объекта и выявление границ универсальности /специфичности таких процедур, а также основанная на этом оптимизацияситуативного выбора тактики исследования при статистическом изучениитекстов как поликомпонентных объектов.

Характеристики

Тип файла

PDF-файл

Размер

1,36 Mb

Материал

Тип материала

Кандидатская диссертация

Предмет

Филология

Высшее учебное заведение

СПбГУ

Список файлов диссертации

negaussovoe-modelirovanie-leksiko-statisticheskoj-struktury-variativnogo-teksta-na-primere-skazanija-o-mamaevom-poboische.rar

Автореферат.pdf

Диссертация.pdf

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.