Автореферат (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)), страница 4
Описание файла
Файл "Автореферат" внутри архива находится в папке "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)". PDF-файл из архива "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
Полученные результаты могут бытьиспользованы при подготовке курсов по лингвостатистике и оптимизацииметодов лингвостатистических исследований.Достоверность и научная обоснованность результатов исследованияподтверждается следующими особенностями процедуры, массива изученныхсписков и полученных результатов: 1) унифицированностью методикиперевода текста в машиночитаемую форму, 2) тщательной двукратной сверкоймашиночитаемого и рукописного текста, 3) дублированием расчетов спомощью разных расчетных пакетов, 4) сопоставимостью результатов,полученных с помощью нескольких методик, качественным воспроизведениемрезультатов для разных списков и типов частотных словарей, 5)эксплицитностью допущений, произведенных при построении моделей, 6)содержательной интерпретируемостью значительного числа полученныхрезультатов, 7) принадлежностью исследуемых списков к контрастноразличным аспектам варьирования текста.Апробация работы.
Материалы работы докладывались на конференции«Специфика ценологических представлений разных школ» в рамках«Федоровских чтений-2011» (Московский энергетический институт – МЭИ,кафедра электрики промышленных предприятий, г. Москва, 2011 г.) и семинарепо общей и прикладной ценологии в рамках Федоровских чтений-2012 (там же,2012 г.), семинаре по прикладной лингвистике в Балтийском государственномтехническом университете (БГТУ, г. Санкт-Петербург, руководитель семинара–С.В.Чебанов),семинарепобиогерменевтикеПетербургскоголингвистического общества (сентябрь – октябрь 2012 г.), 14-й конференции«Conference of Open Innovations Association FRUCT», Хельсинки, 11-15 ноября2013 г.Внедрение.
Материалы исследования использованы при чтении курса«Формальные модели в лингвистике» на факультете прикладной лингвистикиБГТУ и проведении практических занятий по этому курсу. Точка h Хирша былаприменена для улучшения алгоритма извлечения ключевых фраз (Popova,Kovriguina, Mouromtsev, Khodyrev, 2013).Структура работы. Диссертация состоит из Введения, 4 глав,Заключения, списка сокращений, списка иллюстраций, библиографии из 229наименований (из которых 192 источников на русском, 37 – на английскомязыках), списка приложений, пояснительной записки к приложениям и 1513приложений.
Основная часть работы изложена на 242 страницахмашинописного текста, содержит 22 рисунка и 36 таблиц. В приложениявынесены примеры текстов, частотных и инвариантных словарей, диаграммы,таблицы, содержащие расчеты и их результаты для всех исследованныхсписков «Сказания».ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ.Во Введении описываются объект и предмет исследования,обосновываются причины выбора моделей, не использующих представления огауссовости лингвостатистических совокупностей, определяются цели, задачи иметоды исследования.
Важную часть Введения составляет обсуждениевариативного текста и особенностей его существования в культуре, а такжевводится представление о «Сказании о Мамаевом побоище», как вариативномтексте, пригодном для статистической обработки. Акцентирование внимания навариативном тексте уже во Введении важно для понимания мотивов выбораадекватного эмпирического материала.В главе 1 «Сказание о Мамаевом побоище» как вариативный текст иобъект исследования» на основании работы о памятниках Куликовскогоцикла,проведеннойв1950-хгг.Л. А.
Дмитриевым,излагаетсятекстологическое описание «Сказания о Мамаевом побоище» как материалаисследования и дается палеографическое описание рассматриваемых списков(см. таблицу 1 и рисунок 1).Текст, существующий в нескольких вариантах, каждый из которыхявляетсяполноправнымпредставителемданноготекста,будетквалифицироваться как вариативный (Доманский, 2006).
Варьирование формытекста обеспечивается с помощью его сокращения, расширения, правкисоздателей списка, внесения содержательных, стилистических, структурных,грамматических изменений, фонетических изменений, получивших отражениев рукописном тексте, интенсивности интертекстуальных связей и т.д. При этомвсе такие варианты функционируют в культуре как единый текст, без явногопредпочтения одного из его вариантов.В силу культурных предпосылок, семантически полноценныевариативные тексты значительного объема обнаруживаются только всредневековой литературе.
В Новое время культурная норма Средневековьясменяется представлением о допустимости единственной окончательной версииавторского текста, а вытеснение коллективного авторства индивидуальнымзакономерно сужает диапазон и объем допустимых редакционных изменений.Следует отметить, что с появлением и распространением Интернета вновьактуализируется коллективное авторство, но уже в других формах и жанрах.14основной источникдополнительныйисточниксокращениеСКАЗАНИЕ О МАМАЕВОМ ПОБОИЩЕСокращенный вариантРаспространенной редакцииРНБ Q.XVII.70??Печатный вариантЗадонщинаРаспространенная редакцияРНБ Q.IV.354Летописная редакцияСПбОИИ №251ОСНОВНАЯ РЕДАКЦИЯРедакция СинопсисаСобр.
Колобова, №336ПРОТОГРАФ ?Компилятивныйсписок РНБ O.IV.46гр. ОРНБ O.IV.22гр. УКиприановскаяредакция БАН 32.14.8гр. О/УЗабелинский списокБеллетризованный вариантРНБ Собр. Михайловского, Q.509?Летописная повесть пространнаяРедакция летописца кн. ХворостининаЛетописная повесть краткаяЗападнорусская обработкаРисунок 1 ― Связи между редакциями «Сказания о Мамаевом побоище» и памятниками Куликовского циклаП р и м е ч а н и е ― полужирным шрифтом выделены редакции «Сказания», отобранные для анализа (рядом – шифры используемых списков (курсивом), подчеркиванием – памятники Куликовского цикла,связанные со «Сказанием», «?» – дополнения из неустановленных источников (включая измышления переписчика), стрелка, идущая от «протографа» обозначает наличие архаических чтений в списках15Можно выстроить несколько линий сопоставления списков с цельюколичественной оценки их различий:1.
Историческое изменение текста за время его существования: линиясписков Основная редакция РНБ O.IV.22 – Летописная редакция СПбОИИ№251 – Киприановская редакция БАН 32.14.8 – Распространенная редакцияРНБ Q.IV.354 – редакция Синопсиса РНБ, собр. Колобова, №336, чтосоответствует хронологической последовательности основных редакций«Сказания».Хронологическая последовательность списков не является еще историейтекста. История же текста будет представлена тем, как набор существующих всписках его версий определенного времени сменяется в другое время другимнабором списков с подобными версиями.
Сам такой тип исторических измененийпредложено называть транзитивным полиморфизмом (Мейен, 1978).2. Полная версия текста vs сокращенная версия текста: по спискамтипового варианта Распространенной редакции РНБ Q.IV.354 исокращенного варианта Распространенной редакции РНБ Q.XVII.70(сокращение по всему тексту), но вполне допустимо и сопоставление типовоговарианта Основной редакции РНБ O.IV.22 – беллетризованного вариантаОсновной редакции РНБ собр. Михайловского, Q.509 (сокращены молитвы иотступления на религиозные темы).3. Исходный идеологически нейтральный текст vs производныйидеологизированный текст, к тому же заимствовавший структуру другогопроизведения – пространной Летописной повести: типовой вариант Основнойредакции РНБ O.IV.22 – типовой вариант церковной Киприановской редакцииБАН 32.14.8.4.
Влияние жанра: редакции, предназначавшиеся для летописных сводов:типовые варианты Летописной и Киприановской редакций vs редакции всоставе сборников и отдельные рукописи произведения (любой из остальных 6списков).5. Идейно и жанрово однородный текст vs текст со следами механическойкомпиляции: типовой вариант Распространенной редакции РНБ Q.IV.354 –компилятивный вариант Распространенной редакции РНБ O.IV.46.Во всех списках «Сказания» обнаруживается широкий спектр изменений: отошибок и механических описок до значительных смысловых правок.Для целей настоящего исследования интересны изменения текста любогохарактера, начиная с графики и заканчивая деталями сюжета, однакоисследование изменения лексического наполнения редакций одного текстапредставляется наиболее перспективным.
При этом оказалось очень важнопроследить, как именно изменяется распределение единиц в тексте, еслипоследовательно избавляться от графической и грамматической вариативности.Эта задача частично решена при работе с несколькими видами частотныхсловарей (ЧС), отражающих особенности лексики с разной степенью детальности.При этом не совсем очевидно, следует ли сводить словоформы-варианты кодной словоформе или нескольким. При проведении автоматического16морфологического анализа такие словоформы-варианты целесообразно«стягивать» в один класс, но с сохранением их различий.Такая операция технически легко осуществима в лингвопроцессоре NooJ. Впункте 1.6.2 главы 1 приводится пример формализованного описания глагольногословоизменения и демонстрация процедуры сведения словоформ-вариантов в«суперлексему».В главе 1 приводится также описание а) принципов представления текстов вэлектронном виде, б) методики формирования трех типов частотных словарей,различие которых отражает последовательное огрубление представленияисходного текста, в) примера работы с корпусом вариативных текстов.Для целей настоящего исследования перевод списков в машиночитаемуюформу производился вручную с рукописи в соответствии с методикойпредставления рукописного текста, принятой в проекте «СКАТ» (1.6.1).
Из 8используемых списков 5 получены в машиночитаемом виде впервые, ранее неиздавались и, таким образом, впервые вводятся в научный оборот (№№ 4, 5, 6 и 7по таблице 1).Методика формирования частотных словарей приводится в 1.6.2. Длякаждого текста были построены три типа частотных словарей:1. ЧС рукописных словоформ, на основании которого можно установитьколичественные характеристики графических особенностей списка; в такомсловаре воспроизводится графика рукописи, включая описки и ошибки писца;2.
ЧС стандартизованных словоформ (графика редуцируется досовременного алфавита + «ять», удаляются явные описки), с помощью которогообнаруживаются преимущественно синтаксические особенности редакций«Сказания»;3. ЧС лексем, позволяющий определить преимущественно семантическиеособенности редакций.Основныеколичественныехарактеристикисписков«Сказания»демонстрируют устойчивость их статистической структуры и изменяютсясогласованно при переходе от одного типа частотных словарей к другому (§ 3.2).Глава 2 «Моделирование структуры текста как поликомпонентногообъекта» начинается с обзора исследований по моделированию структурытекстов и других поликомпонентных объектов (§ 2.1) отечественными изарубежными исследователями.
Результаты, полученные в этой области,проецируются на моделирование компонентной структуры текста. Пункты 2.2.12.2.7 посвящены описанию и анализу рассматриваемых методик и ихсопоставлению посредством набора инвариантных признаков. Выявлениесопоставимых параметров каждой из методик производится в § 2.3 (см. такжерезультирующую таблицу 2).Продемонстрировано, что при сходном начальном представлениистатистических данных – ранговом распределении – результаты, получаемые спомощьюнекоторыхизрассматриваемыхметодик,принципиальнонесопоставимы.Можно конструктивно по конкретным характеристикам сопоставить:171.
Методы Г. Я. Мартыненко, Б. И. Кудрина и И.-И.Попеску с соавторами,предназначенные для членения кривой распределения на функциональные зоны:ядро соответствует саранчёвой касте и области от слова с максимальной частотойдо точки h, а периферия – ноевой касте. Формальными маркёрами здесь являютсяграница, определяемая с помощью скользящего коэффициента вариации,пойнтер-точка R и точка h.2. Методы Т. Г. Петрова и Г. Я. Мартыненко, сравнивая группировкусписков «Сказания» в поле «энтропия-анэнтропия» и по индексу Я/С. Такоесопоставление кажется правомерным, так как значение энтропии определяютдоли доминирующих, высокочастотных элементов, а значение анэнтропии,напротив, – редких, низкочастотных, «примесных».3. Методы Б. И.