Диссертация (1148605), страница 35
Текст из файла (страница 35)
В коллекции списков «Сказания»Таблица 12 ― Значения энтропии и анэнтропии для списков «Сказания» по ЧС разныхтиповНазвание редакцииОсновнаяЛетописнаяКиприановскаяРаспространеннаяРед. СинопсисаСокращенныйКомпилятивныйБеллетризованныйЧС рукописныхсловоформН3,1053,0232,9933,1083,0822,9573,0642,951А0,2600,2730,2910,2640,2350,2360,2760,275ЧСстандартизованныхсловоформН3,0773,0132,9693,0733,0292,9363,0372,942А0,2700,2770,2990,2750,2520,2530,2840,278ЧС лексемН2,6252,6012,5152,6112,6082,5002,6072,530А0,4320,4290,4670,4450,4020,4130,4430,425Примечание ― Н – энтропия, А – анэнтропия. Полужирным выделено максимальноезначение признака, курсивом – минимальноеесть «нетипичный» (в рамках подхода Т.Г.Петрова) сокращенный список,который имеет минимальную сложность и чистоту для рассматриваемойколлекции «составов» (см.
рисунки Н.1–Н.3 в Приложении Н).174На рисунке 16 представлено соположение полей Н и А диаграммПриложения Н.по ЧС лексемпо ЧС рукописных истандартизованныхсловоформРисунок 16 ― Совмещение характеристик энтропии и анэнтропиидля разных типов ЧС «Сказания»Проанализировав указанные диаграммы и таблицы, можно резюмироватьследующее:1. При переходе от одного типа частотных словарей словоформ к другомурасположение списков на диаграмме НА изменяется незначительно.
При переходек словарю лексем существенно уменьшается энтропия и возрастает анэнтропия(рисунок 16). Интерпретация этого в терминах «сложность» и «чистота» вполнеочевидна: уменьшается словарь и количество hapax legomena. Полученныерезультатывполнесопоставимысрезультатами,полученнымивлингвостатистике: «С одной стороны, энтропия большого словаря, как правило,опережает энтропию небольшого словаря, благодаря тому, что равномерность враспределении частот с увеличением текста увеличивается (концентрация редкихслов падает. С другой стороны, при сравнении текстов одинаковой длины мера175энтропииможетслужитьпоказателем“богатства”лексики,которомусоответствует большее1 значение энтропии»2.2.НеподтвержаетсяприменимостьметодаRHAкустановлениюпоследовательности возникновения редакций текста, что свидетельствует впользу непроцессуального характера изменения текста во времени.
Тем не менее,нужно отметить, что точки, соответствующие первой (Основной редакции) ипоследней (редакции Синопсиса) редакциям располагаются достаточно близко – врамках синергетического подхода текст Основной редакции, несомненно,является аттрактором.3. Группировка списков по энтропийно-анэнтропийному анализу во многихслучаях для списков «Сказания» дублирует кластеризацию списков по индексуповторяемости (объем словаря V/объем текста N, см. таблицу 3 на с. 65) и долях втексте слова с максимальной частотой и уникальных слов (по всем типам ЧС).Интерпретация полученных значений анэнтропии полностью соответствуетсвойствам анэнтропии, выводимым из данного ей Т.Г.Петровым определения: чемменьше содержания малых компонентов, тем выше анэнтропия (см.
п. 2.2.5 главы2). Так, анэнтропия максимальна3 для Киприановской редакции, в частотныхсловарях которой меньше всего доля уникальных слов, но максимальнаотносительная частота союза «и» (см. колонки 5 и 7 таблицы 3 на с. 65). Вредакции Синопсиса, наоборот, минимальна относительная частота слова снаибольшей частотой (того же «и»), а доля в тексте уникальных словмаксимальна, что соответствует минимальному значению энтропии.4. Можно с осторожностью говорить о стилечувствительности метода RHA,поскольку от по значениям энтропии основной группировки редакций отделяютсяобмирщенныесписки(сокращенныйибеллетризованныйварианты)иКиприановская редакция, возникшая в церковной среде.
В то же время, три этихсписка расположены в поле диаграммы достаточно близко (по энтропийным1В работе Ю.А.Тулдавы очевидная опечатка: вместо «большее значение энтропии» напечатано «меньшее значениеэнтропии».2Тулдава Ю.А. О частотном спектре лексики текста // Квантитативная лингвистика и автоматический анализтекстов. 1986.
С.141.3Здесь и далее под «максимальным» и «минимальным» понимаются соответствующие эмпирические значенияотносительно 8 исследованных ЧС «Сказания», а не какие-либо предельные значения.176характеристикам, анэнтропийные характеристики отличаются сильнее), особеннопри анализечастотных словарейлексем.Интереспредставляет списоксокращенного варианта. Он, по всей видимости, появился в результатеидеологическойинтерпретированаобработки.какТеоретически,признактого,чтомалаяидетэнтропиятщательнаяможетбытьсортировкавысокочастотной лексики, либо упрощение, примитивизация; малое значениеанэнтропии может указывать на редкость и хаотичность низкочастотныхэлементов. Как бы то ни было, этот секуляризованный вариант по своемувоздействию очень доходчив, а по форме – компактен.5.
Содержание редакционных изменений не поддается интерпретации впределах энтропийно-анэнтропийных характеристик процессов, с которымиработает Т.Г.Петров, что указывает на невозможность описания изменения текстакак процесса на изучаемом материале, по-видимому, из-за транзитивногополиморфизма. Это, в общем, достаточно тривиальный вывод, поскольку прирасширении круга источников текста может происходить сокращение фрагментовтекста (случай Киприановской, Летописной редакций и редакции Синопсиса).Даже в случае существенного дополнения исходного текста – вставка двухповестей в Распространенной редакции, что соответствует смешению составов,значения Н и А у Основной и Распространенной редакций изменяются по схемеразделения составов.
Место Распространенной редакции и ее компилятивногосписка на диаграммах НА почти совпадает, хотя, казалось бы, должны проявитьсяпризнаки смешения у компилятивного варианта: увеличение энтропии иуменьшение анэнтропии относительно значений Распространенной редакции (охарактере изменения энтропийно-анэнтропийных характеристики составов см. в2.2.5, с. 70).1773.1.5 Анализ ЧС «Сказания о Мамаевом побоище»с применением структурно-топологической динамики В.В.ФуфаеваВ.В.Фуфаев, как уже отмечалось в 2.2.6, исследует техноценозы ибизнесценозы, состоящие из относительно небольшого числа компонентов.Количество компонентов не превышает нескольких сотен, и почти все онисохраняютсявразноевремясуществованияобъекта.Такаяспецификаэмпирического материала позволяет компактно и наглядно визуализироватьграфикиструктурно-топологическойдинамики,рассчитыватьпрогнозныезначения для каждого из компонентов и отслеживать проблемные объекты спомощью S-распределения.Но когда мы переходим к обработке вариативного текста «Сказания оМамаевом побоище», то сталкиваемся с эмпирическим материалом, разнообразиекомпонентов которого на порядок или на два порядка больше, чем разнообразиеобследованных Б.И.Кудриным и В.В.Фуфаевым техноценозов.
По этой причиневизуализация на графике траекторий объектов по рангам для распределенияцеликом оказывается неинформативной, т.к. траектории визуально неразличимы.Крометого,принципиальныммоментомдлярасчетаструктурно-топологической динамики по лингвистическим частотным словарям являетсянеизменный видовой состав, т.е. лексическая единица должна входить во всечастотные словари. Очевидно, что для текста «Сказания» это условие невыполняется.
В.В.Фуфаев допускает случаи, когда единичные компонентыисчезает или появляются (например, запуск нового завода, ликвидация банка), нов практике применения S-распределения отсутствуют случаи, когда варьируетоколо двух третей компонентов, как в словарях «Сказания».Есть несколько способов выхода из сложившегося положения:1781.
Формирование инвариантного словаря (далее – ИС) для рассматриваемыхсписков, т.е. словаря, состоящего из слов, встречающихся во всех текстах(пересечение словарей).2. Формирование общего словаря, состоящего из слов, каждое из которыхвстречается хотя бы один раз в одном списке, по всем спискам, с приписываниемслову нулевой частоты либо «виртуального ранга» в ЧС тех списков, где оно невстречается (объединение словарей).3.
Формирование словаря отождествленных слов, наследующего всетрудности и исследовательские волеизъявления, с которыми столкнуласьглоттохронология при составлении основного словаря.Первый способ показался более осмысленным, поскольку он позволяет, вопервых, корректно рассчитать коэффициент конкордации в соответствии состатьей, в которой М. Кендэл и Б.
Смит вводят коэффициент конкордации W какмеру оценки согласованности мнений экспертов о закрытом списке оцениваемыхими объектов)1, а во-вторых, снизить число рассматриваемых компонентов до500, тем самым облегчая интерпретацию.Неустранимым недостатком второго и третьего способов оказываетсянеобходимость введения некоторого «виртуального ранга» и его численноеопределение, а также очевидная зависимость ранга элемента от объема текста.Если число компонентов невелико, то можно прибегнуть к любому из способов.Для исследования методом СТД были подготовлены следующие 8комплектов инвариантных частотных словарей (объем инвариантных словарейприведен в таблице 13 на с.