Диссертация (1148605), страница 34
Текст из файла (страница 34)
С.Л.Пущинпредположил2, что распределение технических изделий хорошо описываетсямоделью простых чисел из-за того, что они изготавливаются в соответствии срядами Ренара (ряды предпочтительных чисел). Таким образом, меньшая степеньразнообразия технических изделий связана с целенаправленной деятельностью,вытекающей из логики технического конструирования.В силу сказанного, можно утверждать, что казавшаяся Б.И.Кудринууниверсальной модель простых чисел адекватна только для совокупностей сопределенным типом многообразия.Положительным свойством модели простых чисел является способностьимитировать«всплескиипровалы»,свойственныеэмпирическимН-распределениям.3.1.3 Анализ ЧС «Сказания о Мамаевом побоище»с применением скользящего коэффициента вариации по Г.Я.МартыненкоМетодика расчета скользящего коэффициента вариации подробно описана внедавней монографии Г.Я.Мартыненко3.
Расчеты производятся по даннымдифференциального(вдругойтерминологии–спектрового,видового)распределения. Г.Я.Мартыненко делает следующее допущение: неоднородность1Кудрин Б.И. Устное сообщение, сентябрь 2012.Пущин С.Л. Сравнительный анализ структуры потребления электроэнергии двух территориальных районовСеверо-Запада РФ.3Мартыненко Г.Я. Введение в теорию числовой гармонии текста. С. 150―153.2169совокупности проявляется в усложненной геометрии графика коэффициентавариации V и особенно его прироста dV по мере увеличения варьирующегопризнака (частоты встречаемости элемента в совокупности), см.
таблицу 10.Таблица 10 ― Иллюстрация применения методики скользящего коэффициента вариацииiVdVdVсгл10не определенсглаживание2V1(V1 – 0)*100производится по методу……Vi – Vi-1скользящего среднегоnVn(Vn – Vn-1)*100Примечание ― i – численность класса, n – максимальная численность класса, V = σ/ x– коэффициент вариации, σ – среднеквадратическое отклонение, x - средняяСпектровое распределение рассматривается поуровнево, начиная с первогокласса (hapax legomena).
Для i = 1 V, очевидно, равен нулю. Далее рассчитываетсяV для двух строк: i = 1 и i = 2, затем для трех строк и т.д. Описанная процедурапродолжается до полного исчерпания i. Значения dV вычисляются вычитанием изтекущего значения V его предыдущего значения и увеличиваются в 100 раз дляизбежания отрицательных значений при логарифмировании. При необходимостипроизводится сглаживание по методу скользящей средней.Скользящий коэффициент вариации был рассчитан для ЧС «Сказания» всехтипов. Для ЧС рукописных словоформ было дополнительно произведеносглаживание значений по методу скользящего среднего.
Как оказалось,сглаживание не меняет принципиально поведение кривой, поэтому для ЧСстандартизованных словоформ и ЧС лексем сглаживание не применялось.ГрафикиприростаскользящегокоэффициентавариацииприведенывПриложении Ж, значения скользящего коэффициента вариации и его прироста – вПриложении М.Кривая графиков прироста скользящего коэффициента вариации длясписков «Сказания» отличается от кривых, построенных Г.Я.Мартыненко дляраспределений поэтов по числу написанных ими романсов, футболистов по числузабитых ими голов и т.п.
Вероятно, причина в очевидно бо́льшем статистическомразнообразии текстов «Сказания».170Напротив,графикиинтегральныхраспределений,построенныхдлячастотных словарей словоформ и нормализованных словоформ «Сказания»однотипны (см. рисунок 6 в п. 2.2.4, с. 114) и хорошо согласуются с выводамиГ.Я.Мартыненко о наличии у кривой распределения 2 точек перегиба,«выраженных в каждом отдельном случае с разной степенью откровенности»1.Нужноотметить,чтодляH-распределенийсписков«Сказания»коэффициент вариации «патологически» велик и растет с приближением выборкик генеральной совокупности: для списков «Сказания» он изменяется от 4 до 7, притом, что в статистическом сообществе принято считать превышение этимпараметром значения от 0,33 до 0,50 явным указанием на качественнуюнеоднородность совокупности2.На представленном на рисунке 15 графике «Сказания» явно прослеживаетсяследующая тенденция: сначала функция монотонно убывает, потом убываниечередуется с возрастанием и, наконец, монотонно возрастает (графики для всехсписков «Сказания» по трем типам ЧС приведены в Приложении Ж).6,0005,0004,000ln(dV*100)периферияядро3,000Асгл2,000АВВсгл1,0000,0000,0001,0002,0003,0004,0005,0006,0007,000-1,000ln(n)Примечание ― n – численность класса, dV – изменение коэффициента вариации длясоседних классов, розовый цвет – сглаженные данные, черный – данные без сглаживанияРисунок 15 ― График прироста скользящего коэффициента вариации для спискаРаспространенной редакции1Мартыненко Г.Я.
Некоторые закономерности концентрации и рассеяния элементов в лингвистических и другихсложных системах. С.71―72.2Мартыненко Г.Я. Введение в теорию числовой гармонии текста. С. 151.171Все полученные графики однотипны. Точками А и В обозначены границымонотонности, Асгл и Всгл – то же, для сглаженных данных. Эти точки разбиваюткривую спектрового распределения на три зоны: ядерную, переходную ипериферическую. Сопоставление границы ядерной зоны, пойнтер-точки R и точкиh Альтманна и Попеску см.
в § 4.2.Значения коэффициента вариации (столбец V в таблицах, приведенных вПриложении М) для частотных словарей рукописных словоформ изменяются винтервале 4,321÷6,989; для стандартизованных словоформ – в интервале4,577÷6,880; для лексем – в интервале 3,711÷5,162; при этом не обнаруживаетсячеткой тенденции к росту этого коэффициента с увеличением объема генеральнойсовокупности(ср.значениякомпилятивноговариантаиКиприановскойредакции). Максимальное значение коэффициента вариации для всех типовчастотных словарей наблюдается у распределения для Киприановской редакции, аминимальное – для сокращенного варианта.Таблица 11 ― Значения параметра β Н-распределения для разных типов частотныхсловарей списков «Сказания»Название редакцииNVркпVстVлексОсновная10967 5,226 5,1154,173Летописная9877 4,963 4,9244,123Киприановская11325 6,989 6,8805,162Распространенная11442 5,441 5,3984,246Ред.
Синопсиса8536 4,604 4,6453,825Сокращенный6789 4,321 4,5773,711Компилятивный11242 5,520 5,4864,332Беллетризованный8471 4,821 4,7853,967Примечания1 Полужирным шрифтом выделено максимальное значение признака, курсивом –минимальное2 N – количество словоупотреблений в тексте3 Vркп – значение коэффициента вариации для спектровых распределений списков«Сказания» по ЧС рукописных словоформ, Vст – значение коэффициента вариации дляспектровых распределений списков «Сказания» по ЧС стандартизованных словоформ, Vлекс –значение коэффициента вариации для спектровых распределений списков «Сказания» по ЧСлексем172Резко отличается по обсуждаемому параметру только список Киприановскойредакции, очевидно, из-за аномально высокой частоты употребления в этомсписке союза «и» – ср. динамику коэффициента вариации без учета элементасовокупности, имеющего максимальную частоту.
Г.Я.Мартыненко указывает нато, что непомерно высокая частота союза «и» характерна для церковных текстов,и аналогичное явление было им обнаружено при анализе частотных словарейпроизведенийЛеонидаГ.Я.МартыненкоАндреева.приводитсяВпоследнейграфиквышедшейскользящегомонографииэмпирическогокорреляционного отношения1 для частотных словарей произведений Л.Андрееваи Ветхого Завета. Только для этих случаев у кривой графика отсутствуетмаксимум. Причина такого поведения кривой, по мнению Г.Я.Мартыненко,отчасти заключается в том, что «частота самого частого слова настолько велика,что она переводит траекторию кривой с убывающего хода на возрастающий»2.
Наосновании этих данных Г.Я.Мартыненко считает правильным «говорить не обинарном членении совокупности, а о трех зонах словаря: зоне строевыхэлементов, зоне высокоактивных семантически полных элементов с широкойсемантикой и зоне редких элементов с узкой семантикой»3. Такая трактовкаисследовательскойданными,методикиполученнымидляГ.Я.Мартыненкосписковидеально«Сказания»,сопоставляетсяпосколькудажесприсглаживании значений прироста коэффициента вариации графики ЧС «Сказания»не соотносятся с двухвершинными графиками, полученными Г.Я.Мартыненкопри анализе распределений предикатных слов по частоте встречаемости, поэтовпо числу написанных ими романсов, персонажей по числу их упоминаний.1О расчете и смысле эмпирического корреляционного отношения (э.к.о.) см.
цитируемую работу, с. 154―156. Дляданных Г.Я.Мартыненко результаты, получаемые с помощью э.к.о. совпадают с результатами, получаемые спомощью скользящего коэффициента вариации.2Мартыненко Г.Я. Введение в теорию числовой гармонии текста. С.177―178.3Там же.1733.1.4 Анализ ЧС «Сказания о Мамаевом побоище»с применением рангово-энтропийного подхода Т.Г.ПетроваЧастотные словари списков «Сказания» по рекомендации Т.Г.Петроваанализировались целиком и вычислялись ненормированные значения энтропии ианэнтропии.Расчеты проводились для всех трех типов частотных словарей, результатысведены в таблицу 12 и рисунки Н.1–Н.3 (Приложение Н).Диаграммы НА подтверждают утверждения Т.Г.Петрова о том, чтовозможны «не любые» сочетания энтропии и анэнтропии: например, им необнаруживались объекты, характеризующиеся одновременно максимальнойчистотой и предельно высокой сложностью состава или с минимальной чистотойиминимальнойсложностью.Болеетого,Т.Г.Петровнастаиваетнаневозможности существования таких объектов.