Диссертация (1148605), страница 41
Текст из файла (страница 41)
СинопсисаИКНЯЗЬЖЕВЕЛИКИИНАСВОИСВОНОTБЫТИВЕСЬЯКООДМИТРИИНЕКТЪРЕЧИСВЯТЫИОНИБОГМЫДАСЬГОСПОДЬНАШМАМАИПОПОЛКТЫГЛАГОЛАТИАЗАНАЧАТИМНОГИИf (r )5682471971841691571471411201009287777777767568676463605555534947444340393838383734СокращенныйИКНЯЗЬВЕЛИКИИЖЕСВОИНАВСДМИТРИИОНБЫТИКРЕЧИВЕСЬОНИАИВАНОВИЧЦАРЬТЪНЕАЗМАМАИОТГОСУДАРЬПРИИТИЯКОМЫТЫНАШМОСКВАВОИСКОНАЧАТИПОf (r )5361971541401311211149494939189767067676463615351484747444340383836363533БеллетризованныйИКНЯЗЬЖЕВЕЛИКИИСВОИНАСВДМИТРИИОНИВАНОВИЧБЫТИТЪНЕКОНИВЕСЬЯКОРЕЧИОTАЗДАПОЛКМЫЦАРЬАРУССКИИПОГОСПОДЬНАШАНДРЕЕВИЧБРАТНАЧАТИБОГТЫf (r )63727924320318616014012411110799908985837876717170645756535149474744424137353533КомпилятивныйИЖЕКНЯЗЬВЕЛИКИИНАБЫТИСВОИОНВРЕЧИСОНИКНЕВЕСЬТЪЯКООTАЗЦАРЬМЫАДМИТРИИТЫДАОТВОИСЬМОИГОСПОДЬБОНАШПОПОЛКБОГМАМАИПРИИТИМНОГИИБРАТВИДЕТИСЛЫШАТИf (r )8372922752371961771661581501401351291251201161091051019992868173727169666464626057525151474645454239212§ 4.3 Сопоставление групп списковс применением индекса Я/С и диаграммы НАВ таблице 26 приведены данные об абсолютной численности ядра и объемесловаря.Границаядраопределенавсоответствиисправойграницейзнакомонотонности прироста скользящего коэффициента вариации.Таблица 26 ― Абсолютная численность ядра в ЧС «Сказания»Название спискаОсновнаяЛетописнаяКиприановскаяРаспространеннаяРед.
СинопсисаСокращенныйКомпилятивныйБеллетризованныйN109679877113251144285366789112428471NЯ1581354568V141163529381343293556262940422888Я/С10,0010,0020,0030,0010,0010,0020,0010,003NЯ2881344467V239053464366240903276255938842833Я/С2 NЯ3V3Я/С30,0027 1838 0,0040,0029 1737 0,0050,0046 1657 0,0040,0015 1853 0,0030,001 12 1587 0,0080,0027 1230 0,0060,002 23 1836 0,0130,002 12 1406 0,009Примечания1 NЯ1 – абсолютная численность ядра по ЧС рукописных словоформ, NЯ2 – абсолютнаячисленность ядра по ЧС стандартизованных словоформ, NЯ3 – абсолютная численность ядра поЧС лексем2 V1 – объем словаря рукописных словоформ, V2 – объем словаря стандартизованныхсловоформ, V3 – объем словаря лексем3 Я/С1 – индекс по ЧС рукописных словоформ, Я/С2 – индекс по ЧС стандартизованныхсловоформ, Я/С3 – индекс по ЧС лексем4 N – объем текста, в словоупотребленияхДля удобства упорядочим списки «Сказания» по возрастанию индекса Я/С(таблица 27).Проанализировав группировку списков, полученную с помощью этогоиндекса, можно сделать содержательные выводы, но, к сожалению, невоспроизводимые при переходе от одного типа словаря к другому.213Таблица 27 ― Группировка списков «Сказания» по возрастанию индекса Я/СНазвание спискаОсновнаяКомпилятивныйРаспространеннаяРед.
СинопсисаЛетописнаяСокращенныйБеллетризованныйКиприановскаяЯ/С10,0010,0010,0010,0010,0020,0020,0030,003Название спискаРаспространеннаяРед. СинопсисаКомпилятивныйБеллетризованныйОсновнаяЛетописнаяСокращенныйКиприановскаяЯ/С20,0010,0010,0020,0020,0020,0020,0020,004Название списка Я/С3Распространенная0,003Киприановская0,004Основная0,004Летописная0,005Сокращенный0,006Ред. Синопсиса0,008Беллетризованный0,009Компилятивный0,013Так, по ЧС рукописных словоформ получаются кластеры списков,аналогичныекластерам,полученнымспомощьюрасчетовэнтропииианэнтропии. Индекс Я/С одинаков у списков Основной и Распространеннойредакций, редакции Синопсиса и компилятивного списка, эти 4 списка близкорасположены и на диаграмме НА. Группировка ЧС стандартизованных словоформпо индексу Я/С не соответствует группировкепо энтропии-анэнтропии.
Припереходе к словарю лексем по индексу Я/С компилятивный список отдаляется отосновного кластера, в то время как на диаграмме НА таким периферийнымсписком является список Киприановской редакции(впрочем, неизменнорасполагающийся особняком при переходе от одного типа ЧС к другому).§ 4.4 Сопоставление групп списков, полученных с помощью диаграммыНА и долей ноевой и саранчёвой кастВ таблице 28 содержатся данные о долях в тексте экстремально частотныхэлементов: hapax legomena (ноевой касты) и одного самого высокочастотногослова (саранчёвой касты), см.
тж. таблицу 3 на с. 66). Сопоставление заключаетсяв рассмотрении особенностей кластеризации списков. Рисунки, сделанные поданным таблицы 28, вынесены в Приложение С.214Таблица 28 ― Доли ноевой (F=1) и саранчёвой (Fmax) каст для 3 типов частотныхсловарей «Сказания»ДолясловоформысFmaxвтекстеНазвание спискаДолясловоформ сF=1втекстеЧС рукописныхсловоформДоляДолясловофор- словомыс форм сFmaxв F=1втекстетекстеЧСстандартизованныхсловоформ0,0690,2460,0700,2410,2180,1060,0690,2500,0660,2720,0790,2630,0740,241Долялексемыс Fmax втекстеДолялексем сF=1втекстеЧС лексемОсновная0,0690,2650,0690,082Летописная0,0700,2470,0700,090Киприановская0,2320,0690,1060,106Распространенная0,0680,2540,0700,082Ред. Синопсиса0,0620,0670,3070,095Сокращенный0,0730,2750,0790,093Компилятивный0,0730,2540,0740,082Беллетризованный0,0750,2280,0750,2210,0750,079Примечание ― Жирным шрифтом выделено максимальное значение показателя,курсивом – минимальноеГруппировка списков на диаграммах Приложения С лучше соотносится с скластерами на диаграмме НА, чем с группировкой по индексу Я/С.
По всем типамЧС обособлен список церковной Киприановской редакции.По-видимому,Киприановскаяредакцияустроена,какучебный(назидательный) текст: словарь небольшой, но лексика повторяется часто.§ 4.5 Ранговый состав стабильной зоны S-распределенияи устойчивость лексики разных ранговых группВ пределах стабильной зоны встречаются как лексические единицы снеизменным или незначительно изменяющимся рангом, так и лексическиеединицы, изменение ранга которых значительно.
Такое сочетание тенденцийизменения рангов объясняется соотношением значений скоростей в целомраспределении, а также способом расчета ранговой скорости и соблюдениемтребования «общей нулевой скорости».215Стабильная зона исследуется в границах, установленных с учетом нулевойобщей скорости (см. таблицы 18 и 19 на с. 190–191). Для исследования выбраныстабильные зоны S-распределений двух пар списков: «Распространенная редакция– сокращенный вариант» и «Основная редакция – беллетризованный вариант» изза наличия у пар обширных редакционных изменений в более позднем тексте посравнению с более ранним текстом: в первом случае, происходит сквозноесокращение исходного текста, имеющего две вставные повести, во втором случае– обмирщение исходного текста за счет удаления молитв и добавления деталей иподробностей светского характера.
Также S-распределения этих пар списковимеют обширную стабильную зону. Предположительно, в стабильной зоне Sраспределения сгруппируется высокочастотная лексика, а также словоформы,являющиеся ключевыми для понимания основных сюжетных линий. Кроме того,интересно, как распределится лексика вставных повестей – «О посольствеЗахарии» и «О новгородцах» – которые органично введены в текст обоихвариантов Распространенной редакции.Как указывалось ранее, на набор словоформ и лексем в стабильной зоневлияет способ упорядочивания. Поэтому для того, чтобы установить влияниеспособа упорядочивания нараспределение слов по ранговымгруппам,исследовались S-распределения для ИС одной и той же пары, но с разнымупорядочиванием.Ниже описаны рассматриваемые стабильные зоны с указанием количестваслов.1.
по ИС с неалфавитным упорядочиванием:― стабильная зона S-распределения словоформ Распространенной редакциии ее сокращенного варианта, 223 словоформы;― стабильная зона S-распределения лексем Распространенной редакции иее сокращенного варианта, 303 лексемы;― стабильная зона S-распределения лексем Основной редакции и еебеллетризованного варианта, 680 лексем;2. по ИС с алфавитным упорядочиванием:216― стабильная зона S-распределения лексем Распространенной редакции иее сокращенного варианта, 700 лексем.Словоформы в стабильной зоне S-распределения упорядочивались повозрастанию их ранга в исходном тексте и разбивались на группы по 100 единиц,т.е. внутри группы 1≤r≤100, 101≤r≤200 и т.д., r –ранг.Далее, в соответствии с методикой Арапова-Херц, подсчитывалоськоличествословоформ,(сокращенномилисохранившихсябеллетризованном)впределахтекстеигруппывколичествопозднемсловоформ,перешедших в другие группы.
Слово считается сохранившимся в пределах групп,только в том случае, если его ранги в обоих текстах принадлежат к одномуинтервалу.Сначала указанным способом были обработаны стабильные зоны Sраспределений Основной редакции и ее сокращенного варианта. Результатыприведены в таблицах С.1–С.2 Приложения С, а сводные результаты – в таблицах29 и 32.Таблица 29 ― Ранговый состав стабильной зоны S-распределения Распространеннойредакции и ее сокращенного варианта (ИС словоформ, неалфавитное упорядочивание)i , номергруппы112345678910доляколичествоколичество словоформ словоформ,диапазонсловоформ i -й группы в сохранившихранговв i -й группе стабильной ся в пределахзонегруппы45231-100790,2161101-200540,1425201-300350,095301-400260,0714401-500190,058501-600160,0410601-700490,1328701-800510,1332801-900440,1126901-1000120,032долясловоформ,сохранившихсявпределахгруппы (5/3)60,770,460,140,540,420,630,570,630,590,17количествоколичествословоформ,словоформ,перешедших в перешедших в(i -1)-ую(i +1)-уюгруппугруппу7818101821939110241921361179-количествословоформ,перешедших в(i +2)-уюгруппу901000000-385В колонках 3 и 4 таблицы 29 содержатся данные об активности ранговойгруппы встабильной зоне S-распределения, а в колонках 5 и 6 – данные осохранности словоформ в зависимости от номера ранговой группы.Под активностью понимается доля словоформ / лексем i-й ранговой группывстабильнойзонеS-распределения,аподсохранностью–доля217словоформ / лексем, не изменивших свою ранговую группу в более позднемтексте.