Автореферат (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)), страница 6
Описание файла
Файл "Автореферат" внутри архива находится в папке "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)". PDF-файл из архива "Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)", который расположен в категории "". Всё это находится в предмете "филология" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата филологических наук.
Просмотр PDF-файла онлайн
Текст 6 страницы из PDF
Зафиксировав на ранговом распределении точку h, можно выделитьбо́льшую часть тематически незначимой лексики, в то время как параметрыБ.И.Кудрина и Г.Я.Мартыненко позволяют отфильтровать лишь самыевысокочастотные строевые элементы (см. таблицу 5).Таблица 5 ― Словоформы, отграничиваемые точкой h (весь столбец), пойнтер-точкой R (серыйфон) и правой границей знакомонотонности скользящего коэффициента вариации (полужирныйшрифт), по ЧС стандартизованных словоформОсновная ред.,РНБ O.IV.22r , ранг123456789101112131415161718192021222324252627282930313233И(Ж)НАНЕКНЗЬ#АО(Т)ЯКОВБОЖЕСВЕЛИКИИЕГОПОВЪДАРЕ(Ч)НН+#ЕМУСЪТОКСВОЕГОАКИГИ#КНЗЯ#ВЕЛИКОМУКНЗЮ#ЗАКНЗИ#НА(М)НА(С)Летописная ред.,СПбОИИ 251f (r )7582252091149390878584827979747462565251474644403939383736353533333333ИНАЖЕ(Ж)НЕКНЯ(З)АБОНОО(Т)ВРЕ(Ч)ЕГОЯКОВЕЛИКИИСДАПОЕМУТОККНЗЯ#КНЗИ#КНЗЮ#СВОЕГОВЕЛИКОМУИ(Х)КОВООСОДМИТРЕИf (r )687196141139123999787858581777474686865645550434140403938373332323231ред.
Синопсиса,РНБ Собр.Колобова,№336ИЖЕНАО(Т)КНЯЗЬСВОЯКОНЕЕГОВЕЛИКИИДАРЕЧЕСОКНЯЗЯПОКВЕЛИКАГОЕМУАДИМИТРИИВОСВОЕГОЗАНОВЕЛИКОМУКНЯЗЮВЪf (r )56719016910089898077777664635553454443403939383833333131303028Беллетризованныйсписок,РНБ Мих.Q.509ИЖЕНАКНЯ(З)ВЕЛИКИИНЕСО(Т)ЯКОВРЕЧЕДАИВАНОВИЧЪДМИТРЕИАЕГОПОКСВОЕГОЕМУСОТОВОВЕЛИКОМУЗАБОНАЧАКОf (r )636243160104888472717167585755534948474241403938343331292928Примечание ― в скобки заключены выносные буквыПрактически значимые результаты получаются при комбинированииметодики М.
В. Арапова-М. М. Херц с S-распределением В. В. Фуфаева встабильной зоне S-распределения (§ 4.5). С помощью этого приема удалосьвыделить маркированную лексику вставных повестей в инвариантном словаресписков Распространенной редакции РНБ Q.IV.354 и РНБ Q.XVII.70 (таблица 6).М. В. Арапов и М.
М. Херц выдвигают и подтверждают гипотезу обуменьшении шансов слова сохраниться в своей ранговой группе с увеличениемранга слова (Арапов, Херц, 1972). Эта же гипотеза была принята приисследовании состава стабильной зоны S-распределения типового и23сокращенного вариантов Распространенной редакции, в которую попадают слова,незначительно изменившие свой ранг в частотном словаре вариантов текста.Стабильная зона разбивалась на группы по 100 рангов (не слов!), после чегоподсчитывалась доля словоформ каждой ранговой группы в стабильной зоне(активность), сохранившихся в пределах группы и перешедших в соседниегруппы (сохранность), см.
рисунок 4. Так, для трех первых ранговых группнаблюдалось хорошее соответствие гипотезе М.В.Арапова-М.М.Херц: иактивность, и сохранность словоформ уменьшались с увеличением номераранговой группы. Начиная с 4-й ранговой группы сохранность немонотонноувеличивалась до последней группы. Активность же продолжала уменьшаться до6-й группы, а начиная с 7-й группы увеличилась и осталась неизменной в 8-й и 9й группах. Таким образом, кроме словоформ 1-й ранговой группы (1≤r≤100),словоформы 7-й, 8-й и 9-й ранговых групп (601≤r≤900) также имеютотносительно большую активность и сохранность в пределах ранговой группы.Активность словоформ i-й группы встабильной зоне (Ряд 1), сохранностьсловоформ i-й группы (Ряд 2)0,900,800,700,600,50Ряд1Ряд20,400,300,200,100,00012345678910i, номер ранговой группыПримечание ― на графике не отображены данные для последней ранговой группы, таккак они полностью зависят от объема инвариантного словаряРисунок 4 ― Активность и сохранность в пределах ранговой группы словоформ разныхранговых групп в стабильной зоне S-распределения Распространенной редакции и еесокращенного вариантаЛексика 7-й ранговой группы приведена в таблице 6.
Словоформы,выделенные в таблице 6 полужирным шрифтом, относятся к прямой речиперсонажей вставной повести о Захарии. Все эти словоформы относятся куникальной лексике в обоих списках. Лексика 8-й ранговой группыпреимущественно относится к началу вставной повести о новгородцах.Таким образом, наблюдается отклонение в определенном диапазоне рангов,соответствующем уникальной лексике, которая является настолько важной, чтоне может быть удалена из текста при его сокращении. Указанный способ24выделения рядом стоящих hapax legomena имеет не статистическую природу, аопределяется детерминистическим алгоритмом.Таблица 6 ― Лексика 7-й ранговой группы601≤r распр ≤700словоформы, перешедшие в (i -1)-уюгруппусловоформаr распр r сокр φсловоформы, сохранившихся в пределах словоформы, перешедшие в (i +1)-уюгруппыгруппусловоформаr распр r сокр φсловоформа r распр r сокр φУТОЛЯТИСМИРИТЦАОБЛОБЫЗАИПОЧЕСТЬКУПИТЕПЛЕТИПОКЛОНИСЯПРИСТАВЛЮ601603636637638639608640534535568571572573600575-67-68-68-66-66-66-8-65МИТРОПОЛИТАСЛОВОСОТВОРИШИПРОВОДИТИХВАТАТИБЕЗУМИЯТАТАРИННЕУКЛОННО60562965765866166266366568062160160260561061261475 МНОГОЮ-8 ФЕДОР-56-56-56-52-51-51ВОЗМУДВОРОБЫЧАЯПОСАЖУДОВЕРШАСЛУГОЮСОЛГАХПЕРВОМУСЛОЖУСМИРЕННАГОТАТАР641642643644646648650651652654660578577579580583584586587589593597-63-65-64-64-63-64-64-64-63-61-63ЗАКОННУЮГРАМОТАБПОСЫЛАЛИПИСАНАЛ+ТАТЕЧЕНИЕТРОИЦЫПРЕПОДОБНОМУВСЕЮОКРОПИЕТЕРАПОСЛУШАНИЕОРУЖИЯОРУЖНИЦЫГРАДУСОКРОВИЩЕНЕКРАДОМОЕЛОЖНИЦУМУЖИ668671672674675676678683684686690691692693694695696697698700620609627628629630637639640645647648650651653657658659662693-48-62-45-46-46-46-41-44-44-41-43-43-42-42-41-38-38-38-36-76796817577797898Примечания1 Полужирным шрифтом выделена маркированная лексика вставной повести опосольстве Захарии2 rраспр – ранг словоформы в ЧС Распространенной редакции РНБ Q.IV.354, rсокр – рангсловоформы в ЧС ее сокращенного варианта РНБ Q.XVII.70 (ранги приписываются поинвариантному словарю), φ – скоростьВ § 4.6 приводятся данные о количественных особенностях сокращениятекста (таблица 7).
Сокращение производится преимущественно за счет hapaxlegomena. Одновременно с ростом численности класса n (n = 1, 2, 3…) резкоуменьшается количество слов-новаций сокращенного варианта РНБ Q.XVII.70.При анализе ЧС лексем оказалось, что новации в сокращенном списке перестаютвстречаться, начиная с лексем, встретившихся в тексте 6 и более раз; при этомлексемы-новации относятся к более позднему времени, чем время составлениясамой Распространенной редакции, их можно считать т.н.
«заносными»элементами.Лексика,сохранившаясявсокращенном25Таблица 7 ― Количественные аспекты сокращения текста на примере частотных словарей лексем Распространенной редакций и еесокращенного вариантаn, частотавстречаемостилексемы11234567891011-Fmaxfполн(n)294027914911565402526920184fполн(n)/N30,0820,0240,0130,0100,0060,0040,0020,0020,0010,0020,016fсокр(n)46282111104442201815168119fсокр(n)/N50,0930,0310,0160,0060,0060,0030,0030,0020,0020,0010,018fобщ(n)62411431058953372224820179Количестволексем-новацийс частотой n,появившихся вПреимущественные группы переходасокращенномдля лексем из колонки (6)вариантеfобщ2(n)789174n=2 (49); n=3 (11); n=4 (4); n=5 (3)25326n=1 (87); n=3 (20); n=4 (7); 4<n<7 (10)4115n=1 (46); n=2 (35); n=4 (3); 4<n<8 (9)75n=1 (34); n=2 (17); n=3 (20); 4<n<7 (13)32n=1 (13); n=2 (17); n=3 (12); 3<n<8 (9)41n=1 (5); n=2 (19); 7<n<47 (10)00n=1 (6); n=3 (6);00n=1 (5); n=3 (5); n=4 (5);03преимущественной группы нет01преимущественной группы нет00не сохраняют частоты0Примечания1.
В столбцах 3 и 5 указана доля в тексте лексем, встретившихся n раз, в столбце 8 в скобках указано количество лексем, перешедшихв класс с частотой n из класса, указанного в столбце 12. fполн(n) – количество лексем с частотой n в исходном тексте, fсокр(n) – количество лексем с частотой n в сокращенном тексте,fобщ(n) – количество лексем, имеющих частоту n в полном варианте, и сохранившихся в сокращенном варианте, fобщ2(n) – количество лексем,имеющих частоту n вполномварианте,исохранившихся всокращенномварианте с той же частотой26списке с другой частотой, чем в полном, распределяется по соседним частотнымклассам относительно ее частотного класса в сокращаемом списке.В Заключении обобщаются результаты исследования и приводятся выводы.1.Совокупность имеющихся эмпирических данных, относящихся кразличному материалу, априорные соображения (экстремальные принципы,принципы симметрии, признание уникального значения натуральных чисел ит.п.), теоретические положения статистики (различение процессов разных типов),эмпирические критерии (аномальный рост дисперсии у эмпирическихраспределений) являются основанием для принятия тезиса о негауссовой природераспределений лексического состава в тексте как поликомпонентном объекте.2.Ни одна из существующих концептуально различных моделейраспределения численности компонентов поликомпонентных объектов не даетуниверсальных либо исчерпывающих характеристик статистической структурытекста.3.Отношения разных редакций и списков «Сказания» как вариативноготекста могут быть представлены в категориях транзитивного полиморфизма.Изученные редакции дают представления о пределах полиморфизма текста«Сказания»,апоэтому составляютрепрезентативныймассивдлялингвостатистического исследования вариативного текста.4.В настоящей работе впервые произведена апробация всехрассмотренныхмоделейраспределениячисленностикомпонентовполикомпонентных объектов на едином массиве эмпирических данных, чтопозволяет оценить возможности этих моделей, в частности:― показана неприменимость модели простых чисел Б.
И. Кудрина кобработке распределений лексики в текстах из-за большого индекса разнообразия;― обнаружена относительно неплохая аппроксимация эмпирическихраспределений моделью В. П. Маслова и Н-распределением Б. И. Кудрина;― получен ряд интересных и практически значимых результатов прииспользовании модели структурно-топологической динамики В. В. Фуфаева, вособенности при комбинировании ее с моделью М. В. Арапова-М. М. Херц.Можно утверждать, в частности, что1) Лексика инвариантных словарей охватывает от 38 до 96 %словоупотреблений в списках «Сказания», свидетельствуя о малом разнообразиисемантически насыщенной лексики.2) Коэффициент конкордации Кендэла может быть использован в качествеиндикатора однородности выборки, обладая чувствительностью к введению ввыборку инородного текста.3) Антисимметричная форма и наличие обширной стабильной зоны в Sраспределениях инвариантных словарей групп и пар списков «Сказанияуказывают на темпоральную устойчивость структуры текста «Сказания», а формаграфика S-распределения может быть индикатором характера изменения текста.4) Комбинация методик В.