Автореферат (1148604), страница 6

Файл №1148604 Автореферат (Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)) 6 страницаАвтореферат (1148604) страница 62019-06-292019-06-29СтудИзба

Негауссовое моделирование лексико-статистической структуры вариативного текста (на примере «Сказания о Мамаевом побоище»)

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 6)

Зафиксировав на ранговом распределении точку h, можно выделитьбо́льшую часть тематически незначимой лексики, в то время как параметрыБ.И.Кудрина и Г.Я.Мартыненко позволяют отфильтровать лишь самыевысокочастотные строевые элементы (см. таблицу 5).Таблица 5 ― Словоформы, отграничиваемые точкой h (весь столбец), пойнтер-точкой R (серыйфон) и правой границей знакомонотонности скользящего коэффициента вариации (полужирныйшрифт), по ЧС стандартизованных словоформОсновная ред.,РНБ O.IV.22r , ранг123456789101112131415161718192021222324252627282930313233И(Ж)НАНЕКНЗЬ#АО(Т)ЯКОВБОЖЕСВЕЛИКИИЕГОПОВЪДАРЕ(Ч)НН+#ЕМУСЪТОКСВОЕГОАКИГИ#КНЗЯ#ВЕЛИКОМУКНЗЮ#ЗАКНЗИ#НА(М)НА(С)Летописная ред.,СПбОИИ 251f (r )7582252091149390878584827979747462565251474644403939383736353533333333ИНАЖЕ(Ж)НЕКНЯ(З)АБОНОО(Т)ВРЕ(Ч)ЕГОЯКОВЕЛИКИИСДАПОЕМУТОККНЗЯ#КНЗИ#КНЗЮ#СВОЕГОВЕЛИКОМУИ(Х)КОВООСОДМИТРЕИf (r )687196141139123999787858581777474686865645550434140403938373332323231ред.

Синопсиса,РНБ Собр.Колобова,№336ИЖЕНАО(Т)КНЯЗЬСВОЯКОНЕЕГОВЕЛИКИИДАРЕЧЕСОКНЯЗЯПОКВЕЛИКАГОЕМУАДИМИТРИИВОСВОЕГОЗАНОВЕЛИКОМУКНЯЗЮВЪf (r )56719016910089898077777664635553454443403939383833333131303028Беллетризованныйсписок,РНБ Мих.Q.509ИЖЕНАКНЯ(З)ВЕЛИКИИНЕСО(Т)ЯКОВРЕЧЕДАИВАНОВИЧЪДМИТРЕИАЕГОПОКСВОЕГОЕМУСОТОВОВЕЛИКОМУЗАБОНАЧАКОf (r )636243160104888472717167585755534948474241403938343331292928Примечание ― в скобки заключены выносные буквыПрактически значимые результаты получаются при комбинированииметодики М.

В. Арапова-М. М. Херц с S-распределением В. В. Фуфаева встабильной зоне S-распределения (§ 4.5). С помощью этого приема удалосьвыделить маркированную лексику вставных повестей в инвариантном словаресписков Распространенной редакции РНБ Q.IV.354 и РНБ Q.XVII.70 (таблица 6).М. В. Арапов и М.

М. Херц выдвигают и подтверждают гипотезу обуменьшении шансов слова сохраниться в своей ранговой группе с увеличениемранга слова (Арапов, Херц, 1972). Эта же гипотеза была принята приисследовании состава стабильной зоны S-распределения типового и23сокращенного вариантов Распространенной редакции, в которую попадают слова,незначительно изменившие свой ранг в частотном словаре вариантов текста.Стабильная зона разбивалась на группы по 100 рангов (не слов!), после чегоподсчитывалась доля словоформ каждой ранговой группы в стабильной зоне(активность), сохранившихся в пределах группы и перешедших в соседниегруппы (сохранность), см.

рисунок 4. Так, для трех первых ранговых группнаблюдалось хорошее соответствие гипотезе М.В.Арапова-М.М.Херц: иактивность, и сохранность словоформ уменьшались с увеличением номераранговой группы. Начиная с 4-й ранговой группы сохранность немонотонноувеличивалась до последней группы. Активность же продолжала уменьшаться до6-й группы, а начиная с 7-й группы увеличилась и осталась неизменной в 8-й и 9й группах. Таким образом, кроме словоформ 1-й ранговой группы (1≤r≤100),словоформы 7-й, 8-й и 9-й ранговых групп (601≤r≤900) также имеютотносительно большую активность и сохранность в пределах ранговой группы.Активность словоформ i-й группы встабильной зоне (Ряд 1), сохранностьсловоформ i-й группы (Ряд 2)0,900,800,700,600,50Ряд1Ряд20,400,300,200,100,00012345678910i, номер ранговой группыПримечание ― на графике не отображены данные для последней ранговой группы, таккак они полностью зависят от объема инвариантного словаряРисунок 4 ― Активность и сохранность в пределах ранговой группы словоформ разныхранговых групп в стабильной зоне S-распределения Распространенной редакции и еесокращенного вариантаЛексика 7-й ранговой группы приведена в таблице 6.

Словоформы,выделенные в таблице 6 полужирным шрифтом, относятся к прямой речиперсонажей вставной повести о Захарии. Все эти словоформы относятся куникальной лексике в обоих списках. Лексика 8-й ранговой группыпреимущественно относится к началу вставной повести о новгородцах.Таким образом, наблюдается отклонение в определенном диапазоне рангов,соответствующем уникальной лексике, которая является настолько важной, чтоне может быть удалена из текста при его сокращении. Указанный способ24выделения рядом стоящих hapax legomena имеет не статистическую природу, аопределяется детерминистическим алгоритмом.Таблица 6 ― Лексика 7-й ранговой группы601≤r распр ≤700словоформы, перешедшие в (i -1)-уюгруппусловоформаr распр r сокр φсловоформы, сохранившихся в пределах словоформы, перешедшие в (i +1)-уюгруппыгруппусловоформаr распр r сокр φсловоформа r распр r сокр φУТОЛЯТИСМИРИТЦАОБЛОБЫЗАИПОЧЕСТЬКУПИТЕПЛЕТИПОКЛОНИСЯПРИСТАВЛЮ601603636637638639608640534535568571572573600575-67-68-68-66-66-66-8-65МИТРОПОЛИТАСЛОВОСОТВОРИШИПРОВОДИТИХВАТАТИБЕЗУМИЯТАТАРИННЕУКЛОННО60562965765866166266366568062160160260561061261475 МНОГОЮ-8 ФЕДОР-56-56-56-52-51-51ВОЗМУДВОРОБЫЧАЯПОСАЖУДОВЕРШАСЛУГОЮСОЛГАХПЕРВОМУСЛОЖУСМИРЕННАГОТАТАР641642643644646648650651652654660578577579580583584586587589593597-63-65-64-64-63-64-64-64-63-61-63ЗАКОННУЮГРАМОТАБПОСЫЛАЛИПИСАНАЛ+ТАТЕЧЕНИЕТРОИЦЫПРЕПОДОБНОМУВСЕЮОКРОПИЕТЕРАПОСЛУШАНИЕОРУЖИЯОРУЖНИЦЫГРАДУСОКРОВИЩЕНЕКРАДОМОЕЛОЖНИЦУМУЖИ668671672674675676678683684686690691692693694695696697698700620609627628629630637639640645647648650651653657658659662693-48-62-45-46-46-46-41-44-44-41-43-43-42-42-41-38-38-38-36-76796817577797898Примечания1 Полужирным шрифтом выделена маркированная лексика вставной повести опосольстве Захарии2 rраспр – ранг словоформы в ЧС Распространенной редакции РНБ Q.IV.354, rсокр – рангсловоформы в ЧС ее сокращенного варианта РНБ Q.XVII.70 (ранги приписываются поинвариантному словарю), φ – скоростьВ § 4.6 приводятся данные о количественных особенностях сокращениятекста (таблица 7).

Сокращение производится преимущественно за счет hapaxlegomena. Одновременно с ростом численности класса n (n = 1, 2, 3…) резкоуменьшается количество слов-новаций сокращенного варианта РНБ Q.XVII.70.При анализе ЧС лексем оказалось, что новации в сокращенном списке перестаютвстречаться, начиная с лексем, встретившихся в тексте 6 и более раз; при этомлексемы-новации относятся к более позднему времени, чем время составлениясамой Распространенной редакции, их можно считать т.н.

«заносными»элементами.Лексика,сохранившаясявсокращенном25Таблица 7 ― Количественные аспекты сокращения текста на примере частотных словарей лексем Распространенной редакций и еесокращенного вариантаn, частотавстречаемостилексемы11234567891011-Fmaxfполн(n)294027914911565402526920184fполн(n)/N30,0820,0240,0130,0100,0060,0040,0020,0020,0010,0020,016fсокр(n)46282111104442201815168119fсокр(n)/N50,0930,0310,0160,0060,0060,0030,0030,0020,0020,0010,018fобщ(n)62411431058953372224820179Количестволексем-новацийс частотой n,появившихся вПреимущественные группы переходасокращенномдля лексем из колонки (6)вариантеfобщ2(n)789174n=2 (49); n=3 (11); n=4 (4); n=5 (3)25326n=1 (87); n=3 (20); n=4 (7); 4<n<7 (10)4115n=1 (46); n=2 (35); n=4 (3); 4<n<8 (9)75n=1 (34); n=2 (17); n=3 (20); 4<n<7 (13)32n=1 (13); n=2 (17); n=3 (12); 3<n<8 (9)41n=1 (5); n=2 (19); 7<n<47 (10)00n=1 (6); n=3 (6);00n=1 (5); n=3 (5); n=4 (5);03преимущественной группы нет01преимущественной группы нет00не сохраняют частоты0Примечания1.

В столбцах 3 и 5 указана доля в тексте лексем, встретившихся n раз, в столбце 8 в скобках указано количество лексем, перешедшихв класс с частотой n из класса, указанного в столбце 12. fполн(n) – количество лексем с частотой n в исходном тексте, fсокр(n) – количество лексем с частотой n в сокращенном тексте,fобщ(n) – количество лексем, имеющих частоту n в полном варианте, и сохранившихся в сокращенном варианте, fобщ2(n) – количество лексем,имеющих частоту n вполномварианте,исохранившихся всокращенномварианте с той же частотой26списке с другой частотой, чем в полном, распределяется по соседним частотнымклассам относительно ее частотного класса в сокращаемом списке.В Заключении обобщаются результаты исследования и приводятся выводы.1.Совокупность имеющихся эмпирических данных, относящихся кразличному материалу, априорные соображения (экстремальные принципы,принципы симметрии, признание уникального значения натуральных чисел ит.п.), теоретические положения статистики (различение процессов разных типов),эмпирические критерии (аномальный рост дисперсии у эмпирическихраспределений) являются основанием для принятия тезиса о негауссовой природераспределений лексического состава в тексте как поликомпонентном объекте.2.Ни одна из существующих концептуально различных моделейраспределения численности компонентов поликомпонентных объектов не даетуниверсальных либо исчерпывающих характеристик статистической структурытекста.3.Отношения разных редакций и списков «Сказания» как вариативноготекста могут быть представлены в категориях транзитивного полиморфизма.Изученные редакции дают представления о пределах полиморфизма текста«Сказания»,апоэтому составляютрепрезентативныймассивдлялингвостатистического исследования вариативного текста.4.В настоящей работе впервые произведена апробация всехрассмотренныхмоделейраспределениячисленностикомпонентовполикомпонентных объектов на едином массиве эмпирических данных, чтопозволяет оценить возможности этих моделей, в частности:― показана неприменимость модели простых чисел Б.

И. Кудрина кобработке распределений лексики в текстах из-за большого индекса разнообразия;― обнаружена относительно неплохая аппроксимация эмпирическихраспределений моделью В. П. Маслова и Н-распределением Б. И. Кудрина;― получен ряд интересных и практически значимых результатов прииспользовании модели структурно-топологической динамики В. В. Фуфаева, вособенности при комбинировании ее с моделью М. В. Арапова-М. М. Херц.Можно утверждать, в частности, что1) Лексика инвариантных словарей охватывает от 38 до 96 %словоупотреблений в списках «Сказания», свидетельствуя о малом разнообразиисемантически насыщенной лексики.2) Коэффициент конкордации Кендэла может быть использован в качествеиндикатора однородности выборки, обладая чувствительностью к введению ввыборку инородного текста.3) Антисимметричная форма и наличие обширной стабильной зоны в Sраспределениях инвариантных словарей групп и пар списков «Сказанияуказывают на темпоральную устойчивость структуры текста «Сказания», а формаграфика S-распределения может быть индикатором характера изменения текста.4) Комбинация методик В.

Характеристики

Тип файла

PDF-файл

Размер

1,36 Mb

Материал

Тип материала

Кандидатская диссертация

Предмет

Филология

Высшее учебное заведение

СПбГУ

Список файлов диссертации

negaussovoe-modelirovanie-leksiko-statisticheskoj-struktury-variativnogo-teksta-na-primere-skazanija-o-mamaevom-poboische.rar

Автореферат.pdf

Диссертация.pdf

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.