Резюме_Скоринкин_14.12.2018 (1137489), страница 4
Текст из файла (страница 4)
Толстым как более формальная, чем у Марьи,Николая, и тем более Наташи. Заметим, что в дни после помолвки с князем Андреем именноизбыток жизни в Наташе на фоне Болконского вызывает тревогу у ее матери и брата: «Еематеринское чутье говорило ей, что чего-то слишком много в Наташе и что от этого она не14будет счастлива» [Л. Н. Толстой, 1980 (a): c. 290]; «Что значила улыбка Николая, когда онсказал: «уж выбран»? Рад он этому или не рад? Он как будто думает, что мой Болконскийне одобрил бы, не понял бы этой нашей радости» [Л. Н.
Толстой, 1980 (a): c. 278].Глава 3 посвящена моделированию системы персонажей при помощи сетевого анализа. Впервом разделе главы описываются два основных метода извлечения сетей персонажей изтекста художественного произведения: метод соседства (совместной встречаемости внутриопределенного отрезка текста), и диалоговый метод, когда связь устанавливается на основеобмена репликами. Также в первом разделе описываются три основные мерыцентральности персонажа, основанные на положении в структуре сети: взвешеннаястепень, центральность по посредничеству и центральность собственного вектора.Центральность собственного вектора как наиболее сбалансированная метрика используетсяв диссертации в качестве основной меры центральности.Подготовленная в диссертации семантическая разметка позволяет применять оба основныхметода извлечения сетей персонажей из текста.
Во втором разделе главы сопоставлены двесети персонажей, построенные при помощи двух методов, и показаны различия методов.На первом этапе исследования сети строились для всего произведения целиком. Былипостроены две взвешенные сети персонажей: на основе диалогового метода (далее — Дсеть) и на основе метода соседства (далее — С-сеть). Узлами Д-сети стали все персонажи,которые хотя бы однажды являются адресатами или адресантами прямой речи.
Узлами Ссети — однозначно идентифицированные именованные персонажи, которые хотя бы развстретились в одном предложении с другим идентифицированным персонажем.В каждой сети на основе метрик центральности было выделено и исследовано ядро каждойсети. На рис. 5 представлены такие ядра — по 10 наиболее центральных персонажей сетипо метрике центральности собственного вектора, выделенные из Д-сети и С-сетисоответственно.15Рис. 5. Д-сеть (слева) и С-сеть (справа), 10 наиболее центральных персонажей по метрикецентральности собственного вектора; размер узла пропорционален центральностисобственного вектораД-сеть отличается от С-сети по составу центральных персонажей. Так, в ядре Д-сети нетвоенно-исторических персонажей — Кутузова, Александра I, Наполеона; вместо них тудапопали Денисов, Василий Курагин, графиня Ростова.
Схожие отличия наблюдаются и присравнении ядер сетей, полученных с использованием двух других метрик центральности.Для обобщения центральностей в сетях в работе используются обратные ранговыезначения. По каждой из трех метрик центральности был определен список из 10 наиболеецентральных персонажей.
Далее за 1 место в списке персонаж получал 10 баллов, за второеместо — 9 баллов, за 3 место — 8 баллов и т.д. Показатели по всем трем сетям былисуммированы. Таким образом для каждого персонажа получен его совокупный ранг вкаждой сети (рис. 6).Рис. 6. Обобщенные ранги персонажей в двух сетяхДалее в главе 3 исследовалась структура сообществ в обеих сетях.
С применениемалгоритма оптимизации модулярности [Blondel et al., 2008] обе сети были разделены насообщества (кластеры) персонажей. Результаты разделения одним и тем же алгоритмом содинаковыми настройками оказались различны для Д-сети и С-сети.В Д-сети крупнейшие сообщества сгруппировались вокруг одного из главных персонажей.В отдельное сообщество выделилось русское военное командование. Еще одно сообществообразовала группа французских военачальников с Наполеоном в центре.16В С-сети были выделены четыре крупных сообщества. Самое крупное объединилопрактически всю военную составляющую системы персонажей: русское военноекомандование (ставка и адъютанты), включая Андрея Болконского, Наполеона и егоокружение, «простых» военных персонажей (Тушина, Тимохина).
Исключение составилите военные персонажи, которые попали в зону притяжения семьи Ростовых: Денисов,Долохов. Николай Ростов также оказывается в С-сети частью ростовского кластера. Ещедва сообщества С-сети — семья и дворня Болконских (за исключением князя Андрея), атакже смешанный разнородный кластер вокруг Пьера.Далее в работе были проанализированы сети персонажей для отдельных частей «Войны имира».
Это позволило убрать большую часть хронологических наслоений и получить сети,в которых извлечение сообществ дало более интересный для анализа результат. Былипостроены Д-сети и С-сети для 15 основных частей книги и отдельно — для первой частиэпилога. Подробно проанализированы три наиболее показательные пары сетей: для первойчасти, в которой происходит экспозиция героев и фиксируется начальное состояниесистемы персонажей; для второй части третьего тома «Войны и мира», в конце которойпроисходит Бородинская битва (о Бородинском сражении как узловой точке «Войны имира» см.
[Великанова, 2003]); эпилога, в котором завершаются описываемые в книгесобытия. На примере этих наиболее показательных фрагментов продемонстрированыразличия двух методов построения сетей.Особенно ярко различия проявляются в сети для второй части третьего тома.17Рис 7.
Сеть персонажей второй части третьего тома «Войны и мира», полученная методомсоседства (С-сеть). Размер узла пропорционален центральности собственного вектора.Цветами обозначены результаты кластеризации графа18Рис. 8. Сеть персонажей второй части третьего тома «Войны и мира» на основедиалогового взаимодействия (Д-сеть). Размер узла пропорционален центральностисобственного вектора. Цветами обозначены результаты кластеризации графаВ С-сети выражено противостояние двух сил на Бородинском поле в кульминационнойточке произведения.
Здесь (рис. 7) Кутузов и Наполеон оказываются двумя центрами двухкрупнейших кластеров. В ядро С-сети по центральности входит и Александр I. В то жевремя в Д-сети (рис. 8) Кутузов и Наполеон — при схожей структуре выделяемых групп —остаются на вторых ролях. Здесь центральным оказывается Пьер, наблюдающий засражением.Видно также, что Д-сеть более детально отображает разные пространства «Войны и мира»— здесь А. П. Шерер и Василий Курагин образуют полностью изолированную группу(говоря на языке теории графов, отдельную компоненту) петербургского кружка. В С-сетите же светско-петербургские персонажи из-за частых упоминаний императора АлександраI оказываются частью большого военно-политического кластера.19Также в главе 3 было произведено сопоставление Д-сетей и С-сетей в динамике поструктурному параметру плотности сети.
Плотность сети определяется как отношениечисла связей в сети к максимально возможному их числу (т.е. все связаны со всеми).Динамика плотности двух сетей заметно отличается. В Д-сети чрезвычайно плотен посравнению с другими частями эпилог — так вновь проявляется смещение информации оперсонажах, которую моделирует данная сеть, в сторону семейно-бытового плана книги Л.Н. Толстого. С-сеть демонстрирует взаимосвязь между плотностью и сменой военных имирных событий.
Взаимосвязь была подтверждена при помощи корреляционного анализа,где плотность С-сети показала высокую (76,7%) корреляцию с тем, какие события —военные или мирные — описываются в соответствующей части.Таким образом, в главе 3 показаны различия между тем, какие свойства системыперсонажей многопланового литературного произведения могут отображать сети,построенные на основе двух разных методов. Д-сети, извлекаемые из диалогов, хорошоотражают прямые межличностные контакты, но упускают фоновые появления персонажей.В случае с таким многоплановым объектом, как «Война и мир», это может приводить кискажениям: диалоговые сети отображают в первую очередь семейно-бытовой план книги;военно-историческая часть сюжета лучше отражается в С-сети, построенной методомсоседства.
В то же время Д-сеть способна более точно отражать отдельные социальныегруппы в плотных частях сети персонажей.В заключении приводятся основные результаты диссертационного исследования:1. Произведен анализ работ по формализации понятия персонажа и компьютерномумоделированию системы персонажей одного или нескольких произведения. Анализработ выявил проблемный участок в современных цифровых исследованияхсистемы персонажей: сложность получения чистых структурированных данных оперсонажах произведения напрямую из текста. Современным решением проблемыстановится создание и публикация семантической разметки текста2. Осуществлена семантическая разметка книги Л. Н. Толстого «Война и мир». Втекстепроизведенияразмеченыупоминанияперсонажей(25,6тыс.идентифицированных упоминаний) и вхождения прямой речи персонажей (6,3 тыс.)с однозначным указанием адресата и адресанта реплики.
Разметка проводилась вавтоматизированном режиме, использованный подход показал высокую точностьопределения персонажа.3. Осуществленная разметка была использована для апробации метода моделированиясистемы персонажей и сравнения различных подходов к такому моделированию —как существующих, так и предложенного в настоящей работе метода анализа20нелексических признаков прямой речи.4.
Полученная разметка позволила применить к исследованию «Войны и мира»основные используемые сегодня методы компьютерного моделирования системыперсонажей: количественный анализ прямой речи и сетевой анализ. Результатытакого анализа, кратко изложенные выше, могут быть воспроизведены на основеопубликованной разметки.5. Полученная разметка позволила сравнить разные подходы внутри каждого метода,чего ранее не осуществлялось.