Диссертация (1137487), страница 21
Текст из файла (страница 21)
В С-сети происходит контаминация групп, вчастности, избыточное «склеивание» персонажей вокруг Пьера из-за большого числа сцени событий с его участием.В структуре обеих сетей обнаруживается особенность положения военно-историческихперсонажей. Как в Д-сети, так и в С-сети для Кутузова, Наполеона, Александра I характернабольшая (относительно других метрик центральности) центральность по посредничеству.Центральность по посредничеству позволяет выявить наиболее важные связующие узлысети.
Так, у некоторого узла может быть небольшое количество собственных связей (и какследствие, небольшая степень), однако он может занимать важное положение в структуресети, например, соединяя большие группы узлов друг с другом, выступая своеобразнымпосредником. Можно предположить, при помощи сетевого анализа удалось обнаружитьособую структуру военно-исторической части системы персонажей. В отличие от плотно иперекрестно связанных друг с другом групп «семейных персонажей» (Ростовых,Болконских), военные герои встроены в более жесткую и централизованную команднуюиерархию. Такая иерархия предполагает, что командующие узлы должны быть связаны снижестоящими для передачи приказов, но не предполагает их связи с более низкимиузлами, чем непосредственные подчиненные (см.
для примера организационно-штатнуюструктуру любого воинского соединения). При такой структуре сети командующие узлы небудут иметь больших показателей центральности степени, но за счет того, что они являютсяключевыми звеньями в цепочке распространения и передачи информации, от них можноожидать именно высокой центральности по посредничеству. В сети персонажей «Войны имира» такими узлами, сочетающими невысокую степень центральности и высокуюцентральность по посредничеству, оказываются именно военно-исторические герои:Кутузов, Наполеон, Александр.98Рис.
44. Военный кластер в С-сети; размер узла и подписи пропорциональныцентральности по посредничеству99Рис. 45. Самый крупный военный кластер в Д-сети; размер узла и подписипропорциональны центральности по посредничествуД-cети для отдельных частей «Войны и мира» также отражают высокую промежуточностьадъютантов. Так, в Д-сети второй части первого тома (рис. 46) три персонажа с наивысшейцентральностью по посредничеству — князь Андрей (который в этой части в качествеадъютанта Кутузова был на приеме у австрийского военного министра и императора,сопровождал в Шенграбенском сражении отряд Багратиона, затем присоединился к батарееТушина при ее отступлении), Несвицкий, Жерков.100Рис. 46. Сеть персонажей второй части первого тома «Войны и мира» на основедиалогового взаимодействия (Д-сеть).
Размер узла пропорционален центральности попосредничествуТаким образом, метрика центральности по посредничеству позволяет обнаружитьструктурные особенности военной составляющей сети персонажей, особенно при анализекоммуникационного взаимодействия (т.е. Д-сетей).Итак, в главе 3 созданная в диссертации семантическая разметка была применена дляпостроения сетей персонажей и последующего сетевого анализа. На основе разметкипостроены два типа сетей: опирающиеся на обмен репликами в диалоге (Д-сети) и с опоройна соседство упоминаний в рамках предложения (С-сети). Сети, построенные сприменением двух разных методов и опирающиеся на строго формализованную разметкутекста (в одном случае — автоматизированную, в другом — полуавтоматическую),отображают схожие структуры взаимодействия персонажей.101Так, при применении методов кластеризации в структуре обеих сетей выделиласьотдельная группа военно-исторических персонажей.
Составы этой группы в двух сетяхнесколько различны, однако центральными узлами в обоих случаях стали Кутузов иАлександр I. В С-сети, которая дала менее дробное деление на группы, в ту же военнуюгруппу попали Наполеон и Андрей Болконский. В Д-сети Наполеон и его окружениеформируют обособленный кластер, князь Андрей группируется с другими Болконскими ибольшим числом второстепенных персонажей (кружок Сперанского, штабные офицеры,отдельные солдаты и т.п.), с которыми он сталкивается на протяжении сюжета.Важное различие сетей состоит в разном распределении центральностей. Главные«неисторические» герои — Пьер, Наташа, князь Андрей, Николай, Марья — вошли всписок наиболее центральных персонажей в сетях обоих типов.
Однако в С-сетях наравнес ними центральные позиции заняли Кутузов, Александр I, Наполеон. В Д-сетях этиперсонажи не стали центральными даже в частях, описывающих ключевые военныесобытия произведения. Так, в третьей части второго тома, где описывается приближениеБородинской битвы и само сражение, центральным персонажем в Д-сети оказался Пьер13 (вС-сети — Кутузов).Различия в структуре двух типов сетей также были исследованы динамически. При помощиметода временных рядов были сопоставлены плотности Д-сетей и С-сетей для всех частей«Войны и мира». Отдельные части охватывают меньшие временные отрезки, и структурасетей меньше искажается наслоениями разных временных пластов: 1805, 1812, 1820 годыне смешиваются в одной сети. Результаты анализа позволяют выдвинуть гипотезу о том,что плотность С-сети способна в некоторой степени отражать композиционныеособенности, тогда как Д-сеть в очередной раз демонстрирует искажение из-заневозможности адекватно отобразить военно-исторический план произведения.
В пользуэтой гипотезы говорят и результаты корреляционного анализа. В С-сети плотность сильнеекоррелирует с типом описываемых событий («военные» или «мирные»).ЗаключениеВ диссертации представлен метод анализа системы персонажей художественногопроизведения с опорой на семантическую разметку текста. Ниже обобщены основныерезультаты проведенного исследования.13Заметим, что Пьер является важным носителем точки зрения в этой части романа. Это и некоторые другиенаблюдения над сетями в «Войне и мире» позволяют предположить, что Д-сети могут быть использованы дляанализа переходов точки зрения в романе от героя к герою. Однако полноценное исследование связи междуцентральностями в сетях и точкой зрения выходит за рамки диссертации.1021.
Исследованытеоретическиеаспектымоделированиясистемыперсонажейхудожественного произведения, произведен анализ существующих работ. Анализработ выявил проблемный участок в современных цифровых исследованияхсистемы персонажей. Проблема связана со сложностью получения чистыхструктурированных данных о персонажах произведения напрямую из текста. Вряде работ эта сложность обсуждается явно, в других на нее указывают особенностивыбора материала. Прямым следствием этой проблемы является немотивированныйдисбаланс в исследованиях: непропорционально большое внимание уделяетсядраматическим текстам, поскольку в них выделение релевантных фрагментов текста(упоминаний персонажей, их реплик и др.) легче поддается автоматизации и требуетменьшего количества ручного труда.
В части филологически-ориентированныхисследованиях последних лет на предварительном этапе моделирования системыперсонажейсоздаетсясемантическаяразметкатекстасопоройнамеждународный стандарт кодирования текстов TEI. Публикация такой разметкипозволяет воспроизводить исследования, уточнять и верифицировать данныесовместными усилиями научного сообщества, обогащать и дополнять разметку дляновых задач.
Однако разметка также производится преимущественно для драмы.2. Осуществлена автоматическая разметка упоминаний персонажей в тексте «Войны имира». Выделенные вхождения связаны при помощи уникального идентификаторав единые кореферентные цепочки, соответствующие одному конкретномуперсонажу.
По итогам разметки однозначно идентифицированы 25,6 тыс.вхождений (слов или именных групп) в тексте, содержащих отсылку к одному изперсонажей «Войны и мира».3. Осуществлена полуавтоматическая разметка прямой речи персонажей в текстекниги «Война и мир». Извлечены свыше 6,3 тыс. реплик с указанием адресанта иадресата реплики. Адресат и адресант реплики на этапе постобработки разметкиверифицированы вручную.4. Полученная разметка позволила применить к исследованию книги «Война и мир»два метода компьютерного моделирования системы персонажей: количественныйанализ прямой речи и сетевой анализ.
Результаты такого анализа проверяемы ивоспроизводимы. Кроме того, разметка позволила сравнить разные подходы внутрикаждого метода, чего ранее не осуществлялось.5. На основе подготовленной разметки произведено количественное исследованиепрямой речи персонажей с использованием двух методов: стилеметрическогометода и метода оценки нелексических признаков.