Диссертация (1137487), страница 9
Текст из файла (страница 9)
Однако поскольку опубликованы лишь итоговые графы, а не текстовая разметка,невозможно понять исходные принципы построения сетей и воспроизвести анализ.Ценность таких данных для научного исследования оказывается невысокой.Первой работой, где сетевой анализ был целенаправленно использован для исследованияхудожественного текста, можно считать [Schweize, Schnegg, 1998]. Однако исследованиепроизведено с антропологических, а не литературоведческих позиций.
Авторыантропологи заимствовали метод сетевого анализа сообществ, на тот момент уже давноиспользуемый в антропологии (см. [Scott, 2000]), и применили его к художественномутексту — роману Инго Шульце «Простые истории». В контексте этой диссертациипримечательна мотивировка выбора романа «Простые истории» в качестве объектаисследования. Авторы объясняют свой выбор сложностью системы персонажей романа,чьи имена и взаимоотношения читателю приходится запоминать или даже выписывать,«как в случае с романами “великих русских”» («den Romanen der "großen Russen"»)[Schweize, Schnegg, 1998].Роман «Простые истории» посвящен жизни небольшого городка на территории бывшейГДР после объединения Германии.
Как отметили авторы исследования, Инго Шульцеописал «сложную социальную систему», а анализ (в том числе и сетевой) таких системявляется типичной задачей антропологии. Сеть персонажей в работе построенасубъективно вручную, основанием для проведения связи было наличие каких-либо«отношений» между двумя персонажами. При этом изначально учитывались какнейтральные и позитивные (совместная работа, дружба, романтическая связь), так инегативные (вражда, антипатия) отношения.
Затем авторы вычленяли и по отдельностианализировали графы позитивных и негативных связей, а также сеть экономическихвзаимоотношений. В исследовании показано, как позитивные отношения объединяют6Материалы книги позже вошли в том 4А фундаментального труда Д. Кнута «Искусство программирования»31группу персонажей, относящуюся к бывшей коммунистической номенклатуре ГДР;негативные связи, напротив, проходят между различными группами.
Авторы исследованияподчеркнули,чтонесчитаютсетевойанализзаменойтрадиционномулитературоведческому изучению текстов, но видят в нём потенциал вспомогательногосопутствующего инструмента, который позволяет выявить новые неявные свойствахудожественного произведения и раскрыть «сложную социальную структуру в егоосновании». К сожалению, подготовленная авторами сеть персонажей не опубликованадаже в виде машиночитаемого графа, а текстовой разметки, по-видимому, непроизводилось в принципе.В работе [Alberich et al., 2002] осуществлен анализ сетей взаимодействия героев ввымышленной вселенной комиксов Marvel.
Здесь граф был получен уже не из одной книги,а из всей коллекции комиксов Marvel (12942 выпуска на тот момент). Авторы исследованияпроанализировали структурные свойства полученного графа, такие как диаметр, среднийкоэффициент кластеризации, средняя степень узла, средняя длина пути от одного узла кдругому. По этим параметрам сеть персонажей Marvel была сопоставлена сначала среальными сетями взаимодействия (соавторов научных статей, а также голливудскихактеров), а затем со случайным графом.
Авторы показали, что граф вымышленныхперсонажей по своим свойствам очень близок к социальным сетям реального мира и непохож на случайные графы. Важно, что подтверждением для такого вывода послужили непросто наблюдения сети или её произвольные интерпретации, а конкретные численныепоказатели. Однако связи между персонажами в работе строились грубо, на основесовместного упоминания в одном выпуске комиксов.Работа [Gleiser, 2007] стала дальнейшим развитием исследования [Alberich et al., 2002].Здесь в сеть персонажей Marvel добавлены веса связей в зависимости от числа совместныхупоминаний героев (в настоящей диссертации также используются взвешенные графы).Авторы показали, что распределение весов подчиняется степенному закону, то есть в сетиесть небольшое количество сильных связей и множество слабых.
На основе этих данныхавторы сделали предположение о том, что авторы комиксов последовательно делали новыхсупергероев помощниками старых, чтобы первые быстрее набирали популярность. Врезультате внутри сети Marvel сформировалась элитная группа персонажей (авторы статьиназывают её «rich club», то есть «клуб богатых»), с большим количеством связей, ицентрами в ней являются наиболее известные супергерои. В отличие от положительныхперсонажей, злодеи практически не сотрудничают между собой и в сети оказываютсяпериферийными узлами с не слишком высокой центральностью.
Разметка в работе непроизводилась, итоговый граф опубликован.32В [Stiller et al., 2003] группа антропологов произвела сетевой анализ пьес УильямаШекспира, исходя из предположения о том, что драма должна стремиться к воссозданиюсоциальных структур, похожих на существующие в реальности. Авторы применилиинструментарий антропологических исследований и показали, что сети пьес Шекспирадействительно по некоторым параметрам схожи с социальными сетями реального мира.Сеть строилась вручную на основе совместных появлений героев на сцене, компьютернаяразметка не производилась и не публиковалась.В дальнейшем предпосылка о сходстве социальных сетей в художественном мире с сетямивзаимодействия реальных людей стала стандартной.
На нее же опирается работа [Elson etal., 2010], посвященная викторианскому роману. Эту работу можно считать переходнымобразцом, т.к. она, оставаясь по своей структуре инженерной, использовала сетевой анализдля проверки литературоведческой гипотезы о различной социальной структуре в«деревенских» и «городских» романах. Авторы исследования отталкивались от концепциихронотопа М. М. Бахтина и её дальнейшего развития западными литературоведами.Проверке подвергалось предположение, согласно которому количество персонажей истепень их взаимодействия между собой меняются по мере «урбанизации» литературы. Вчастности, от «городских» сетей ожидалась меньшая плотность и большее числосообществ.
Объектом исследования стали 60 романов викторианской эпохи, сети в нихизвлечены полуавтоматически на основании обмена репликами в диалогах. Дляполученных сетей были подсчитаны параметры (число узлов, средняя степень узла,плотность), а затем были измерены средние показатели этих параметров для «городских» идля «сельских» романов, а также корреляция параметров с местом действия. В результатеавторы не выявили статистически значимых различий между «городскими» и «сельскими»романами. Вместо этого им удалось показать устойчивые различия между романами,написанными от первого лица и от третьего, продемонстрировав таким образом влияниеточки зрения на структуру сети.
Недостатком работы является низкое качествоавтоматически извлеченных сетей: авторы в ходе эксперимента оценили точностьопределения говорящего в диалоге в 67%. При этом отсутствие текстовой разметкиделает невозможным ручную доводку сетей до более приемлемого уровня точности.В 2011 году была опубликована работа Франко Моретти «Network Theory, Plot Analysis»[Moretti, 2011]. Не будучи в строгом смысле опытом компьютерного моделированиясистемы персонажей (Франко Моретти рисовал свои сети от руки), эта статья тем не менеестала поворотной точкой в сетевом анализе художественных текстов. Применение сетевогоанализа в [Moretti, 2011] впервые теоретически обосновано с литературоведческихпозиций.
На примере анализа «Гамлета» Моретти показал, как представление пьесы в видесети взаимодействия персонажей позволяет сделать наблюдения, недоступные или33неочевидные при обычном прочтении шекспировского текста. Сетевой анализ сравнивалсяв работе с рентгеном, позволяющим увидеть «внутреннюю структуру сложного объекта»[Moretti, 2011, перевод наш]. Одним из главных преимуществ метода Моретти называетвозможность расположить «четыре часа действия» перед глазами целиком, спрессоватьвремя в пространство на плоскости.Вслед за публикацией Ф. Моретти появился ряд исследований, где сетевой анализцеленаправленно применен для решения литературоведческих задач.
В [Rydberg-Cox, 2011]сетевой анализ представлен как промежуточное явление между «дальним чтением» (терминМоретти), то есть компьютерно-статистическими исследованиями литературы, и болеетрадиционными филологическими подходами. В виде графов здесь представленынесколько античных трагедий, связи между персонажами установлены на основе обменарепликами в одном явлении (как и во всех известных нам работах по сетевому анализудрамы). На основе различий в структуре полученных сетей авторы предложиликлассификацию трагедий, разделив пьесы на типы в зависимости от того, выделяется ли всети центральный герой, разделяется ли сеть на несвязные компоненты и т.п.
В контекстеданной диссертации ценно, что в [Rydberg-Cox, 2011] произведен статистический анализречи персонажей, в частности, получена частотность показателей времени, лица и числа упроизносимых героями глаголов. Работа сделана с опорой на структурированную разметкутекста в формате XML, которая опубликована в открытом доступе.В [Agarwal et al., 2012] осуществлен сетевой анализ «Алисы в стране чудес» Л. Кэрролла.Авторы показали, как центральность и другие параметры узла в сети коррелируют с ролямиперсонажей; связи между персонажами определены на основе т.н.
«социальных событий»(«social events»), размеченных в тексте вручную. Такими событиями считаютсяэксплицитно выраженные в тексте взаимодействия между героями (например, said [theMouse] to [Alice] severely.) или факты перцепции одного персонажа другим (Then [Alice]saw the [White Rabbit] run by her).
Далее в [Agarwal et al., 2013] те же авторы предложилиуже автоматический метод извлечения взаимодействий между персонажами в рамкаходного предложения. В качестве мотивации для разработки такого метода указано, чтомногие источники сетевых данных «остаются неисследованными, поскольку нет связаннойс ними метаинформации (это литературные тексты, новости, исторические тексты)». Такимобразом, в статье прямо указана нехватка источника структурированных данных,связанных с текстом и позволяющих строить сети.В [Lee, Yeung, 2012] сети персонажей применяются для анализа Ветхого Завета.