Диссертация (1137487), страница 7
Текст из файла (страница 7)
Я. Гинзбург. В рамках диссертации дополнительно важносоображение о том, что указанный механизм «особенно очевиден в больших романах, сбольшим количеством действующих лиц» [Гинзбург, 1979: c. 87].Вторая точка сопряжения работы Л. Я. Гинзбург и современных исследований сприменением цифровых методов — сосредоточение на прямой речи как одном из3В действительности это утверждение выглядит спорным, так как подразумеваемая устная речь все-такипередается в виде письменного текста, т.е.
средства изображения не вполне «тождественны» предметуизображения, как это утверждает Л. Я. Гинзбург. Впрочем, об условности изображения «устной» речи вхудожественном тексте в [Гинзбург, 1979] сказано исчерпывающе. Заметим также что схожую мысль онаибольшем правдоподобии речи как характеристики персонажа можно обнаружить и в других работах,посвященных анализу персонажей, например, у английского филолога Нормана Пэйджа: «В созданиииллюзии в художественном произведении репрезентация речи имеет особую роль, так как именно в этомэлементе наиболее вероятна самая близкая имитация реальности, хотя бы потому, что присутствие автора<…> здесь выражено наименее явно» [Page, 1988: c.3].23важнейших проявлений персонажа. Как мы покажем ниже, компьютерные работы,рассматривающие систему персонажей произведения или автора как систему голосов,составляют одно из направлений в современном цифровом литературоведении.Представляется, что именно через филологические труды, подобные работе Л.
Я. Гинзбург,сочетающие рассмотрение сложных вопросов поэтики с постоянным и последовательнымобращением к текстовому материалу, будет возможно провести недостающую сегоднясвязь между традиционным академическим литературоведением — и новыми цифровымиподходами в филологических исследованиях.1.2 Компьютерное моделирование системы персонажейСовременныеисследованияхудожественныхперсонажейсиспользованиемкомпьютерного моделирования отчасти соотносятся с описанными выше теоретическиминаработками.
Так, в компьютерных исследованиях сегодня отчетливо выделяются дваподхода:1. моделирование и анализ персонажей на основе лингвистических параметров ихпрямой речи;2. сетевойанализ,т.е.представлениеперсонажейввидеграфавзаимодействий/взаимоотношений.Связь первого (речевого) направления компьютерных исследований с докомпьютернымифилологическими трудами по осмыслению персонажа прозрачна: выше было показано, какименно через анализ прямой речи филологи подходили к раскрытию художественногообраза и модели личности, разработанной в нем автором.
Неслучайно поэтому, чтоисследования прямой речи (включая несобственно-прямую речь) нередко отсылают кидеям М. М. Бахтина [Brook et al., 2017], [McKenna, Antonia, 2001], а также применяютарсенал современной психологической науки [Liu et al., 2018]. Последнее роднит их именнос психологическими и литературно-антропологическими подходами в филологическоманализе персонажа.Сетевые исследования персонажей, в свою очередь, связаны со структурным анализом вфилологии — в работах, где персонажи моделируются в виде графа, регулярно упоминаетсяВ. Я.
Пропп [Trilcke, 2015], [Ardanuy, Sporleder, 2014], [Rochat, 2014], [Chaturvedi et al.,2015], иногда также Ю. М. Лотман [Trilcke et. al, 2016], [Blessing et al., 2017] и Р. Барт. Какуже отмечалось во введении к диссертации, появление цифровых технологийактуализировало многие идеи «формалистского» (в широком смысле) направленияфилологической мысли. Подходы формалистов и структуралистов к пониманиюхудожественного персонажа многократно и справедливо критиковались за упрощение,редукцию сложной идеи персонажа до функции в тексте.
Однако поскольку компьютерныйанализ требует именно упрощения, дискретности и — в случае с литературными объектами24— привязки к конкретным элементам текста4, современные цифровые филологическиеисследования часто ищут вдохновения в формализме и структурализме. В сетевом анализехудожественного текста заново актуализируются многие идеи структуралистскоголитературоведения и семиотики: во-первых, персонаж при анализе текста превращаетсяименно в последовательность упоминаний — далее на основе соотношения этихупоминаний строятся сети; во-вторых, персонаж рассматривается в лотмановском духе какчлен групп и участник взаимодействий.Переходя к рассмотрению двух направлений компьютерного моделирования персонажей,отметим, что их объединяет общая проблема извлечения текстового материала дляавтоматического анализа. Эта проблема, в свою очередь, содержит два уровня вопросов –концептуальные и технические, которые должны быть разрешены в комплексе.
Наконцептуальном уровне необходимо понять, какие именно текстовые фрагменты относятсяк речи персонажей или же к их взаимодействию. Технический уровень проблемы связан споиском решения для выделения релевантных текстовых элементов.Как будет показано ниже, осознание важности получения и публикации осмысленныхчистых данных, доступных для воспроизведения эксперимента, приходит не сразу. Лишь впоследние годы в работах по автоматическому анализу художественных произведенийпостепенно вырабатываются стандарты представления, описания и оценки данных, а такжевведения в научный оборот вместе с исследованием открытых наборов данных,снабженныхстандартнойразметкойидоступныхдляиспользованиядругимиисследователями.
Однако пока такая разметка и наборы создается преимущественно длядраматических текстов, поскольку они изначально более удобны для автоматическоговыделения элементов (наименований персонажей, их речи и т.п.). Для прозы же разметкапрактически не создается и не публикуется.1.2.1 Компьютерное моделирование персонажей на основе речевых характеристикРаботы, специально посвященные анализу речи персонажей художественного текстацифровыми методами, известны с конца 1980-х годов. В частности, один из основателейсовременной компьютерной стилистики (стилеметрии) Джон Барроуз в 1987 годуприменил вновь созданный метод количественного сравнения стиля именно к репликамперсонажей — для анализа романов Джейн Остин [Burrows, 1987].
Он показал, что уперсонажей Остин значимо отличается распределение служебных частей речи (предлогов,междометий, союзов, артиклей, местоимений — в исследовании использовались 30наиболее частотных слов). «Предпосылка, согласно которой наиболее частотные словаязыка являются абсолютно нейтральными, склоняет к тому, чтобы ожидать равной4Ср. соображение Уилларда Маккарти о том, что одно из двух обязательных условий модели длялитературного объекта — «тесная связь с текстом» [McCarty, 2008].25пропорции их употреблений у всех персонажей. Предполагается, что персонаж,произносящий пятую часть всех реплик, употребит и пятую часть всех “инертных” словвроде “of” или “the”. Но когда мы действительно анализируем доли этих слов у отдельныхперсонажей, возникает разрыв между ожиданием и фактами» [Burrows, 1987, с. 3, переводнаш].
Фактически результат, полученный Барроузом, означает, что если удалить из романаДжейн Остин весь текст, кроме служебных слов в диалогах, то даже в таком виде в немостанутся фиксируемые следы идиолектов отдельных персонажей, их «стилистическиеотпечатки».Подсчитывая частотности служебных слов в речи отдельных персонажей и обнаруживаястатистически значимые различия, исследователь постоянно переходил к литературныминтерпретациям статистики (что и предполагает заглавие его работы — «Computation intoСriticism»).
В частности, Барроуз показал, как характеры персонажей могут быть раскрытычерез нормированную частотность употребления местоимений множественного числапервого лица (we, us, our). Наиболее часто они встречаются в речи адмирала Крофта (роман«Доводы рассудка»), персонажа шумного, добродушного и общительного, а наиболее редко— у леди Кэтрин де Бёр (роман «Гордость и предубеждение»), высокомерной и всехпоучающей дамы знатного происхождения.
Эти два персонажа в интерпретации Барроузапредставляют собой крайности, в пространстве между которыми расположены прочиегерои Джейн Остин.В своей работе Барроуз агрегировал статистику по всем служебным словам и анализировалполученные данные стандартными средствами многофакторного статистического анализа,такими как метод главных компонент. В работе демонстрировалось, как подобные методыпозволяют сопоставить или противопоставить персонажей, а также автоматическисгруппировать их по речевому идиостилю, причем получившиеся группы соответствуютсоциально-классовым и семейным общностям в романах Остин. В романе «Гордость ипредубеждение» отчетливо разделились стили семьи Беннет и стиль мистера Дарси и егоаристократического круга. «Самое главное свойство — общая дифференциация междуженскими персонажами из семьи Беннет с одной стороны и кругом мистера Дарси — сдругой» [Burrows, 1987, с.
85, перевод наш]. Выявленный Барроузом потенциал частотныхраспределений служебных слов как дифференцирующего признака стиля в дальнейшемоказал огромное влияние на методы определения авторства и привел к созданиюэффективного метода атрибуции Delta. В нашей диссертации он используется длясопоставления речевых стилей персонажей Л. Н. Толстого (см. главу 2).К недостаткам книги Барроуза следует в первую очередь отнести недостаточное описаниепроцедур предобработки текста. Во введении только кратко отмечено, что материалом дляработы послужил «набор конкордансов». Далее также описана процедура присвоения26наименованиям отдельных персонажей уникальных идентификаторов вида $A$, $B$ и т.п.Разметка собственно прямой речи — непосредственного объекта исследования книгиБарроуза — не описана.Речь персонажей Джейн Остин исследовала и более поздняя работа [DeForest, Johnson,2001].