Диссертация (1137487), страница 2
Текст из файла (страница 2)
Например, Н. Г. Чернышевский производилподсчеты распределения различных размеров в лирике Пушкина, количественноподтверждая доминирование ямба, и сопоставлял эти данные с подсчетами распределенияударений в русском прозаическом тексте [Чернышевский, 1974 (впервые — 1855)]. Такимобразом критик надеялся доказать, что для русского языка более органичны не ямб илихорей, а трехсложные размеры. Несколько позже Л. И. Поливанов анализировал ритмикурусского александрийского стиха [Поливанов, 1892, цит. по Шапир, 2005].
Опубликованноев 1900 году фундаментальное исследование Н. И. Новосадского, посвященное орфическимгимнам, содержало раздел «Особенности метра орфических гимнов» [Новосадский, 1900:c. 114-171]. В этом разделе был представлен большой объем статистики по формамгекзаметра орфических гимнов — Новосадский показывал, что статистические показателигимнов сближаются с таковыми у Гомера и Гесиода. Во введении к работе Новосадскийотметил, что «изучение метров и языка гимнов должно поставить в такие условия, чтобывыводы не зависели от личных впечатлений, а это возможно только при статистическомметоде исследования» [Новосадский, 1900: c. III].
Также Новосадский применял длясравнения гимнов с текстами Гомера статистику по отдельным частям речи. Уже в началеXX века знакомый с трудами Н. И. Новосадского выпускник гимназии Л. И. ПоливановаАндрей Белый, поэт и теоретик символизма, опубликовал исследование [Белый, 1910] сприменением количественного анализа четырехстопного ямба.
Несколько лет спустя началпубликоватьстатистическиеисследованиярусскогостихаиБ. В. Томашевский,соединявший в себе литературоведа, дипломированного инженера и профессиональногостатистика [Томашевский, 1917; Томашевский, 1919]. Н. А. Морозов производил опыты поатрибуции авторства русских прозаических текстов [Морозов, 1915], опираясь наупомянутуювышеработу[Lutoslawski, 1898].М.
О. Лопаттопроизвеллингвостатистический анализ прозы Пушкина [Лопатто, 1918]. Эти исследования совпалипо времени со становлением формалистского движения в филологии.Ключевые теоретики формализма — В. Б. Шкловский, Б. М. Эйхенбаум, Ю. Н. Тынянов —сами не вели исследований с применением точных методов. Однако выдвинутая имиустановка на «научность», «пропаганда объективно-научного отношения к фактам»,«пафос научного позитивизма» [Эйхенбаум, 1987: с. 379], требование выдерживать5«научную критику» [Шкловский, 1929 (1917)] значительно повлияли на литературоведениев целом [Дмитриев, Левченко, 2001], прямо или косвенно вдохновили и продолжаютвдохновлять исследователей.
Кроме того, фокусирование на анализе специфики формыхудожественного произведения и функциях отдельных ее элементов так же располагало кпопыткам изучения структуры текста с применением формальных методов.Одновременно с формалистами развивал свои идеи «морфологического» (фактически —структурного) анализа фольклорных текстов В. Я. Пропп.
Его «Морфология сказки»[Пропп, 1928] по сей день оказывает огромное влияние на всевозможные формальныеисследования сюжета. Предложенные им сюжетные функции используются в современныхколичественных исследованиях — см. например [Fisseni et al., 2014].Наконец, целый ряд исследований художественных текстов с применением методовматематической статистики осуществил в 1920-е – 1930-е годы Б.
И. Ярхо. Результатомстала подробная «Методология точного литературоведения», описанием которойБ. И. Ярхо занимался в последние годы своей жизни. Эта работа, изданная лишь в 2006 году[Ярхо, 2006], сегодня представляет интерес не только как памятник труда исследователяодиночки, обогнавшего свое время, но и как источник идей, методов и готовыхисследовательскихсценариевдляколичественногоанализаразличныхаспектовхудожественного творчества [Шапир, 2005]. Таким образом, в филологии задолго до началакомпьютерной эпохи сформировалась теоретическая основа для применения точныхметодов и количественного анализа.Сегодня, в свете развития цифровых подходов в гуманитарных науках, работы филологовпрошлого, применявших точные методы (как Б.
И. Ярхо) или создавших удачныемасштабируемые формальные модели (как В. Я. Пропп), вызывают новую волну интересав научном мире. Ссылки на исследования Б. И. Ярхо и В. Я. Проппа появляются в статьяхи докладах, посвященных количественным исследованиям литературы (см. для примера[Bernhard et al., 2018, с. 217], [Puckett 2016: с. 188], [Forstall et al., 2016]). В 2015 году вСтэнфордском университете состоялась конференция «Russian Formalism & the DigitalHumanities», посвященная разноуровневым перекличкам между «русским формализмом»(понимаемым на Западе более широко, чем в отечественной науке: В. Я. Проппа иБ. И.
Ярхо в западных работах обычно ассоциируют с формализмом [Волкова, 2011], что,строго говоря, не является верным), — и цифровыми гуманитарными исследованиями.Участвовавший в конференции филолог И. А. Пильщиков отметил, что «с развитиеминформационно-коммуникационных технологий и цифровых гуманитарных исследований,некоторыепроектыстатистическихисследований,которыеказалисьслишкоммасштабными и трудоемкими 80 лет назад (такие как программа Бориса Ярхо посинхронному и диахроническому исследованию всех уровней художественных текстов)6сегодня находятся в пределах наших возможностей» [Russian Formalism & the DigitalHumanities, 2015, перевод наш].
Схожую мысль — что количественные филологическиеисследования в духе Б. И. Ярхо сегодня более осуществимы благодаря информационнымтехнологиями — высказывает О. Собчук в статье «Номотетическое литературоведение:пунктирный набросок» (под «номотетическим» в работе понимается подход, направленныйна выявление общих закономерностей и противостоящий в этом чисто описательному,герменевтическому подходу). Автор приводит цитату из Б. И. Ярхо о том, что задачасоставления «сравнительного словаря образно (то есть чувственно и эмоционально)значимых слов в комедиях и трагедиях Корнеля» может «убить годы квалифицированноговремени».
Цитата сопровождается следующим комментарием: «Конечно, даже теперькомпьютер не решит некоторых задач такого рода (например, ему трудно объяснить, чтотакое «образно значимые слова»), однако о сроках в месяцы или годы речи больше не идет»[Собчук, 2016]. Там же несколькими строками ранее описывается потенциал цифровыхметодов в филологии для анализа больших текстовых корпусов: «Типичная для филологовпрактика “медленного чтения” (close reading) в номотетических исследованиях сменяется“чтением” с большого расстояния.
С помощью хорошо сконструированной компьютернойпрограммы можно “прочесть” десятки или сотни романов» [Собчук, 2016]. Далеевысказываетсянадежданаплодотворноесоединениеновыхколичественныхиэкспериментальных методов с традиционными филологическими исследовательскимиподходами: «Количественные и экспериментальные методы исследования литературы икультуры, скорее всего, станут важной составляющей гуманитарных наук в XXI веке. Врядли они вытеснят традиционные исследовательские методы, однако можно быть уверенным,что они заставят последние потесниться.
И, вполне возможно, следствием соседства двухчтений — дальнего и медленного — окажется не схватка насмерть, а плодотворныйсимбиоз» [Собчук, 2016]. Таким образом, представители филологического сообществасегодня вновь стремятся внедрять точные методы в исследования, причем надеждысвязываются с развитием цифровых технологий и автоматических методов анализа текстов.Однако применение автоматических методов и проведение количественных исследованийосложняется вторым обстоятельством — а именно высокой содержательной сложностью имногоплановостью моделируемых объектов. Инструменты компьютерной лингвистикипозволяют разметить и исследовать языковые свойства текста — морфологическиехарактеристики слов, синтаксическую структуру предложения, семантические классы слов;но многие действительно значимые элементы поэтики текста остаются за пределамивозможностей этих инструментов.
Например, нет программного средства, котороепозволило бы разметить в тексте сюжетные мотивы — причем не только потому, чтовыражение мотива в тексте может иметь самую разную форму и этому трудно научить7машину; но еще и потому, что сама разработка структуры для такой разметки (т.е.буквальных правил выбора элементов текста, которые должны или не должны бытьразмечены) — сложная филологическая проблема с множеством потенциальных решений,ни одно из которых не будет бесспорным.
Между тем структурирование данных дляцифрового количественного анализа предполагает однозначную, дискретнуюразметку: необходимо недвусмысленно «указать» машине, где в тексте выражен мотив, агде нет. Строгость и однозначность инструкций должна быть достаточной для того, чтобывоспроизвести разметку на других текстах другими исследователями. В результате вколичественных исследованиях литературы активнее и успешнее всего развиваютсянаправления компьютерной стилистики (стилеметрии) [Burrows, 2002], [Burrows, 2007],[Rybicki, 2006], [Мухин, 2010], [Мухин, 2011], [Eder, 2015], [Franzini et.
al, 2018] итематического моделирования [Jockers, 2015], [Schöch, 2018], для реализации которыхразметка не нужна — достаточно использовать самые простые способы автоматическойобработки текста, такие как подсчет частотностей словоформ или даже сочетанийбуквенных символов.Вместе с тем в последние годы растет число работ, в которых предпринимаются попыткиподойти со стороны количественного лингвистического анализа к изучению более сложныхсоставляющих художественного текста, чем распределение частотностей слов. Вчастности, появляются количественные исследования, целью которых является анализсистемы персонажей художественного произведения (или целой коллекции произведений).Например, в [Hoover, 2017], [Culpeper, 2014] количественными методами исследуютсяречевые портреты персонажей (более подробный анализ работ в этом направлении см.
вразделе 1.2.1 главы 1 ниже). Однако исследования такого рода малочисленны, что связанос их высокой трудоемкостью уже на этапе подготовки текста. Для количественного анализапрямой речи персонажей ее необходимо выделить в тексте и связать с однозначноидентифицированным персонажем, что является самостоятельной сложной задачей.Другое направление количественных исследований, связанное с выделением свойствперсонажей в тексте, — сетевой анализ. В числе работ последних лет можно упомянуть[Grayson et al., 2016], [Algee-Hewitt, 2017], [Fischer et al., 2018] (более подробный анализисследований в этом направлении см.