Главная » Просмотр файлов » Диссертация

Диссертация (1137487), страница 15

Файл №1137487 Диссертация (Семантическая разметка художественных текстов для количественных исследований в филологии (на примере романа Война и мир Л.Н. Толстого)) 15 страницаДиссертация (1137487) страница 152019-05-20СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 15)

Применив кластеризацию ко всему корпусу, в которомкаждый персонаж представлен двумя документами (обучающий и тестовый наборы реплик;тексты не пересекаются), мы получили разделение на группы представленное на рис. 10.57Рис. 10. Иерархическая кластеризация речи 14 персонажей «Войны и мира» на основеметрики Delta с использованием 130 наиболее частотных слов; вся речь каждогоперсонажа разделена на два документа: обучающий и тестовыйТаким образом мы не только выявили оптимальный параметр для стилеметрическогоисследования нашего материала. Высокое качество определения авторства репликпоказало, что метод Delta, по-видимому, способен фиксировать некоторые характерныеособенности речи персонажа и может достаточно уверенно определять принадлежностьнабора реплик тому или иному персонажу. Далее метод был применен непосредственно дляпостроения системы персонажей «Войны и мира».2.1.2 Моделирование системы персонажей «Войны и мира» при помощи стилеметрииНа рис.

11–13 представлено пространство персонажей «Войны и мира», построенное наоснове Delta с использованием 130 наиболее частотных слов в корпусе речи персонажей(список слов и их относительных частотностей в речи каждого персонажа представлен вприложении). Для визуализации используются методы главных компонент и многомерногошкалирования.58Рис. 11. Визуализация пространства 14 персонажей «Войны и мира» при помощи методаглавных компонент (матрица ковариации)Рис. 12. Визуализация пространства 14 персонажей «Войны и мира» при помощи методаглавных компонент (матрица корреляции)59Рис. 13.

Визуализация пространства 14 персонажей «Войны и мира» при помощи методамногомерного шкалированияНаиболееявнаястилеметрическихграницавизмеренийпространстверечи,персонажей,проходитмеждупостроенномгруппойизнаосновеА. П. Шерер,А. М. Друбецкой и Василия Курагина — и всеми прочими персонажами, вошедшими в нашсписок. Группу выделяют все использованные методы многомерного анализа (обозначенаокружностью на рис. 14):Рис.

14. Василий Курагин, А. П. Шерер и А. М. Друбецкая в пространстве персонажей«Войны и мира», полученном на основе стилеметрических данныхГруппировка внутри оставшейся большой группы персонажей обозначена менее явно.Альтернативные методы снижения размерности в данном случае демонстрируютразличную картину (см. рис. 11–13). При этом важно помнить, что каждый метод сниженияразмерности неизбежно теряет часть информации об исходном многомерном пространстве.В связи с этим нами была дополнительно применена иерархическая кластеризация сиспользованием расстояний между текстами речи персонажей на основе метрики Delta.

Каквидно на рис. 15, разделение самого верхнего уровня при иерархической кластеризации60проходит по той же главной границе, отделяя Василия Курагина, А. П. Шерер иА. М. Друбецкую (выделены красным прямоугольником) от прочих персонажей.Рис. 15. Иерархическая кластеризация речи 14 персонажей «Войны и мира» на основеметрики Delta с использованием 130 наиболее частотных словОставшаяся группа из 11 персонажей при иерархической кластеризации распадается на двеподгруппы. Одна из подгрупп объединяет главных неисторических персонажей книги:Пьера Безухова, Андрея Болконского Николая Ростова, Наташу Ростову, княжну МарьюБолконскую. В другой подгруппе — в основном статичные персонажи второго плана:Денисов, князь Николай Андреевич Болконский, Кутузов, граф Илья Ростов графиняНаталья Ростова (обозначена как «Н.Ростова-ст»), Долохов.

На рис. 16 представленакомбинированная визуализация, где точки соответствуют координатам двух главныхкомпонент, тогда как кругами отображены группы верхнего уровня, полученные путемиерархической кластеризации:61Рис. 16. Комбинированная визуализация пространства 14 персонажей на основе метрикиDelta (метод главных компонент на основе матрицы ковариации + верхний уровеньиерархической кластеризации)Как видно, в ходе иерархической кластеризации Андрей Болконский был отнесен ккластеру главных персонажей.

В то же время метод главных компонент показывает, чтокнязь Андрей находится на периферии группы протагонистов. Этот персонаж постилеметрическим параметрам своей речи сближается с группой статичных второплановыхперсонажей (Кутузов, Н. А. Болконский, Денисов, старшие Ростовы) — и одновременно свыделенной ранее группой Василия Курагина (условно назовем ее группой «светскойинтриги»).

По своему речевому портрету Андрей Болконский оказывается на пересечениитрех групп, выделяемых стилеметрией в системе персонажей.Графиня Наталья Ростова (Н.Ростова-ст. на графике) была отнесена к группе статичныхперсонажей второго плана, но на графиках метода главных компонент и многомерногошкалирования (рис. 11–13) сближается с группой протагонистов. Дополнительнымсвидетельством промежуточного положения графини Ростовой в полученном пространствеперсонажей являются результаты кластеризации при помощи филогенетическогоконсенсусногодерева(рис.17).Этотметодпозволяетобобщитьнесколькостилеметрических измерений с разными параметрами.

В данном случае он применялся надиапазоне от 50 до 150 самых частотных слов — и выявил особое положение графиниРостовой вне трех основных кластеров.62Рис. 17. Филогенетическое консенсусное дерево, обобщающее кластеризацию несколькихизмерений метрики Delta (от 50 до 150 наиболее частотных слов)Можно допустить, что так отображается промежуточное положение графини Ростовоймежду «взрослым миром», в котором существуют Долохов, Денисов, и миром ее детей,Наташи и Николая.2.1.3 Моделирование системы персонажей при помощи метода комплексной оценкинелексических параметров прямой речиМодель системы персонажей, полученную при помощи стилеметрического метода, далеебыла сопоставлена с альтернативной моделью. Альтернативная модель системыперсонажей строилась на основе предложенного нами метода комплексной оценкинелексических параметров прямой речи.

Параметрами выступают доля восклицаний, долявопросительных реплик, отношение числа знаков препинания к числу слов и читабельность(readability), рассчитанная на основе 5 наиболее известных метрик. Идиолекты персонажей,представленные через эти признаки, исследовались теми же статистическими методами,что и в эксперименте со стилеметрией: метод главных компонент, многомерноешкалирование, иерархическая кластеризация.

На рисунке 18 представлено пространствоперсонажей «Войны и мира», построенное на основе метода комплексной оценки63нелексических параметров прямой речи и визуализированное с помощью метода главныхкомпонент8.Рис. 18. Визуализация метода комплексной оценки нелексических параметров прямойречи при помощи метода главных компонентИз визуализации методом главных компонент видно, что группировка персонажей поформальным признакам частично совпадает с группировкой на основе стилеметрии.

Так,здесь еще более отчетливо выделяется группа В. Курагина, А. М. Друбецкой и А. П. Шерер.Важное отличие второго метода состоит в том, что мы можем интерпретировать этотрезультат. Левый нижний угол визуализации соответствует речи, которая содержит малуюдолю вопросительных и восклицательных реплик, в которой мало знаков препинания врасчете на одно слово, и которая определяется как трудночитаемая инструментамиизмерения читаемости.Полностью противоположному типу речи — с высокой долей восклицаний и вопросов,большой долей знаков препинания и дискурсивных маркеров, и одновременно высокойчитаемостью — соответствует правый верхний угол визуализации.

Как можно видеть нарис. 18, обладателем такого противоположного типа речи является единственный персонаж— Наташа Ростова. Ее спонтанная и непосредственная речь, которая до исследованияосознавалась нами на уровне ощущения, в предлагаемом методе получает количественноеизмерение. А. А. Сабуров писал: «речевое своеобразие Наташи не столько в языковом8Визуализация при помощи многомерного шкалирования на основе внелексических параметров не имеетпринципиальных отличий по группировке персонажей от метода главных компонент.64материале ее речи, сколько в проявлениях темперамента. Ее речь строится не на логическихили грамматических закономерностях, а на экспрессии» [Сабуров, 1959: с. 566].Предлагаемый метод, в отличие от стилеметрии, фиксирует это своеобразие темпераментаНаташи.При сравнении результатов применения метода главных компонент в двух экспериментах(рис.

11–12 и рис. 18) видно, что метод оценки нелексических параметров дает болеедробную картину с разделением персонажей на большее число групп. Это жеподтверждают результаты иерархической кластеризации на основе данных второго метода,представленные на рис. 19.Рис. 19. Иерархическая кластеризация речи 14 персонажей «Войны и мира» на основенелексических параметров текстаУже на первом уровне разделения от остальных главных персонажей оказался отделенкнязь Андрей Болконский. Сопоставив результаты кластеризации с отображением впространстве главных компонент (рис. 20), мы установили, что из всех протагонистов князьАндрей отличается наибольшей сложностью речи с точки зрения метрик читаемости — иодновременно ему свойственна малая доля восклицательных реплик и дискурсивныхмаркеров.65Рис.

20. Комбинированная визуализация пространства 14 персонажей на основенелексических признаков (метод главных компонент + верхний уровень иерархическойкластеризации)Таким образом, речь Болконского действительно может быть охарактеризована как болееформализованная и — в определенном смысле — менее «живая», чем у большинстваисследованных персонажей. При этом князь Андрей не сближается и с группой В.Курагина, А. П. Шерер и А. М. Друбецкой (персонажей с максимально усложненной,формализованной, неразговорной речью).

Характеристики

Список файлов диссертации

Семантическая разметка художественных текстов для количественных исследований в филологии (на примере романа Война и мир Л.Н
Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6384
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее