Главная » Просмотр файлов » Диссертация

Диссертация (1148552), страница 15

Файл №1148552 Диссертация (Лингвистические методы определения авторства средневековых текстов (на материале французского романа XIII века Продолжение Персеваля)) 15 страницаДиссертация (1148552) страница 152019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 15)

Виноградов отмечает тот факт, чтовсе они основываются на лексическом и фразеологическом анализе, однако «наличиемногочисленныхустойчивыхлексико-фразеологическихтрафаретов…напротяжении столетий и применявшихся в одних и тех же значениях и ситуациях,лишает и этот приём действенной и вполне доказательной силы». Индивидуальныечерты авторского стиля, по мнению учёного, выступают лишь «как видоизменения,некоторые вариации в системе общего жанрового стиля» [там же, с.55]. При этом онподчёркивает необходимость стилистического анализа для проведения атрибуциисредневекового текста и применения более формальных подходов.Понимание важности именно стилистического анализа, систематизации данныхо функционировании языковых единиц привело к разделению дальнейшего развитияметодов атрибуции и применения статистического аппарата на лексическом уровне и77синтаксическом уровне текста.

60-е годы также характеризуются большимколичеством разработок методов, основанных на лексическом анализе текста, как вотечественной науке, так и за рубежом. Французский лингвист Ш. Мюллер изучалквантитативную структуру лексики, в частности пьес П. Корнеля и произведений Ж.Ренара, с применением статистических методов. Исследователь полагал, чтоединственно верный путь к определению авторства лежит через количественнуюоценкуупотребленияследующихлексическихгруппнаосновевыборок:определённый артикль, предлоги à и de, глаголы avoir и être, союз que, относительныеместоимения.

Такой выбор был обусловлен тем, что это наиболее частовстречающиеся слова, не имеющие конкретного семантического наполнения.Измерение среднего расстояния и коэффициента вариативности не выявило чёткойкорреляции, поэтому слова были объединены в более крупные лексические группы(например, que+relatif), и определены два параметра для каждой группы: положение(на основе частоты) и распределение (коэффициент вариативности и расстояние).Затем Ш. Мюллер измерил теоретическую и практическую частоту употреблениякаждого слова и расстояние между ними. Учёный пришёл к выводу о том, чтоавторство фаблио «Auberée» («Обере, старая сводня») и двух тенцон, «De Renart et dePiaudoue» и «Du Plait et de Piaudoue», принадлежит Ж. Ренару [132, с.

271-279].Позднееисследовательсформулировалчетыреглавныхсоставляющих,определяющих текст: автор, язык (диалект, ограниченный географически ихронологически), тема и стиль. Первые два элемента статичны в произведении, тогдакак последние два находятся в движении [133]. При этом, исследователь приходит квыводу о том, что «невозможно создать портрет автора при помощи статистическогоаппарата», и предвосхищает следующий этап развития методов атрибуции: «Можнопопробоватьизбежатьлексикиипопробоватьколичественносинтаксические явления, и даже риторики» [там же, с. 370].измерить78Нельзя не упомянуть инновационное исследование, проведённое А.

П.Василевичем в 1981 году и посвящённое употреблению слов, обозначающих цвета(прилагательные, двусоставные слова, словосочетания), на материале поэзии и прозы.В основу анализа были положены следующие критерии: индекс живописности истепень оригинальности, определяемые индексом морфологической оригинальности(отношениесложныхсловкпростым),индексом насыщенности(частотаупотребления) и индексом лексической оригинальности (соотношение редких ичастых слов) [134]. Автор отмечает следующую тенденцию: писатели XIX века малоуделяли внимание цветовому описанию в текстах, в начале XX частота употребленияслов и живописных описаний возросла, а затем пошла на спад.

Это исследование ещёраз подтвердило универсальность формальных методов и математического аппаратаи возможность их использования для оценки лексической структуры.Лексическое направление в атрибуции вызывало серьёзный научный интерес вовторой половине XX века в различных аспектах, в частности, при разработкетеоретическихосновквантитативнойлингвистики.Однимиизнаиболеепримечательных исследований являются труды Ю.

А. Тулдавы, обобщившего методыквантитативно-системного описания лексической структуры языка. Исследовательвыводит два принципа количественной оценки лексического состава языка: принципсистемности и вероятностно-статистический характер её организации [135].Лексический состав языка имеет неограниченное число комбинаций при сохранениисистемных признаков, и поддаётся описанию формальными методами теориивероятностей и математической статистики. Учёный также впервые применяет методкластерногоанализаираспределительногомоделированиядляописаниялексического состава и обосновывает некоторые теоретические выводы, в частности,о том, что числовые характеристики текстов и словарей могут быть описаны припомощи закона Ципфа в ранговой и спектральной формах и сложнымикомбинированными функциями.

В аспекте стилистического анализа лексики учёный79приводит примеры вычислений на основании сравнения лексики текстов разныхавторов с высокими показателями индекса разнообразия и исключительности, а такжепримеры классификации текстов на основе числовых характеристик лексикостилистических признаков. Выводы Ю.А. Тулдавы подтвержает тот факт, что анализструктуры и состава лексического уровня является обязательным условием процессаатрибуции текстов.2.4.

Современные методы атрибуции анонимных и псевдонимных текстовСовременныесостояниеметодоватрибуциивзначительнойстепениобусловлено стремительным развитием информационных технологий. В конце 90-хгодов XX века стремительный рывок в области доступных компьютерных мощностейсущественно сказался на таких научных направлениях как извлечение информации,машинное обучение и обработка естественного языка, позволив свободно применятьих на параметрическом пространстве большой размерности. Использование данныхметодов наравне с более традиционными математическими методами атрибуциисущественно расширило возможности исследователей в области определенияавторства анонимных и псевдонимных произведений.В общем случае, практически для всех современных методов решение задачиустановления авторства некоторого текста разделяется на два принципиальных этапа:1.

Стилеметрические методы параметризация текста2. Математические методы обработки параметризированного текста802.4.1. Методы параметризации текстаМетоды параметризации текста можно условно разделить на несколькоосновных групп:Лексическая параметризацияОсновывается на представлении текста как набора слов. Включает в себямножествометодов(например,использованиефункциональныхслов).Параметризация при помощи функциональных слов является развитием идеиДиттенбергера (см. раздел 2.2.) и впервые используется в знаменитой работе [136],посвященной авторству «Записок Федералиста». Данный тип параметризацииподразумевает использование в качестве параметров некоторого набора простых слови определение частоты их встречаемости, при этом, используется фиксированныйнабор слов, включающий в себя местоимения, предлоги, вспомогательные глаголы,артикли и т.д. Иногда в список функциональных слов включают также числа имеждометия.Принцип, по которому исследователи остановились на использованиифункциональных слов, заключается в том, что они, с точки зрения смысловогонаполнения,практическибессодержательны.Вследствиеэтого,частотаихповторений теоретически не должна зависеть от темы текста, поэтому в разныхтекстах одного и того же автора они должны встречаться примерно с одинаковойчастотой.Крометого,предполагается,чтосознательноконтролироватьиспользование функциональных слов достаточно затруднительно, поэтому снижаетсяриск быть намеренно введённым в заблуждение [137].Очевидным недостатком метода параметризации при помощи функциональныхслов является вариативность списка параметров (например, для английского языкавыделяют от 150 [138] до 675 [139] функциональных слов) и зависимость их, в томчисле, от языка текста.81Другими возможными лексическими параметрами являются оценка богатствасловарного запаса, частота использования слов и n-грамм и даже ошибок в тексте.Лексическая параметризация зачастую включает в себя набор дополнительныхпроцедур, таких как токенизация, лемматизация и стемминг.Синтаксическая параметризация при решении задач атрибуцииДальнейшим этапом развития вычислительных методов определения авторстваявляется использование синтаксической параметризации при описании авторскогостиля.Синтаксическаяпараметризациясталаестественнымразвитиемиспользующейся в лексическом анализе параметризации на основе функциональныхслов.Можно утверждать, что функциональные слова относительно бессмысленныпотому, что выступают в качестве связок между словами, несущими основнуюсмысловую нагрузку.

Характеристики

Список файлов диссертации

Лингвистические методы определения авторства средневековых текстов (на материале французского романа XIII века Продолжение Персеваля)
Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6485
Авторов
на СтудИзбе
303
Средний доход
с одного платного файла
Обучение Подробнее