Для студентов ПНИПУ по предмету ДругиеДинамика лексического состава русской художественной прозы (на материале частотных словарей Корпуса русских рассказов 1900-1930)Динамика лексического состава русской художественной прозы (на материале частотных словарей Корпуса русских рассказов 1900-1930)
2024-05-242024-05-24СтудИзба
Динамика лексического состава русской художественной прозы (на материале частотных словарей Корпуса русских рассказов 1900-1930)
Описание
Аннотация
Материалы Корпуса русского рассказа делятся на три временных периода: 1) довоенный период (1900–1913), 2) военно-революционные годы (1914–1922) и
Ключевые слова: лексико-статистический анализ; семантика; художественные тексты; частотный словарь; корпусная лингвистика; компьютерная лингвистика
2
Abstract
This paper describes a study of the changes that occurred in the Russian language during the first three decades of the 20th century and their comparison with the language of the first decades of the 21st century. Over thirty years many significant events occurred for Russia, such as the First World War, the collapse of the Russian Empire, the October Revolution, etc. The research is conducted on the material of frequency dictionaries from the Russian short stories corpus 1900-1930 which are divided into three different time periods and present the texts of 300 Russian writers, as well as on the material of stories from the National Russian Corpus in the period from 2000 to 2022. In this paper the frequency distribution of the significant vocabulary was analyzed, and comparisons of the obtained results at different time slices were made. Thus, the tendencies in the change of frequency of some words and semantic groups of words were found. The comparison of the vocabulary of the first thirty years of the XX century and the vocabulary of the XXI century was carried out due to the parameter of relative frequency - ipm. With the help of this study it is possible to trace the influence of important historical events on the lexical composition of the language of fiction, to evaluate the trends to which the language has been subjected, and to identify the leading themes of the early 20th century and their differences from the themes of the 21st century.
Keywords: lexical studies; semantics; Russian short story; frequency dictionary; corpus linguistics; computational linguistics; statistical analysis
3
Введение
Исследование динамики лексического состава русской художественной прозы на материале частотных словарей корпуса русских рассказов 1900-1930 годов является важным вкладом в анализ художественной литературы данного периода. Благодаря ему представляется возможным сравнить динамику лексического состава языка и оценить тенденции, которые происходили в языке под влиянием исторических событий вышеуказанного периода. В данном исследовании применялись частотный и семантический подходы, благодаря которым можно проследить изменения не только отдельных слов, но и целых семантических групп – тем, которые имели важное значение для людей того времени, влияли на их речь, употребление терминов и определенных слов, а также на литературу и другие аспекты их жизни.
возникновение СССР вместо Российской Империи и т.п. Исследование проведено на материале аннотированной выборки из Корпуса русского рассказа 1900-1930 гг., где представлено более 300 текстов русских писателей, как популярных, так и малоизвестных. Материалы Корпуса делятся на три временных периода: 1) довоенный период (1900–1913), 2) военно-революционные годы (1914–1922) и 3) советский период (1923–1930). Часть данного исследования была построена на произведении частотного анализа лексем, выделенных в верхние зоны каждого из периодов и выделение определенных тенденций и тем, которые можно было отметить благодаря подобному анализу.
Другая часть представляет собой сравнение лексики начала XX века с лексикой XXI века. Лексика двадцать первого века была взята из рассказов Национального корпуса русского языка (2000-2022 гг.). Так как объемы обоих корпусов оказались различны, для сравнения использовалась относительная
4
частота встречаемости – ipm. Таким образом, были выделены тенденции определенных выделенных раннее семантических групп и даны объяснения подобным закономерностям.
Целью данного исследования является выделение тенденций, происходящих во течение первых трех десятилетий XX века, а также сравнение частотных характеристик лексических единиц русского рассказа начала XX и XXI века.
Для достижения поставленной цели необходимо было решить следующие теоретические и практические задачи:
4. Сравнить частотности входящих в выделенные тематические группы лексем с частотностями аналогичных лексем в современных русских рассказах.
5. Выявить тенденции в изменении частотности отдельных слов и лексических групп от одного исторического отрезка к другому и постараться их проинтерпретировать.
Объектом исследования является наиболее частотная лексика состава русской художественной прозы, выделенная в верхнюю зону частотности и распределенная по семантическим группам. В данной работе используются такие методы, как частотный и семантический анализ, а также диахронический подход к применению данных методов. Материалом работы являются
5
частотные словари Корпуса русских рассказов 1900-1930 годов и русские рассказы Национального корпуса русского языка (2000-2022 гг.).
Теоретическая значимость работы определяется разработкой методики выделения семантических групп и выявление зависимостей между частотностью употребления слов и историческими, социальными и иными явлениями, оказывающими сильное влияние на общество, общественное мнение, а также на темы, обсуждаемые большинством. Практическая значимость данной работы заключается в том, что полученные результаты и методики указывают на возможность применения такого метода не только для конкретного выделенного временного промежутка, но и любых других исторических срезов, которые исследователь может найти достаточно интересными для проведения такого рода исследования.
- данной работе описывается изучение изменений, произошедших в русском языке в течение первых трех десятилетий XX века и их сравнение с языком первых десятилетий XXI века. За тридцать лет для России произошло много значительных событий, таких как Первая мировая война, распад Российской империи, Октябрьская революции и т.п. Исследование проведено на материале частотных словарей из Корпуса русского рассказа 1900-1930 гг., в котором представлены тексты 300 русских писателей, а также на материале рассказов Национального корпуса русского языка в период с 2000 по 2022 год.
Материалы Корпуса русского рассказа делятся на три временных периода: 1) довоенный период (1900–1913), 2) военно-революционные годы (1914–1922) и
- советский период (1923–1930). В данной работе было проанализировано частотное распределение знаменательной лексики, а также проведено сравнение полученных результатов на разных временных срезах. Таким образом, были обнаружены тенденции в изменении частотности некоторых слов и семантических групп слов. Сравнение лексики первых тридцати лет XX века и лексики XXI века было проведено благодаря параметру относительной встречаемости – ipm. С помощью данного исследования можно проследить влияние важных исторических вех на лексический состав языка художественной литературы, оценить тенденции, которым подвергся язык, а также выявить ведущие темы начала XX века и их отличия от тем XXI века.
Ключевые слова: лексико-статистический анализ; семантика; художественные тексты; частотный словарь; корпусная лингвистика; компьютерная лингвистика
2
Abstract
This paper describes a study of the changes that occurred in the Russian language during the first three decades of the 20th century and their comparison with the language of the first decades of the 21st century. Over thirty years many significant events occurred for Russia, such as the First World War, the collapse of the Russian Empire, the October Revolution, etc. The research is conducted on the material of frequency dictionaries from the Russian short stories corpus 1900-1930 which are divided into three different time periods and present the texts of 300 Russian writers, as well as on the material of stories from the National Russian Corpus in the period from 2000 to 2022. In this paper the frequency distribution of the significant vocabulary was analyzed, and comparisons of the obtained results at different time slices were made. Thus, the tendencies in the change of frequency of some words and semantic groups of words were found. The comparison of the vocabulary of the first thirty years of the XX century and the vocabulary of the XXI century was carried out due to the parameter of relative frequency - ipm. With the help of this study it is possible to trace the influence of important historical events on the lexical composition of the language of fiction, to evaluate the trends to which the language has been subjected, and to identify the leading themes of the early 20th century and their differences from the themes of the 21st century.
Keywords: lexical studies; semantics; Russian short story; frequency dictionary; corpus linguistics; computational linguistics; statistical analysis
3
Введение
Исследование динамики лексического состава русской художественной прозы на материале частотных словарей корпуса русских рассказов 1900-1930 годов является важным вкладом в анализ художественной литературы данного периода. Благодаря ему представляется возможным сравнить динамику лексического состава языка и оценить тенденции, которые происходили в языке под влиянием исторических событий вышеуказанного периода. В данном исследовании применялись частотный и семантический подходы, благодаря которым можно проследить изменения не только отдельных слов, но и целых семантических групп – тем, которые имели важное значение для людей того времени, влияли на их речь, употребление терминов и определенных слов, а также на литературу и другие аспекты их жизни.
- данной выпускной квалификационной работе описывается изучение изменений, произошедших в русском языке в течение первых трех десятилетий XX века. За эти тридцать лет для России произошло много значительных событий, таких как Первая мировая война, Октябрьская революция,
возникновение СССР вместо Российской Империи и т.п. Исследование проведено на материале аннотированной выборки из Корпуса русского рассказа 1900-1930 гг., где представлено более 300 текстов русских писателей, как популярных, так и малоизвестных. Материалы Корпуса делятся на три временных периода: 1) довоенный период (1900–1913), 2) военно-революционные годы (1914–1922) и 3) советский период (1923–1930). Часть данного исследования была построена на произведении частотного анализа лексем, выделенных в верхние зоны каждого из периодов и выделение определенных тенденций и тем, которые можно было отметить благодаря подобному анализу.
Другая часть представляет собой сравнение лексики начала XX века с лексикой XXI века. Лексика двадцать первого века была взята из рассказов Национального корпуса русского языка (2000-2022 гг.). Так как объемы обоих корпусов оказались различны, для сравнения использовалась относительная
4
частота встречаемости – ipm. Таким образом, были выделены тенденции определенных выделенных раннее семантических групп и даны объяснения подобным закономерностям.
Целью данного исследования является выделение тенденций, происходящих во течение первых трех десятилетий XX века, а также сравнение частотных характеристик лексических единиц русского рассказа начала XX и XXI века.
Для достижения поставленной цели необходимо было решить следующие теоретические и практические задачи:
- Построить на базе выборки из «Корпуса русского рассказа 1900-1930 гг.» частотные словари его подкорпусов.
- Статистически выделить и семантически проанализировать верхние зоны частотного распределения лексем для данных подкорпусов.
- На основании семантического анализа верхних зон частотных распределений лексем выделить основные темы, которые главенствовали в обществе в данные периоды времени и нашли свое отражение в анализируемых текстах.
4. Сравнить частотности входящих в выделенные тематические группы лексем с частотностями аналогичных лексем в современных русских рассказах.
5. Выявить тенденции в изменении частотности отдельных слов и лексических групп от одного исторического отрезка к другому и постараться их проинтерпретировать.
Объектом исследования является наиболее частотная лексика состава русской художественной прозы, выделенная в верхнюю зону частотности и распределенная по семантическим группам. В данной работе используются такие методы, как частотный и семантический анализ, а также диахронический подход к применению данных методов. Материалом работы являются
5
частотные словари Корпуса русских рассказов 1900-1930 годов и русские рассказы Национального корпуса русского языка (2000-2022 гг.).
Теоретическая значимость работы определяется разработкой методики выделения семантических групп и выявление зависимостей между частотностью употребления слов и историческими, социальными и иными явлениями, оказывающими сильное влияние на общество, общественное мнение, а также на темы, обсуждаемые большинством. Практическая значимость данной работы заключается в том, что полученные результаты и методики указывают на возможность применения такого метода не только для конкретного выделенного временного промежутка, но и любых других исторических срезов, которые исследователь может найти достаточно интересными для проведения такого рода исследования.
Характеристики ВКР
Предмет
Учебное заведение
Семестр
Просмотров
1
Размер
921 Kb
Список файлов
Динамика лексического состава русской художественной прозы (на материале частотных словарей Корпуса русских рассказов 1900-1930).doc