Диссертация (1173170), страница 27
Текст из файла (страница 27)
The Corpus of Contemporary AmericanEnglish (COCA) является открытым, репрезентативным, сбалансированнымкорпусом, содержащим 520 миллионов слов и 190 тысяч устных и письменныхтекстов. Письменный компонент корпуса представлен текстами различныхязыковых сфер, таких как художественная литература, публицистические и132научные тексты. Каждый текст, содержащийся в корпусе, снабжен информацией одате и источнике публикации. Временной охват корпуса с 1990 по настоящеевремя.Однако при всех видимых преимуществах использования корпусов висследованиях неологизмов существует также ряд недостатков, главный изкоторыхсостоитвтом,чторезультаты,полученныеспомощьюавтоматизированных систем, всегда требуют ручной обработки.Преждевсего,ручнаяобработканеобходимадляподтверждениярелевантности полученных данных.
Проблема релевантности данных длябольшинствакорпусныхисследованийрешаетсяприпомощипорогадостоверности (reliability threshold): только те слова, которые встречаются чаще,чем установленный порог, считаются релевантными для дальнейшего анализа. Нов области исследования неологизмов данный метод неприемлем, т. к. приустановлении порога отбраковываются низкочастотные слова, к которым могутотноситься и новые лексические единицы [Janssen]. Кроме того, важно проверитьдостоверность частотности употребления той или иной лексической единицы, т. к.высокий показатель частотности может быть связан, например, с многократнымупотреблением слова лишь в одном источнике, что искажает реальную картинуфункционирования слова. Таким образом, крайне важным становится анализметаданных и анализ контекста, приведенного в корпусе, что позволит избавитьсяот таких не релевантных данных, как «слова-однодневки», имена собственные,орфографические ошибки и т.
д.Вторая группа недостатков корпусного исследования связана с тем, чтосемантический анализ невозможно провести автоматически, следовательно,невозможно без ручной обработки и опоры на контекст выявить новые значенияуже существующих слов (семантические неологизмы) или дифференцироватьзначения многозначных слов [Janssen].Несмотрянаперечисленныевышетрудностикорпусногоанализанеологизмов и их семантических характеристик, очевидным преимуществомиспользования корпусных методов является то, что лишь дискурсивные данные,находящиеся в лингвистическом корпусе, могут отразить реальную картину133функционированиялексическойединицывкоммуникации.Привлечениекорпусных данных позволит:1. на основе анализа частотности употребления коллокаций установитьнаиболее часто реализуемое значение исследуемых лексических единиц всовременном английском языке;2.
при помощи статистического метода, используемого в корпусе, выявитьнаиболееустоявшиесяколлокацииисследуемыхединицдляпроведениядальнейшего анализа;3. проследить динамику изменений частотности употребления лексическихединиц и их коллокаций по хронологическим отрезкамдля описанияособенностей их функционирования с точки зрения диахронии;4. с опорой на дату публикации и распределение частоты употребления повременным отрезкам зафиксировать новые примеры сочетаемости;5. описать распределение употребления исследуемых лексических единиц посубдискурсам поля экологического дискурса английского языка;6. опираясь на полученные списки коллокаций и контексты, представленныев конкордансе, установить общие и дифференцирующие концептуальныепризнаки, определяющие семантику описываемых единиц и их высокуюнеогенность.В соответствии с поставленными задачами, последовательно рассмотриманализируемые единицы (sustainable, ecological, eco-friendly, green, environmental)в рамках языкового корпуса с использованием методов корпусной лингвистики.Дляанализанаиболеечастотныхколлокацийсисследуемымиприлагательными нами были выбраны следующие параметры поиска по корпусу:+ 4 коллоката в постпозиции к анализируемой единице; список из 500 наиболеечастотных коллокаций с целевым словом.
Выбранный отрезок поискового запроса(+4 слова), по мнению составителей корпуса COCA, является наиболеепродуктивным для поиска коллокатов исследуемого слова. Ограничение на поискколлокаций их положением в постпозиции по отношению к целевому словуобусловлено тем, что атрибутивная конструкция является основной для имениприлагательного,таккакименновэтойконструкцииприлагательные134приписываютсуществительномупостоянныепризнаки[Рахилина2008].Расширение списка коллокаций до 500 примеров употребления продиктованопредположением о том, что новые коллокаты целевых слов можно обнаружитьименно в области низких частот. На следующем этапе полученный в результатеданного поискового запроса список коллокаций должен быть очищен от нерелевантных данных при помощи анализа контекста употребления.Список наиболее частотных коллокаций прилагательного sustainable,сформированного на основе вышеперечисленных параметров, позволил выявить298релевантныхколлокацийсисследуемымприлагательным.Анализконтекстного употребления полученных коллокаций показал, что в современноманглийском языке данное прилагательное значительно чаще (в 197 коллокациях)употребляется в своем втором значении not causing damage to the environment.Таким образом, на основе корпуса можно утверждать, что данное значениестановится основным для указанной лексической единицы.
Данное наблюдениеможно проиллюстрировать, приведя первые 30 наиболее частотных коллокаций сприлагательнымsustainable(см.приложение1).Приэтом,анализируяраспределение частоты употребления данного прилагательного по временнымотрезкам, можно сделать вывод о том, что общая частота его употребления вкорпусе выросла в два раза начиная с 90-х годов ХХ века: в период 1990-1994 вкорпусе зафиксировано 1074 случаев употребления данной единицы, в период2010-2015 количество употреблений доходит до 2419. Увеличение общегоколичества вхождений в корпус прилагательного sustainable и тенденция креализациипроизводногозначениясвидетельствуют отом,чтоданнаялексическая единица становится все более общеупотребительной и прочно входитв язык в значении not causing damage to the environment.На следующем этапе нашего анализа при помощи статистического критериявзаимной информации (MI), используемого в COCA, мы выявили наиболееустоявшиеся коллокации с прилагательным sustainable.
Создатели корпусасчитают, что коллокации, статистический показатель которых выше 3.0, являютсяустоявшимися сочетаниями и могут быть подвергнуты дальнейшему анализу.Однако при выявлении наиболее устойчивых коллокаций необходимо также135учитывать распределение частоты их употребления по временным отрезкам. Так,некоторые слова даже при условии высокого показателя критерия взаимнойинформации могут оказаться «словами-однодневками», словами, многократноупотребляющимися лишь в одном источнике, или частота их употребления будетнеуклонно падать, что говорит о том, что они становятся все менее актуальными всовременном языке.Согласно данным корпуса, 86 коллокации с прилагательным sustainableимеют показатель взаимной информации более или равный 3.0 и могут бытьрассмотрены как наиболее устойчивые словосочетания с данным прилагательнымв современном английском языке (см.
приложение 2). Из них лишь в 23коллокациях прилагательное sustainable реализует значение «able to continuewithout causing damage to the environment», во всех остальных коллокацияхизучаемая единица реализует производное значение «not causing damage to theenvironment». Принимая во внимание распределение частоты употребленияданных коллокаций за выбранные периоды времени, можно утверждать, чтоследующиеколлокациистановятсяменееупотребительными:sustainabledevelopment, harvesting, use, initiative, society.
В то же время, частота употреблениятаких коллокаций, как sustainable agriculture, farming, fisheries, seafood, forest,management, production, methods, practices, solutions, way, lifestyle, living,communities, design, building, technologies, materials, food, energy, sources, future,programs, planet выросла в два и более раз в период с 1990 по 2015 гг.Данные наблюдения позволяют сделать вывод о том, что, во-первых,прилагательное sustainable продолжает активно расширять свою сочетаемость,вступая в коллокации с новыми существительными.
Во-вторых, для данногоприлагательногонамечаетсятенденциявхождениявсочетаниессуществительными с более конкретной семантикой (например, seafood, forest), всравнениистакимитрадиционнымидляданногоприлагательногословосочетаниям, как sustainable development, use. Кроме того, семантика такихколлокаций, как sustainable lifestyle, living, communities, practices, solutions,materials, food, частота употребления которых продолжает расти, указывает на то,136что идея сбережения природных ресурсов активно пропагандируются ивнедряются в повседневную жизнь носителей языка.Анализ распределения количества употреблений коллокаций по временнымотрезкам, а также данные о дате публикации также позволили выявитьнеологизмы и примеры новых коллокатов прилагательного sustainable.
При отбореновых единиц и коллокаций мы опирались на сравнение показателей частотыупотребления лексической единицы за разные временные отрезки, предлагаемыеинтерфейсом используемого корпуса, что, в итоге, позволило говорить о большейили меньшей степени новизны лексической единицы. Например, в выбранномнами корпусе для анализа доступны следующие хронологические отрезки: 19901994;1995-1999;2000-2004;2005-2009;2010-2015.Следовательно,еслилексическая единица зафиксирована в корпусе в одном из перечисленных вышевременныхотрезкови,приэтом,отсутствуетвпредшествующемпериоде/периодах, можно предположить, что она является новой.
Для первого изуказанных временных отрезков (1990-1994) показателем новизны лексическойединицы может считаться низкая частота ее употребления. В качестведополнительного критерия возможно также использовать дату публикацииисточника, что в некоторых случаях позволяет зафиксировать появление новойединицы более точно.Исходя из данных предположений, мы разделили новые коллокатыприлагательного sustainable, выявленные с помощью корпуса, на две группы.Первую группу составили словосочетания, появление которых зафиксировано водном из предлагаемом корпусом хронологическом периоде и чья частотаупотребления значительно выросла к настоящему моменту, что свидетельствуетоб их востребованности в современном языке (см. табл.