Диссертация (1168788), страница 18
Текст из файла (страница 18)
Пошаговая процедура проведения семантическогоэкспериментаКакилюбойнаучныйметодисследования,предусматривает для исследователя возможностьэкспериментизменения условийпроведения эксперимента, а также последовательности его проведения.Пошаговая процедура применения гипотетико-дедуктивного метода получила96детальное описание в работе О.С. Белайчук (Белайчук 2004), которая выделяет11 шагов в рамках данной процедуры:1) сбор примеров;2) индуктивное обобщение;3) формирование репрезентативной выборки;4) замена исходной лексической единицы в репрезентативной выборкена ее синоним;5) предъявление экспериментальной выборки примеров информантуносителю языка для оценки их правильности или неправильности;6) анализ результатов эксперимента;7) построение гипотезы о дифференциальных семантических признакахисследуемых лексических единиц на основе опытных данных;8) проверка построенной гипотезы на имеющемся языковом материале;9) построение новой экспериментальной выборки, но по другомупринципу, нежели на этапе 4 (используя направленное варьирование одногопараметра);10) предъявление экспериментальной выборки информанту-носителюязыкадляоценкиправильностиилинеправильностиполученныхвысказываний;11) анализ результатов эксперимента, подтверждение / неподтверждениевыдвинутой гипотезы.В ходе исследования разработанный О.С.
Белайчук алгоритм оказалосьнеобходимо дополнить и уточнить вследствие появившихся новых интернеттехнологий,открывающихновыевозможностидлялингвистическихисследований. Остановимся подробнее на описании алгоритма, примененногов настоящей работе.Шаг 1. Сбор примеров. На данном этапе семантического анализаисследователь собирает фактический материал с целью последующеговыдвижения гипотезы на основе полученных оценок информанта. Источникомматериала в данном исследовании послужили словарные статьи толковых97словарей английского языка, англо-русских словарей, англоязычных словарейсинонимов.
(Обратим внимание на то, что в целом мы критично относимся кописаниямзначенийлексическихединиц,предлагаемыхвсловарях.Ознакомление со словарными дефинициями слов variety, diversity, set, series(of), assortment, range, selection свидетельствует о том, что в словарныхстатьях большинства современных толковых словарей одно слово трактуетсячерез другое, или предлагаются совпадающие определения – подробнее см.стр.6-7), однако примеры употребления и опрос информантов показывают, чтовыбранные слова не являются взаимозаменяемыми во всех контекстах, а,значит, в их семантике присутствуют существенные различия.Далее, были включены примеры из современных газетных публикаций,англоязычных интернет-сайтов и корпусов текстов British National Corpus –BNC и Corpus of Contemporary American English – COCA.
Кроме того, ценныепримеры были предложены и самими информантами – носителями языка.Всего собрано более 6 тысяч примеров, в которых встречались исследуемыеединицы variety, diversity, series (of), set, assortment, range, selection.Основное количество примеров было взято из корпусов текстов. Корпуспредставляет собой информационно-справочную систему, основанную насобрании текстов на некотором языке в электронной форме.
Национальныйкорпус представляет данный язык на определенном этапе (или этапах) егосуществования и во всѐм многообразии жанров, стилей, территориальных исоциальных вариантов и т.п. Национальный корпус создается лингвистами(специалистамипокорпуснойлингвистике,быстроразвивающейсясовременной области языкознания) для научных исследований и обученияязыку.Как правило, национальный корпус имеет две важные особенности. Вопервых, он характеризуется представительностью, или сбалансированнымсоставом текстов. Это означает, что корпус содержит по возможности всетипы письменных и устных текстов, представленные в данном языке(художественные разных жанров, публицистические, учебные, научные,98деловые, разговорные, диалектные и т.п.), и что все эти тексты входят вкорпус по возможности пропорционально их доле в языке соответствующегопериода.
Хорошая представительность достигается только при значительномобъеме корпуса (десятки и сотни миллионов словоупотреблений).Во-вторых, корпус содержит особую дополнительную информацию освойствах входящих в него текстов (так называемую разметку, илианнотацию). Разметка — главная характеристика корпуса; она отличаеткорпус от простых коллекций (или «библиотек») текстов, в изобилиипредставленных в современном интернетеБольшинство крупных языков мира уже имеет свои национальныекорпуса (различающиеся по полноте и уровню научной обработки текстов). Внастоящей работе активно использовался корпус современного американскогоанглийского языка – Corpus of Contemporary American English, которыйпредставляет собой широко используемый и самый большой по объемуязыкового материала корпус текстов. Данный корпус представлен более 520млн словоупотреблений (20 млн слов, собранных каждый год начиная с 1990по 2015) устной и письменной речи американского варианта английскогоязыка.
Тексты корпуса представлены 5 основными жанрами: разговорныйязык, художественная литература, популярные журналы, научные журналы игазеты. В корпусе заложено множество возможностей для детальногоисследования слова, его окружения, сочетаемости, частотности и т.д.Рассмотрим эти возможности и его структуру. При входе на сайт открываетсянабор опций: поиск, частотность, контекст и обзор. (См. скриншот и егоописание ниже).99Слева находится панель поиска. В верхней строке List наберем,например, исследуемую в диссертации единицу variety (of) и увидимколичество найденных высказываний – 30170.
При нажатии на само словониже выпадет «порция» в 100 высказываний, где оно встречается.Высказывание может быть незавершенным или не иметь начала. Главное, чтослово показано в своем правом и левом окружении (более 10 слов), то естьматериал для проведения, например, дистрибутивного анализа можно собратьочень быстро.
При необходимости можно запросить полный контекст суказанием источника.В списке высказываний справа указывается дата включения текста вкорпус (в верхней части списка самые современные варианты – указан 2015год).Вследующемстолбцеобозначенжанр(разговорныйязык,художественная литература, популярные журналы, научные журналы игазеты), за ним столбец с указанием контекстов – из какого журнала / книги /телевизионной передачи взято высказывание.В том случае, если необходимо проанализировать дистрибуцию слова(правую и / или левую), следует выбрать поисковую строку Collocates(Словосочетания), щелкнув на нее мышью.
Далее будет предложено дваниспадающих списка: правый и левый, максимально возможное количествослов для каждого списка составляет 9. В качестве примера выберем для словаvariety одно слово в качестве левой дистрибуции, в правом списке укажем 0,получаем перечень слов, с которыми чаще всего употребляется это слово всвоем ближайшем левом окружении, начиная с самого частотного (указанатакже частотность как количество встречаемостей именно с этим словом вовсех контекстах с исследуемым словом). Так, слово variety чаще всегоупотребляется с артиклем a – 22582 раза, можно также просмотреть все этиконтексты употреблений, нажав на A (артикль). Для нашего исследованияданные по сочетаемости с артиклем нерелевантны, тогда как высокаясочетаемость существительного variety (вторая по количеству встречаемостейпосле артикля а) с прилагательным wide – 3056 раз представляет интерес в100рамкахпроведениядистрибутивногоанализалевойсочетаемостиисследуемых слов (подробно см. далее).Если при этом в правой панели поиска отметить окно Sections и нажатьSearch (Поиск), отобразится таблица с частотностью употребления данногословосочетания (a variety of) во всех пяти жанрах: SPOKEN (разговорныйстиль), FICTION (художественная литература), MAGAZINE (популярныежурналы), NEWSPAPER (газеты), ACADEMIC (научный стиль).
Какпоказывает таблица, словосочетание a variety of наиболее характерно длянаучного стиля (11355 встречаемостей).В этой же таблице справа видна частотность употребления данногословосочетания по временным периодам: 1990-1994, 1995-1999, 2000-2004,2005-2009, 2010-2015. ИГ a variety of стала более употребительной впоследний временной отрезок, ср. 4353 контекста в 1990-1994 и 4955 в период2010-2015.Для того чтобы получить данные о частотности употребленийисследуемого слова по временным периодам и языковым жанрам используемChart (Таблица) как вид представления данных. Выбрав данную возможностьна панели слева, вводим ИГ variety of в строку поиска, и из появившейсятаблицы видно распределение по жанрам: чаще всего оно встречается внаучном стиле, реже всего – в разговорном.
Во второй части таблицы такжепоказано, что частотность употребления данного слова сохранялась примернона одном уровне – около 6000 встречаемостей. Данный расчет частотностипредставлен в графе таблицы FREQ (Частотность) и представляет собойприблизительный расчет. Ниже представлен упорядоченный расчет – PERMIL (На миллион) – количество словоупотреблений на 1 миллион. Согласнотакому расчету, частотность употребления слова variety of снизилась, нонезначительно, ср.