диссертация (1169444), страница 13
Текст из файла (страница 13)
Кроме того, как отмечалось выше, входные единицы корпусааннотированы для более удобного и точного поиска по словарной базе.1.2 Отбор материала для исследования. После выбора наиболееподходящего корпуса, было необходимо определить и выделить ту его часть,которая отвечает поставленным задачам. Из устной части корпуса BNCнаибольший интерес представляет отобранный по демографическим параметрам«разговорный, диалоговый корпус» (conversational corpus), так как публичныеречи стилистически окрашены, что может влиять на общие результатыисследования.демографическойРассмотримчастисоотношениеустногокорпуса.социологическихОнсостоитизпараметровзаписей124добровольцев, отобранных «на основании их возраста, пола, региона, социальногокласса и так далее» (McEnery & Wilson 1996: 65).
Важно отметить, что, несмотряна стремление представить все социальные группы в равной степени, враспределении присутствуют некоторая диспропорция. Так, например, средидобровольцев, записывавших разговоры – 75 женщин и 73 мужчины; данное89небольшое отличие становится более заметным, если учесть собеседников волонтеров.
Участников, согласившихся принять участие в сборе устногоматериала для корпуса, попросили сделать записи разговоров за 2-7 дней (однимих которых обязательно был день записи на участие в проекте); так как деньначала работы отличался, составителям удалось собрать материал разговоров вбудни и выходные (данная информация не была внесена в итоговый корпус). Таккак добровольцы не были ограничены в количестве разговоров, записываемых заодин день, количество их собеседников заметно варьировалось, что, в итоге,привело к тому, что небольшая диспропорция в гендерном аспекте увеличилась засчет того, что среди людей, с которыми общались участники проекта,преобладали женщины. Кроме того, их высказывания, как правило, были длиннееи многословнее, чем речь мужчин.
Помимо указанных выше записей, в корпусBNC вошел материал, собранный в рамках проекта COLT Teenager Languageproject (Бергенский университет). При сборе аудио материала и его обработке(транскрипции и аннотации) использовались те же методы, что и в общем проектекорпуса, но группа волонтеров представляла собой подростков младше 16 лет.Несмотря на то, что итоговый собранный устный материал несколько отличаетсяотизначальнозапланированного,онпредставляетсядостаточнорепрезентативным для анализа устной речи англичан. В целом, объем устногоразговорного корпуса распределен следующим образом:901) по возрасту:ВозрастКоличество текстов Количество словПроцент от общегоколичества слов0-14262670056.3015-243666535815.7125-342985383220.1635-442284515319.9645-592096348322.7560+2063912415.092) по полу:ПолКоличество текстов Количество словПроцент от общегоколичества словМужской73174222241.14Женский75247548858.46Пол не указан5162450.383) по социальному классу:КлассABКоличествоКоличествоПроцент от общего количестватекстовсловслов5913729339132.42C136110427926.08C231108780825.69DE31108780825.69Класс не указан7376220.88Таким образом, можно утверждать, что в разговорной составляющейБританского национального корпуса BNC различные социальные группыанглийского общества представлены пропорционально, тем не менее длясравнительного анализа использования лексики (в том числе, абстрактной)данные необходимо нормализовать.Следующим шагом было выделение из всего разговорного корпуса именсуществительных.
Необходимо отметить, что, несмотря на проработаннуюаннотацию слов, поиск с помощью ПО Xiara, созданного специально для работы сBNC, не позволяет получить всю нужную информацию или отсортировать ее напервоначальном этапе. Поэтому для работы с данными в рамках данногоисследования была создана программа, позволяющая выделить имена и свестивсю демографическую информацию об авторе каждого предложения и слова.Для этого прежде всего был произведен поиск по аннотациям частей речи;для обозначения существительных в BNC используются следующие пометы: NN0(имя существительное с неопределенным или неопределяемым числом), NN1 (имясуществительноеединственногочисла),NN2(имясуществительноемножественного числа), NP0 (имя собственное).
Из-за невозможности в92некоторых случаях однозначно определить часть речи появляются двойныеаннотации,например,AJ0-NN0(прилагательноеилисуществительноеединственного числа), NN1-WB (имя существительное или глагол), NN1-WZ (имясуществительное или глагол с окончанием -ing), NN1-WG (имя существительноеили глагол, оканчивающийся на -s). При составлении общего подкорпуса именсуществительных учитывались как однозначно определенные имена, так иварианты аннотаций.Другим аспектом отбора были варианты английского языка записанныхречей.
Несмотря на то, что все добровольцы, участвовавшие в записи, былижителями Англии, среди их собеседников попадались носители других вариантованглийского языка и даже других языков (для которых, соответственно,английский не был родным). Так как речь этих двух групп людей не являетсяобъектом данной работы, их высказывания не были включены в исследование.Итогомописанноговышеотборасталасводнаятаблицаименсуществительных (см.
Приложение I), содержащая, помимо слова и его правого илевого окружения, демографические данные о его авторе - пол, возраст,социальныйкласс,роддеятельности,атакжепрагмалингвистическуюинформацию - социальную роль коммуникантов (учитель, друг, сын и т.д.). Всегов таблице было 228063 слов; по классам они распределились следующим образом:AB - 46616, C1 - 41092, C2 - 48353, DE - 29939, класс не указан - 62063.Перед непосредственной классификацией имен существительных наконкретные и абстрактные из таблицы были удалены:93• имена собственные (London, Heathrow Airport);• паузы хезитации (Pass me the erm bread please);• фальстарты (Wha well what? Redca redcu redcurrants, redcurrants,cherry, lemon, vanilla, apricot, strawberry, banana.);• восклицания (Oh god, really?);• междометия (Doo doo doo doo doo doo La la; Hee hee hee hee.
Arghh!);• неверно аннотированные слова3.4 Сравнительный анализ употребления абстрактных существительныхклассами AB, C1, C2 и DEВ результате для анализа были отобраны 36968 словоупотреблений именсуществительных в речи класса AB, 33627 – в классе С1, 30252 – в классе С2 и23912 – в речи класса DE.
Их них отдельно были выделены именасуществительные, обозначающие лицо (например, driver, leader, codger, worker).По справедливому замечанию Л.О. Чернейко, «и имена лица могут бытьохарактеризованы по степени абстрактности/конкретности» (Чернейко 1997, 105);например, в паре «дворник»/ «лидер» первое имя очевидно будет обладатьбольшей конкретностью, так как в сознании большинства людей совпадут егопрототипические признаки (инструменты труда, место работы, возможно, дажевнешний вид и некоторые особенности поведения), тогда как в отношениивторого можно лишь выделить определенные черты, качества, признаки, которые94не могут помочь воссоздать целый образ. Существует ряд классификацийагентивных имен - по тематическим группам (Путягин 1985), по статусам «лица»и связям с орудиями производства, месту работы и др.
(Мигирина, 1980), наосновании словообразовательных признаков (Халилова, 1975), на основе лексикосемантического принципа, базирующемся на системном (полевом) подходе(Ахматьянова, 2000). В связи с этим, представляется необходимым рассматриватьимена, обозначающие лицо (агентивы или указывающие на качества людей илиих связи), отдельно от остальных существительных, поэтому они былиисключены из итогового анализа.
Тем не менее, интересно отметить, чтоколичество этой группы существительных, а также количество их употреблений вречи значительно выше у класса AB.Среди всех полученных в результате выборки лексем были выделеныабстрактныеиконкретныесуществительные,приэтомприменялсяэкстралингвистический подход, т.е. к конкретным существительным былиотнесены слова, имеющие вещные денотаты (например, leg, table, dog). При такомразделении к абстрактным существительным относится широкий спектр слов, отлексем низкой абстрактности (day, light, bit) до более отвлеченных единиц(confusion, exhilariation, literacy).
Для того, чтобы определить место абстрактныхсуществительных в речи современных англичан, важен как количественный, так икачественный анализ; необходимо рассмотреть соотношение абстрактных иконкретных имен существительных в речи обоих классов, а также сравнитьзначимые для классов лексемы.953.4.1 Частотный анализ употребления абстрактных существительныхЧастотаупотребленияабстрактныхсуществительных,атакжераспределение частоты по классам и другим социальным параметрам позволяетувидеть, насколько распространенной является речь представителей различныхсоциальных групп, определить роль абстрактных имен в их речи и выявитьнаиболее употребительные лексические единицы.Прежде всего, рассмотрим соотношение абстрактных и конкретныхсуществительных у представителей четырех социальных классов. В таблицепредставлены общие данные по употреблению существительных:Класс КоличествоКоличествоКоличествоОбщееупотребленийупотребленийупотребле-количествоабстрактныхконкретныхнийупотребленийсуществительныхсуществительныхагентивовсуществительныхAB1691915497455236968C11662315169183533627C21400214867138330252DE12126937124152391259670549049952124526Каквидноизтаблицы,количествоупотребленийабстрактныхсуществительных превышает число конкретных в каждом из рассматриваемыхклассов, составляя, в среднем, 48% всех существительных, тогда как конкретныесоставляют 44%.
По классам доля абстрактных имен распределена следующим96образом: AB – 46%, C1 – 49%, C2 – 46%, DE – 50%. Таким образом, можноутверждать, что абстрактные существительные употребляются в речи достаточночасто. В первую очередь, это связано с необходимостью обозначать связи междулюдьми и предметами, отношение к предметам и явлениям, эмоции и процессы.Тем не менее, приведенная выше таблица содержит информацию только околичестве употреблений существительных в корпусе, не позволяя судить очастотности слов и распространенности речи. Для того, чтобы оценить размерсловарного запаса существительных, из корпуса были выбраны все абстрактные иконкретные имена и был составлен список, в которые вошли 3181 конкретное и2855 абстрактных существительных.