Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014) (Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf), страница 3
Описание файла
PDF-файл из архива "Авт. обработка текстов на естественном языке и комп. лингвистика. Большакова (2014).pdf", который расположен в категории "". Всё это находится в предмете "анализ текстовых данных и информационный поиск" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
[108; 109])» [107 : 663].«Наиболее важные черты системы и любого образования в ее составеопределяются функцией. Для чего, для выполнения каких задач существует самасистема, тот или иной ее компонент (подсистема), отдельный элемент — ответ наэтот вопрос является решающим для определения качественной спецификиинтересующих нас объектов.
Функция языковой системы как таковой, как ужеотмечалось выше, заключается в том, чтобы служить средством порождения,хранения и передачи информации. Порядок перечисления «подфункций», заметимсразу же, отражает реальную последовательность процессов: информация сначаладолжна быть порождена, а затем передана — с промежуточным хранением, если этонеобходимо. Что же касается иерархии «подфункций», то главенствующей иопределяющей выступает как раз последняя из перечисленных — передачиинформации, т.
е. коммуникативная.Нелишне подчеркнуть, что язык является именно средством передачиинформации: информация заключена в тексте, а не в языке, а уже текст «построен» сиспользованием языка, языковой системы2. Поэтому характеристики языка впринципе определяются следующим вопросом: чем должен обладать язык, чтобыэффективно обеспечивать продуцирование несущего информацию текста (иизвлечение информации из последнего)?» [108: 664].«Разнообразие способов отражения действительности, присущих конкретныминдивидуумам, потенциально бесконечно ввиду уникальности каждого индивидуума,бесконечно разнообразны и конкретные условия, в которых имеет место процессотражения и, на его основе, формирования информации.
Отсюда следует, что дляпередачи именно той информации, с которой имеет дело каждый индивидуум, вданный момент времени в данной точке пространства требуется бесконечное числонекоторых информационных единиц, бесконечный алфавит, бесконечный код (и,вероятно, бесконечный канал связи). Информация, следовательно, должна быть както модифицирована, ограничена, подвержена своего рода компрессии, чтобы онамогла быть передана (и воспринята).Процедуры компрессии как преобразования информации в принципе могутбыть выполнены по-разному: за счет разных фрагментов подлежащей передачеинформации и присвоению разных весов информационной значимости. Первичнаяпереработка информации с целью сделать ее «пригодной» для коммуникации должнаориентироваться именно на общезначимость передаваемого, на его адекватностьНикак нельзя признать корректными обычные утверждения о том, что система языка «реализуется» в тексте(речи) как абстрактное в конкретном.
Так можно было бы сказать, например, о некотором языке или диалектепо отношению к идиолекту, которые и соотносятся как система с системой по принципу большей/меньшейабстрактности (скажем, русский язык соответствующего периода и язык Пушкина или Горького). Язык и речь(текст) соотносятся, скорее, как «механизм» и «продукт» работы последнего.29задачам, решаемым данным обществом.
Язык возникает и функционирует только вобществе, обслуживает наиболее важные ситуации (с точки зрения общества, в т.ч.некоторой социальной группы). Для языка естественна функция кодирования:преобразовывания информации, чтобы она была коммуницируема. При этоминформация усредняется, обедняется, огрубляется. Компрессия информации (ееогрубление, обеднение) в каждом языке (подъязыке, см. следующий параграф)происходит к тому же по-своему. Язык участвует в порождении информации,является средством не только передачи, но и порождения информации: ведь«окончательный вид», который приобретает передаваемая информация, в известной— и немалой — степени определяется именно языком» [108].§ 1.2.Язык или языки.коммуникацииТекстилитексты.ОсновыречевойКак уже было сказано, язык – средство передачи информации, информациязаключена в тексте (не в языке), текст «построен» с использованием языка, языковойсистемы.
Характеристики языка определяются задачей эффективно обеспечиватьпорождение и анализ текста (извлечение информации из текста), т.е. речевуюкоммуникацию3. Изменяются ли эти характеристики в зависимости от особенностейкоммуникативной ситуации? Коммуникация может быть устной или письменной.Язык, обеспечивающий эффективную устную коммуникацию, не может неотличаться от языка, обеспечивающего письменную коммуникацию. Каждый износителей письменного языка (успешно овладевший письменным языком) может поправу называться билингвом: человеком, владеющим двумя – устным и письменным– языками и умеющим переключаться с одного языка на другой (с одного кода надругой) в зависимости от требований коммуникации.Следующий тезис: информация заключена в тексте (не в языке), но текстстроится и анализируется с использованием языка.
Значит, легко допустить, чтотексты существенно разного типа накладывают свои требования на используемыйязык. Речь идет, прежде всего, о текстах, различающихся по степени и типуинформационной нагруженности: о текстах разных функциональных стилей.Сначала приведем несколько цитат, как принято при опоре на авторитеты.«Функциональнаястилистикарассматриваетфункциональныйстиль(функциональную разновидность языка, функциональный тип речи) как историческисложившуюся, общественно осознанную речевую разновидность, … котораяскладывается в результате отбора и сочетания языковых средств» [105: 43].
Средистилеобразующих факторов выделяются, в целом, те же факторы, что и дляформированиякоммуникативнойситуации:целикоммуникации,сферакоммуникации (и шире – деятельности), функции языка и пр. (см., например, [117;148: 581] и др.). Существенно, что характеристики функциональных стилей«создаются не столько за счет … стилистически маркированных средств, сколько засчет различной частоты употребления тех или иных языковых единиц…» [148:581] и за счет различий в предпочтительной сочетаемости этих языковых единиц.В рамках этих лекций мы не рассматриваем терминологические вопросы, интересующие многихтрадиционных лингвистов: где граница между языком и формой языка, где граница между языком, вариантомязыка и диалектом и т.д. Вместо разнообразия терминов мы используем термин «язык», подчеркивая тем самымтот факт, что разным языкам будут приписаны разные характеристики, позволяющие эффективно обеспечиватькоммуникацию на данном языке в тех или иных коммуникативных ситуациях.310Обычно выделяют следующие функциональные стили (одна из самых грубыхклассификаций): разговорный (бытовой диалог), литературно-художественный,газетно-публицистический (новостной), научный, деловой (официально-деловой).Нас интересует, прежде всего, (1) степень и тип информационной насыщенности,(2) основной тип контекста и (3) жесткость композиционной структуры (двапоследних фактора рассматривается в следующей главе).Вне контекста коммуникативной ситуации текст первого функциональногостиля – разговорного, или бытового диалога, – воспринимается как искаженный(своего рода восприятие в условиях помех).
Основным контекстом для текстовданного типа будет именно контекст коммуникативной ситуации, а контекстсобственно текста занимает до некоторой степени подчиненное положение. Это иесть основное отличие текстов этого функционального стиля. Соотношениеинформационной насыщенности и реализованности в тексте других функций языка(напр., воздействия на адресата, контакто-устанавливающей и контактоподдерживающей функций) зависит от конкретного типа коммуникативной ситуациии текста. В этом смысле этот функциональный стиль «перпендикулярен» основнойшкале функциональных стилей.В качестве основной шкалы мы рассматриваем шкалу степени (и типа)информационной насыщенности.
Два полюса этой шкалы занимают литературнохудожественный vs. официально-деловой стили.Литературно-художественный (художественный) стиль неоднороден с точкизрения своей функциональности, в нем реализуется практически вся палитрафункций языка. Даже исключив из рассмотрения поэтические тексты, сложноединообразно структурировать множество художественных текстов.
Для текстовхудожественного стиля невозможно выделить приоритет именно информационнойнасыщенности (в ущерб, например, воздействию на адресата или эстетическойфункции). Для текстов делового стиля, напротив, безусловен приоритет именноинформационной составляющей. В качестве примеров текстов официально-деловогостиля приведем тексты законов, договоров (тексты, имеющие юридическую силу итребующие однозначного понимания, см. об этом в главе 2).Деловой и научный стили имеют значительное число общих характеристик. Вобоих стилях доминирует информативная функция языка. Однако длятекстов делового стиля в целом характерна более жесткая смысловая икоммуникативная структурированность текста (композиция, структура фрейма).
Языкофициально-делового стиля должен позволить однозначно закодировать идекодировать коммуницируемый смысл текста.Множество научных текстов неоднородно. С одной стороны – этанеоднородность определяется тем, что при общем доминировании информативнойфункции языка в текстах смешанного научного стиля по-разному реализуетсявзаимодействие информативной функции и функции воздействия на адресата:например, в научной публицистике или учебной литературе.