42604 (Дистрибутивный анализ)
Описание файла
Документ из архива "Дистрибутивный анализ", который расположен в категории "". Всё это находится в предмете "иностранный язык" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "иностранный язык" в общих файлах.
Онлайн просмотр документа "42604"
Текст из документа "42604"
РЕФЕРАТ
Дистрибутивный анализ
Оглавление:
1. Введение -------------------------------------------------------------------------- 3
2. Основные допущения и термины -------------------------------------------- 4
3. Приемы дистрибутивного анализа ------------------------------------------ 6
4. Основные этапы дистрибутивного анализа ------------------------------- 8
5. Основные процедуры анализа и типы дистрибутивных отношений 10
6. Дистрибутивные методы в фонологии ------------------------------------ 12
а). Процедуры отождествления I ---------------------------------------------- 12
б). Процедуры отождествления II (собственно фонология) ------------- 14
в). Дополнительные критерии для объединения элементов в фонемы. 15
7. Общие итоги дистрибутивного анализа на фонемном уровне ------- 17
8. Выводы. ------------------------------------------------------------------------- 19
Список литературы --------------------------------------------------------------- 20
Введение.
Одной из узловых проблем общего языкознания является проблема методов лингвистической науки. Преобладание того или иного метода в определенную историческую эпоху может даже определять общий характер развития языкознания.
Сами конкретные методы лингвистических исследований обладают довольно большим разнообразием. Они сильно варьируют в зависимости от характера объекта, цели исследования и выбранного лингвистом аспекта исследования, например, существуют особые методы расшифровки текстов на неизвестных языках, специальные методы исследования фонетических характеристик звуков языка, методы сбора языкового материала в полевых условиях, особые лингвосоциологические методы, методы изучения истории литературных языков и т.д. Словом, чуть ли не каждая область языка может иметь специфические методы, предназначенные для ее изучения.
Выдвижение в качестве предмета изучения структурных свойств языка требует особых методов, значительно более сложных, чем простое наблюдение и классификация единиц речи.
Дистрибутивный анализ как особая методика исследования языка сформировалась в аме6риканской дескриптивной лингвистике. В 40-60-е годы появились многочисленные работы, посвященные описанию отдельных сторон фонетики, морфологии, синтаксиса языков различного строя.
Одним из важных следствий, вытекающих из работ дескриптивистов, является постановка вопроса о моделировании лингвистического исследования. Модели, имитирующие исследовательскую деятельность лингвиста, предназначаются для того, чтобы обосновать выбор основных понятий, которыми он пользуется при построении грамматики или другого описания языка. В идеале они сводят до минимума роль субъективного фактора в исследовании. По сложности проблематики модели такого типа стоят рядом с моделями творческой деятельности и научного поиска вообще. Эти процессы могут рассматриваться как кибернетические процессы обработки информации.
Дескриптивная лингвистика не выдвинула своей концепции языка как предмета исследования. Ее задачи сводятся к описанию структуры плана выражения, который рассматривается в отвлечении от плана содержания. Структура языка анализируется в терминах дистрибутивных отношений (распределений) элементов различных ярусов. Конечный результат исследования заключается в построении компактного описания языка, которое обеспечивало бы понимание и построение любых высказываний на данном языке. Никаких дополнительных ограничений на форму описания не налагается, поэтому допустимы расхождения в результатах анализа у разных исследователей, работающих с одним и тем же материалом. Описания, выполненные с помощью дистрибутивных методов, предназначаются для использования в других лингвистических разделах (сравнительное изучение языков, диалектология и т.д.).
Такое ограничение задач способствовало разработке практических процедур анализа, которые применялись в процессе построения описания. Была сделана попытка изложить дистрибутивные методы как строгую систему исследовательских приемов, которая не имеет аналогии в языкознание предшествующего периода.
Этот опыт, однако, не дал идеальных результатов. Оказалось, что процесс исследования языка является весьма сложным и не допускает полной формализации процедур на всех этапах работы.
Основные допущения и термины.
В качестве общих неопределяемых понятий в дистрибутивном анализе используются следующие:
Универсум речи (анг. - universe of discourse) – объект исследования. Наряду с этим термином в лингвистике принято употреблять и другие: континуум речи, совокупность текстов, корпус; выборка (анг. - sample), представляющая данный язык или его диалект в ограниченном промежутке времени (синхронном срезе).
Конкретный акт речи (к.а.р.) (анг. – act of communication) – любой отрезок речи одного из участников коммуникации, ограниченный с обеих сторон молчанием. Речь состоит из к.а.р., которые являются однократными, происходят в определенный момент времени. Повторяющиеся отрезки речи являются разными к.а.р. (например: снег, снег, снег…). Описать к.а.р. невозможно из-за многообразия случайных моментов, сопровождающих речь индивидуума.
При описании языка выделяют некоторые существенные черты речи, которые влияют на ее содержание. Понятие существенных признаков также неопределяемо. Каждая наука имеет своим представления о том, что существенно.
Лингвист обычно описывает абстрактные акты речи или высказывания (анг. utterance), - освобожденные от конкретных, ситуативных физических признаков, отрезки речи между двумя паузами.
Получение высказываний связано с операцией отождествления к.а.р. по существенным признакам.
Необходимые условия для такого отождествления: сходство содержания к.а.р.; сходство внешних физических признаков звучания к.а.р.. Степень сходства точно не определяется. По-видимому, нельзя отождествить к.а.р. только на основе подобия в смысле (глаза и очи) или только на базе подобия во внешнем звучании (ключ – «источник» и ключ – «инструмент для отпирания замка»).
В результате мы имеем высказывания, которые имеют разные реализации в речи, каждому высказыванию соответствует множество к.а.р..
Термин высказывание соответствует различным текстовым отрезкам: слову, звуку, фразе, предложению.
Принимается фундаментальная гипотеза о том, что непрерывные акты речи (а.р.) делятся на части, называемые сегментами. Высказывание рассматривается как дискретная последовательность отрезков речи, звуковых или морфемных сегментов, цепочек морфем и т.д. Возможны различные способы сегментации текста, повторные операции сегментации на каждом этапе описания. Сегмент – это отрезок речи, вычленяемой в данной последовательности к.а.р..
Понятие сегмента занимает важное место в дистрибутивном анализе. Дескриптивисты строго разграничивают операции сегментирования и последующие операции отождествления сегментов. В этом состоит принципиальное отличие их от традиционной лингвистики, которая обычно не ставит вопроса о сегментации речевого материала. При этом либо безоговорочно принимаются графические и орфографические членения текста, либо процедуры сегментации включаются в само описания и классификацию единиц речи. В методическом отношении оказывается очень важным не смешивать сегментацию с классификацией. При этом подходе допускается гипотетическое расчленение текста, которое в случае неточностей или обнаруженных в последствии ошибочных решений может быть изменено, т.е. может быть проведена пересегментация.
Сегмент противопоставляется элементу. Элемент – это абстрактный сегмент, освобожденный от конкретных ситуативных черт. Элементы определяются путем сопоставления различных отрезков речи, т.е. в результате операции отождествления сегментов по существенным признакам. Элемент – это обозначенный определенным символом сегмент. Так, буквы или транскрипционные знаки используют для обозначения звуковых сегментов. Сегмент принадлежит высказыванию, а элемент – описанию высказываний.
Сегмент и элемент – два важнейших процедурных термина, которые последовательно употребляются на каждом этапе анализа. Остановимся на некоторых дополнительных пояснениях этих понятий:
-
Сегменты – простейшие отрезки, выделяемые при расчленении континуума высказывания на первом этапе анализа текста. Элементы формируются путем объединения эквивалентных сегментов.
Пример: если мы имеем следующие высказывания, расчлененные на звуковые сегменты:
дарога
дорога
дароγа
то можно следующим образом отождествить эквивалентные сегменты:
[дърога]
-
Сегмент есть всегда отрезок текста, принадлежит тексту, элемент же принадлежит описанию, его соотнесенность с текстом опосредована через одну ступень его классификации. Поэтому элемент всегда является сегментом. Обратное же не имеет смысла. Так, в нашем примере [д] = д, [р] = р, [о] = о, [а] = а и другие случаи, когда [ъ] = {а, о}, [г] = {г, γ}.
-
Сегмент можно рассматривать со стороны его состава, его физических признаков (например, взрывность и фрикативность [г]). Элемент не рассматривается по составу, т.к. является цельной единицей.
Аналогично этому сегмент можно рассматривать как часть более сложного сегмента. Элемент обычно рассматривают безотносительно к иерархически более сложным элементам.
В процессе описания многократно осуществляется переход от рассмотрения высказываний как последовательных сегментов к их рассмотрению как цепочек элементов. Шаги перехода можно изобразить на схеме:
к .а.р. высказывание
с егмент элемент
Как видно, движение по циклу (высказывание сегмент элемент высказывание) может проводиться несколько раз. Такая возможность допускается в пределах одного уровня языка, а также при переходе с одного уровня на другой.
Следующее важное понятие – окружение (анг. – environment, position). Окружение элемента – это соседство в акте речи других элементов. Окружения могут быть различными, могут иметь произвольную длину. Так в непосредственное окружение элемента х входят элементы, предшествующие ему (ах, bах и т.д.), или следующие за ним (хс, хсd и т.д.). Полное окружение х включает весь набор элементов в данном высказывании (ахс или bахсd).
Дистрибуция или распределение (анг. distribution) элемента – совокупность всех окружений, в которых он встречается в речи. Дистрибуция представляет собой сумму всех позиций элемента относительно встречаемости других элементов.
О двух (или более) высказываниях или признаках говорят, что они лингвистически, дескриптивно или дистрибутивно эквивалентны, если они идентичны по составу элементов и дистрибутивным отношениям между элементами.
Понятие окружения и дистрибуции коррелятивны между собой так же, как сегмент и элемент. Подобно тому как элементы получаются в результате отождествления эквивалентных сегментов, дистрибуция есть результат типизации всех окружений данного элемента. Процедуры выявления элементов проводятся параллельно с процедурами определения дистрибуций. При этом осуществляется последовательный переход с одного шага анализа на другой и обратно. Учитывая это обстоятельство, можно дополнить схему:
к .а.р. высказывание
с егмент элемент
о кружение дистрибуция
Понятия окружения и дистрибуции при нестрогом употреблении терминов часто смешивают друг с другом и отождествляют.
Однако между понятиями дистрибуции и окружения имеется существенное различие: объектами в анализе окружений являются элементы, связанные конъюнкцией (отношением одновременного вхождения – «и»); объектами в анализе дистрибуции являются сами окружения, связанные дизъюнкцией (отношением выбора – «или»). Так, в приведенном примере непосредственное окружение | д | составляет последовательность # | -ъ |. Это окружение, наряду со многими другими входит в дистрибуцию | д |:
# - ъ | дърога |
# - у | дума |
# - р | драка |
Таким образом, дистрибутивный анализ строится на основе синтагматических отношений между элементами. Однако его результаты касаются выделения классов эквивалентных элементов, т.е. охватывают область парадигматики языка.
Основные экспериментальные приемы, применяемые в дистрибутивном анализе:
Ю.Д. Апресян выделяет следующие приемы:
1) Добавление элементов к данной форме.
Например, в английском языке из-за омонимии предлогов и наречий типа up, in, on и др. довольно трудно решить вопрос о грамматической природе этих элементов. Возьмем два предложения she was brought up by her grandmother - «она была воспитана бабушкой» и she is going up the hill – «она поднимается в гору». Для того чтобы определить, в каком предложении up является предлогом, а в каком наречием, необходимо поставить между глаголом и спорным элементом качественное наречие и проверить, получается ли в результате правильная фраза. Правильность фразы диагностирует предлог (she is going quickly up the hill – «она быстро поднимается в гору»), а неправильность – наречие (she was brought badly up by her grandmother).
-
Опущение элементов из данной формы.
Например, можно опустить косвенное дополнение, которое менее тесно связано с глаголом, чем прямое; прямое же дополнение опускать нельзя: Martin caused me pain - «Мартин причинил мне боль» Martin caused pain - «Мартин причинил боль», но не Martin caused me – «Мартин причинил мне».
-
перестановка элементов данной формы.
Возможность перестановки двух простых предложений в составе сложного указывает на наличие связи сочинения между ними, а невозможность такой перестановки свидетельствует о подчинительном характере этой связи.