42604 (662184), страница 3
Текст из файла (страница 3)
В итоге анализа исходный перечень элементов преобразуется в классы дистрибутивно эквивалентных элементов, производится количественное сокращение списка элементов. Полученные классы рассматриваются как элементы следующего этапа анализа, как единицы вышестоящего уровня структуры. Цикл процедур повторяется снова: данный набор классов проецируется на высказывания, проводится сегментирование текста в терминах новых элементов; затем приступают к анализу дистрибутивных отношений между сегментами и элементами.
Как было показано, два основных шага идентификации связаны с определением разных типов дистрибуции: нефункциональное и функциональное варьирование на первом шаге и дополнительная дистрибуция на втором. Эти шаги соответствуют двум ступеням анализа, осуществляемого в терминах сегментов – элементов и окружений – дистрибуций. Дополнив соотношения между основными терминами, приведенными выше, мы получим общую схему дистрибутивного анализа:
| Объекты языка Объекты метаязыка | Типы дистрибуций |
| К Сегменты Элементы | Свободное варьирование Контрастная дистрибуция Дополнительная дистрибуция |
Принципы дистрибутивного анализа, как показывает их рассмотрение, представляет собой стройную систему операций, осуществляемых в терминах определенного метаязыка. Они описывают процесс лингвистического анализа в виде алгоритма. Именно эта особенность дистрибутивного анализа привлекает внимание специалистов, которые занимаются дешифровкой неизвестных систем письма и языковых кодов. Были сделаны попытки построить машинные алгоритмы выделения гласных и согласных в тексте на основе дистрибутивных признаков в сочетании со статическими.
Различают четыре типа дистрибуций, эти отношения можно представить рисунками:
1
Дополнительная дистрибуция.
В такой дистрибуции находятся варианты одной фонемы: каждый из них встречается лишь в тех позициях, в которых не встречается другой. Например: в русском языке фонемы [ы] и [и].
2
Контрастная дистрибуция. В такой дистрибуции находятся варианты разных фонем. Например: в русском языке [а] и [о] в словах ток и так, том и там, сон и сан – совпадающие части дистрибуции (на схеме – часть, образованная пересечением кругов); он, вон, кто с одной стороны, и Анна, ванна, стена – с другой стороны, - несовпадающие части дистрибуции.
3
Дистрибуция свободного варьирования. В подобной дистрибуции находятся свободные варианты одной и той же фонемы, например: було[ч]ная и було[ш]ная.
4
Дистрибуция частичной эквивалентности. В подобной дистрибуции находятся, например, русское взрывное [г] (на схеме – большой круг) и русское фрикативное [γ] (меньший круг), т.к. в норме русской речи оно может быть свободным вариантом взрывного [г] лишь в части окружений последнего – в словах Бога, благо и производных от них.
В дистрибутивном анализе формальные процедуры занимают весьма скромное место. Как следует из вышеприведенной схемы анализа, начальные операции сегментирования носят произвольный характер. Обращение к неявным сведениям о языке, которые лингвист привлекает извне (пользуясь интуицией или дополнительными данными о тексте), допускается на каждом этапе описания.
Дистрибутивные методы в фонологии.
Корпус материала предстает вначале как непрерывный поток конкретных актов речи. К.а.р. – это последовательности (цепочки) звуковых сегментов. Границы сегментов произвольны, поскольку у нас нет средств для указания, как точно разделить поток звуков на отрезки, которые в дальнейшем соответствовали бы его членению на фонемы. Последующие процедуры будут изменять эту сегментацию до тех пор, пока границы сегментов не совпадут с границами отдельных фонем.
ПРОЦЕДУРЫ ОТОЖДЕСТВЛЕНИЯ I.
Эти процедуры применяются, чтобы установить лингвистическую эквивалентность или неэквивалентность звуков-сегментов и перейти от уникальных неповторяющихся сегментов к меньшему числу элементов. Вначале рассматриваются пределы вариативности (различности) отдельных звуков в повторяющихся высказываниях. Имея запись какого-то высказывания, разделенного на сегменты, можно повторить его снова и записать. Говорят, что каждый сегмент одного повторения свободно подставляется вместо соответствующего сегмента другого повторения, или является его свободным вариантом.
Если высказывание АВС есть повторение высказывания А’В’С’, тогда А ~ А’, В ~ В’, С ~ С’.
После этого эксперименты с субституцией звуков проводятся в различающихся высказываниях. Например, проверим, можно ли подставить | б | из бутыль на место | б | в булка. Повторное произношение этих высказываний с заменой звуков будет подобно первому их произношению.
В общем случае берем высказывание с сегментами DEF, конструируем высказывание, составленное из DA’F, где А’ есть повторение А из некоторого высказывание АВС. Если информант воспринимает DA’F, как повторение DEF и если можно также построить E’BC (Е’ есть повторение Е), эквивалентное АВС, тогда А и Е (и А’ и Е’) взаимоподставимы, т.е. являются свободными вариантами друг друга (A ~ E).
Для Дескриптивного анализа важно установить не только эквивалентность некоторых сегментов друг другу, но также определить и неэквивалентность, неподставимость сегментов. Эксплицитно описать различия не менее важно, чем описать сходство, а чтобы иметь средства для различения одних высказываний от других, необходимо определить систему различительных элементов для многих высказываний. Так, чтобы различать дом, дол, дел, мы должны знать несколько различительных признаков между неэквивалентными высказываниями (дом отличается от дол третьим элементом, а от дел - вторым и третьим).
Представление речи как последовательности или аранжировки отдельных элементов связано с выделением звуковых различий между парой неэквивалентных высказываний.
Анализ пар неэквивалентных высказываний оказывается важным при установлении неэквивалентных звуков-сегментов. В особенности надежное определение разных звуков дают так называемые минимально различающиеся пары высказываний типа (дом : том), отличительными признаками которых являются одиночные звуковые сегменты. Эти сегменты | д | и | т | в данном случае имеют одинаковые окружения. Однако подстановка одного из них на место другого приводит к контрасту смысла, т.е. невозможна. Контрастирование смыслов высказываний свидетельствует о том, что различение | д | и | т | существенно для русского языка, т.е. что данные сегменты не эквивалентны, а различны.
В итоге определения эквивалентности и неэквивалентности сегментов получаем классы звуков-сегментов, или фонемные элементы. Случаи свободного варьирования исключены в данном перечне фонемных элементов. Так, если признаны эквивалентными высказываний |дарога | и | дароγа |, то соответственно перестают различаться звуки-сегменты | г | и | γ |. Они получают единое обозначение в виде фонемного элемента | г |. Приведем другие пары сегментов, которые могут считаться свободными вариантами. В русском языке допускается параллельное произношение слов | тэрмос | и | т’ермос |, | критэрий | и | крит’ерий | и т.п. Эти различия носят стилевой характер и не затрагивают смыслового содержания слов, ими можно пренебречь в целях компактного описания текстов. Тогда необходимо признать следующие эквивалентности: | т | ~ | т’ |, | э | ~ | е |. Такое «уравнивание» звуков имеет место только для данных высказываний, а не для любых их употреблений. Так | т | и | т’ | в тапка и тяпка невозможно считать эквивалентными.
Таким образом, получив перечень фонемных элементов, можно перезаписать исходные высказывания, устраняя несущественные для дальнейшего анализа различия звуковых признаков в эквивалентных актах речи. Все высказывания теперь расчленены на фонемные элементы, в каждом из них ровно столько единиц, сколько необходимо для различия высказываний, не являющихся повторениями друг друга, и не более.
Наряду с фонемными элементами, имеющими природу линейных сегментов, в высказываниях выделяются суперсегментные элементы. Такие звуковые черты речи, как тон, последовательность ударений, интонация, рассматриваются как «вторичные фонемы», «просодемы» (анг. contours). Они как бы размазаны по всей длине высказывания. Дистрибутивные методы выявляют эквивалентность высказываний по суперсегментным признакам безотносительно к их сегментному составу. Так парные высказывания с одинаковыми сегментами могут быть различными по смыслу и суперсегментным элементам: Он идет? : Он идет. Для каждого языка определяется весь набор просодем, каждая из них обозначается определенным символом | ? |, | ! |, | , |, | . | и т.д. и записывается после фонемных элементов.
ПРОЦЕДУРЫ ОТОЖДЕСТВЛЕНИЯ II (СОБСТВЕННО ФОНОЛОГИЯ)
Имея в качестве данных высказывания, записанные как цепочки элементов, переходим к рассмотрению их сочетаемости. Задача состоит в изучении закономерностей появления фонемных элементов в тексте и нахождении дистрибутивно эквивалентных элементов, которые можно сгруппировать в классы.
Представление актов речи в виде элементов и «просодем» имеет недостатки:
-
Каждый элемент характеризуется конкретными ограниченными окружениями,
-
Количество элементов велико.
Необходимо найти способы для типизации элементов и сокращения тем самым их первоначального числа. Условием для этого является выявление дополнительной дистрибуции.
Подготовка процедуры состоит в установлении окружений элементов и их суммировании.
Рассмотрим эти процедуры на примере. Пусть даны следующие высказывания: | разб’ила |, |бы |, | был |, | быт |, | б’ит’ |, | иба |, | л’уб’и |, | б’иб’и |, | двугорбый |, | падоб’ийе |. Определим окружения элементов | и | и | ы |. Для удобства рассмотрения выпишем все непосредственные окружения в таблицу №1.
табл. №1
Элементы | Окружения | |||||||||
| б’- л | б-# | б - л | б - т | б’- т’ | # - б | л’- б’ | б’- б’ | б - й | б’- й | |
И | + | | | | + | + | + | + | | + |
Ы | | + | + | + | | | | | + | |
Сочетаемость элемента с окружением отмечается знаком + на пересечении строки и столбца. Как видно, число окружений велико. При расширении исходного списка высказываний это количество будет возрастать. Поэтому имеет смысл выявить характерные черты окружений и представить их в более компактном виде.
Просматривая окружения, легко заметить общие признаки их компонентов: наличие мягкости или ее отсутствие. По этим признакам все элементы в окружениях сгруппируем следующим образом: сгруппируем в один ряд мягкие, введя символ класса мягких С’, и все «немягкие» объединим во второй разряд С. С’ = {б’, т’, л’, й}, С = {б, т, л}. Тогда таблицу № 1 можно преобразовать в таблицу № 2.
табл. №2
| C’ - C | C - # | C - C | C’ – C’ | # - C | C – C’ | |
И | + | | | + | + | |
| Ы | + | + | + |
Отождествление некоторых окружений по признакам мягкости\твердости привело к сокращению их числа с 10 до 6.
Продолжим наш анализ окружений. Обращаем внимание на то, что не все члены окружений одинаково существенны для выбора элементов | и | и | ы |. Так, последующие элементы не диагностируют выбор, ср. | и | появляется перед –с и –с’, также и | ы |. Напротив, предшествующие элементы определяют правила выбора гласных. Учитывая это, можно представить окружения только в составе диагностических признаков, исключив постпозитивные члены. Это показано в таблице № 3.
табл. № 3
| - C’- | - C - | # - | |
| И | + | + | |
| Ы | + |
Таким образом, упорядочения списка окружений приводит их к компактному виду. Теперь можно перейти к анализу дистрибуций элементов.
Таблица № 3 показывает, что дистрибуции | и | и | ы | дополнительны друг относительно друга: | и | встречается в таких окружениях, где не появляется | ы |, и наоборот. Отсюда следует, что | и | и | ы | находятся в отношении дополнительной дистрибуции. О таких элементах говорят, что их дистрибуции не пересекаются (в дистрибутивной таблице нет таких столбцов, в которых обе строки были бы заполнены знаком +). В общем виде дистрибутивная таблица имеет вид:
X - | Y - | |
| a | + | |
| b | + |
Элементы a и b не встречаются в одинаковых окружениях (X или Y), их окружения не пересекаются. По критерию дополнительной дистрибуции элементы объединяются в единый класс, который считается элементом следующего шага описания. Для обозначения классов фонемных элементов используем прописные буквы: И = {| и |, | ы |}.
.а.р. высказывание














