42604 (Дистрибутивный анализ), страница 2

2016-07-31СтудИзба

Описание файла

Документ из архива "Дистрибутивный анализ", который расположен в категории "". Всё это находится в предмете "иностранный язык" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "иностранный язык" в общих файлах.

Онлайн просмотр документа "42604"

Текст 2 страницы из документа "42604"

Им можно, а вам нельзя Вам нельзя, а им можно.

НО: Она подумала, что собака убежала Собака убежала, что она подумала.

  1. Субституция (замена) элемента другим элементом.

Для построения классов (частей речи, словоформ) используется принцип субституции: два элемента входят в один класс, если они способны замещать друг друга в одних и тех же окружениях без нарушения правильности данной фразы. Два элемента x1 и x2 считаются эквивалентными, если для любой правильной фразы вида A1x1A2 существует правильная фраза вида A1x2A2, и наоборот.

В зависимости от того, что считается элементом, окружением элемента и правильной фразой, субституция дает более или менее дробные классы: чем ближе к текстовой единице элемент и его окружение и чем жестче ограничения на правильность фразы, тем более дробными получаются классы. Например, возьмем фразу я читаю книгу. Здесь x1 является слово читаю, которое мы можем заменить на слова беру, открываю и т.д., т.е. на x2: я беру книгу; я открываю книгу.

Аналогично мы можем заменить x1 на x2 и в словах: т…м ( вместо многоточия мы можем поставить или о, или а и т.д.)

В классической дистрибутивной лингвистике в качестве элементов рассматриваются основы, их окружением считаются грамматические морфемы или классы основ и грамматических морфем, а на правильность фраз налагаются жесткие ограничения.

При замене одного элемента другим нельзя забывать о согласовательной связи: это любая синтаксическая связь между существительным и согласуемым словом, при которой форма согласуемого слова зависит от выбора существительного или от формы, в которой оно стоит. Помимо атрибутивной и предикативной связи, к этому типу синтаксический связи относятся а) связь через предлог из (один из людей, но одна из девушек);

б) связь через глагол (эту затею считают безнадежной, но это дело считают безнадежным);

в) связь со словом «который» в придаточном предложении (дело, в котором, но статья, в которой) и др.

Таким образом, через согласовательную связь определяется ключевое понятие согласовательного класса, т.е. такая совокупность существительных, что любые два ее члена, будучи взяты в любой грамматической форме, требуют при любом типе согласовательной связи одной и той же словоформы любого согласуемого слова.

  1. Метод непосредственных составляющих (НС).

Метод НС используется для получения синтаксической информации.

Метод НС основан на следующих содержательных допущениях: 1) существенную роль в синтаксической структуре предложения играет одно единственное отношение – отношение подчинения; 2) предложение не собирается непосредственно из словоформ, но строится последовательно, иерархически: элемент, его части соединяются в простые, «строительные» блоки, из этих блоков строятся более крупные блоки, пока все предложение не будет представлено в виде единичного блока; 3) верхом иерархии является сказуемое, или группа подлежащего и сказуемого.

В ходе анализа устанавливаются как единичные предложения, так и отношения между ними.

Для дальнейших определений, Ю.Д. Апресян вводит понятие ранга. Пара символов XY является синтагмой первого ранга, если в любой содержащей ее правильной конструкции она может быть заменена без нарушения правильности конструкции символом Y, а Y заменен парой XY. Возьмем предложение

Моя подруга купила очень красивое платье

An Nn V D Aa Na

В данном примере синтагмой первого ранга можно считать пару символов DAn (очень красивое платье), которую можно заменить на An (красивое платье). Синтагмой n-ого ранга называется пара символов XY, если в любой правильной конструкции, где X не входит в состав синтагмы (n – 1)-го ранга, она заменима символом Y, и наоборот. X и Y – непосредственные составляющие синтагмы, причем Y – ядро, X – зависимый элемент. Благодаря этому можно установить синтаксические связи между словоформами и иерархию связей. В приведенном выше примере синтагмами являются AnNn, DAa, NnV и др., причем главным является 2-ой элемент, а зависимым – 1-ый. Каждая синтагма по своим внешним синтаксическим свойствам эквивалентна ядру, взятому в отдельности. Анализ по НС называется свертыванием:

D Ax Ax

Ax Nx Nx

Результирующий элемент предыдущей синтагмы является НС следующей синтагмы, т.е. более простая синтагма может вкладываться в более сложную, выступая в качестве НС последней.

Существует несколько правил свертывания по НС: 1) одновременно можно свертывать не более двух символов в один новый; 2) запрещается перестановка символов; 3) порядок применения правил фиксирован.

Весь процесс анализа предложения (свертывания по НС) может быть изображен тремя способами: в виде правил подстановки, в виде скобочной записи и в виде дерева НС.

Однако эта модель имеет много недостатков: 1) в ряде случаев приводит к грубейшим решениям, поскольку не дает возможности фиксировать различия в синтаксической структуре предложений. Возьмем два предложения:

Изучение событий становится интересным

Р азвитие событий становится интересным.

В первом случае события являются объектом некоторого действия, во втором же – события являются субъектом действия (они сами развиваются). Анализ по НС не вскрывает этих структурных различий. 2) метод НС не показывает связи между активными и пассивными, утвердительными и отрицательными, утвердительными и вопросительными конструкциями, которые связаны отношением производности. 3) с трудом поддаются анализу экзоцентрические конструкции, конструкции с так называемыми разрывными морфемами и конструкции с аппозитивными элементами вида товарищ Иванов, князь Андрей и др. 4) по настоящему эффективной эта модель является только в рамках простого предложения. 5) не дает возможности ответить на вопрос, что является элементарной единицей языка на синтаксическом уровне.

Основные этапы дистрибутивного анализа.

I. Долингвистический этап.

Исходные данные здесь – к.а.р. как физические процессы. Их части имеют физические признаки в каждый данный момент времени (характеризуются амплитудой, частотой и т.д.).

В качестве внешнего понятия используются существенные признаки к.а.р. и одинаковость содержания.

Основные операции на этом этапе: а) сегментирование а.р. на фонологические сегменты; б) классификация сегментов по существенным, смыслоразличительным признакам.

Результат – выделение фонемных элементов как классов конкретных фонологических сегментов.

II. Фонологический этап.

Элементы описания: символы фонологических элементов.

Исходные данные: высказывания, представленные как цепочки фонемных элементов.

Внешнее понятие: физическое сходство фонемных элементов.

Операции: классификация фонемных элементов по критерию дополнительной дистрибуции и физическому сходству.

Результат – выделение фонем как классов фонемных элементов (аллофонов).

III. Морфемный этап.

Элементы: символы фонем.

Исходные данные: высказывания как цепочки фонем.

Внешние пон6ятия: связь цепочки фонем с содержанием (наличие значения) и одинаковость значения.

Операции: а) сегментация – выделение морфемных сегментов как цепочек фонем (минимальных, имеющих значение); введение фиктивных морфемных элементов (для устранения неправильностей и исключений);

б) классификация морфемных сегментов по тождеству состава фонем и по дополнительности.

Результат: выделение морфем как классов морфемных элементов. Их очень много, больше, чем фонем, но теперь они связаны с содержанием.

IV. Морфосинтаксический уровень.

Элементы: символы морфем.

Внешне понятие: грамматическая правильность высказывания.

Операции: а) классификация морфем по взаимной подставимости в любых высказываниях без изменения их грамматической правильности.

б) группировка по критерию дополнительности.

Результат: Выделение класса морфем как множества эквивалентных морфем.

Количество элементов уменьшается за счет эквивалентности корневых и других морфем.

V. Синтаксический уровень.

Элементы: символы классов морфем.

Исходные данные: высказывания как цепочки классов морфем.

Внешнее понятие: фраза в данном высказывании или другой фразе.

Операции: а). Сегментация на фразы, т.е. цепочки классов морфем.

б). Классификация цепочек классов морфем по их взаимозаменяемости во всех высказываниях, где они являются фразами, без изменения грамматической правильности высказываний

в). Выписывание синтаксических уровней.

Результат: Синтаксические уравнения и результирующие классы.

В соответствии с этими этапами описания лингвистическая структура плана выражения складывается из элементов 4-х ярусов:

Синтаксический ярус – позиционные классы и их цепочки.

Морфосинтаксический ярус – классы морфем и их цепочки.

Морфемный ярус – морфемы.

Фонемный ярус – фонемы.

Каждый уровень имеет свой перечень элементов и дистрибутивных отношений между ними.

При переходе к каждому следующему уровню описания сохраняется возможность однозначного возврата к элементам предыдущего уровня. Или, имея высказывание, представленное через элементы некоторого уровня, можно восстановить его представление через элементы предыдущего уровня. Для этого применяются дополнительные данные, получаемые на каждом очередном этапе анализа.

Дистрибутивный анализ представляет собой целостную систему методов описания.

На каждом уровне:

1). Определяется форма получаемой части описания или форма записи, представления классификации.

2). Указывается вид процедуры:

а) выявление элементов на основе внешних понятий,

б) способы классификации,

в) способ получения синтаксических уравнений;

3). Даются практические рекомендации и рецепты, как проводить анализ:

а) интуитивные пояснения на конкретных примерах по аналогии,

б) значение критерия экономности и простоты получаемого описания.

Основные процедуры анализа и типы дистрибутивных отношений.

Эмпирически данным материалом для дистрибутивного анализа является конкретные акты речи. Практически лингвист имеет дело с абстрактными актами речи, или высказываниями, которые получаются путем элементарного отождествления к.а.р. Процесс анализа сводится к двум основным процедурам, последовательно повторяющимся после завершения каждого этапа обработки данных. Это операции сегментирования и идентификации, или отождествления.

Эти операции противопоставляются друг другу: первая носит неформальный, или полуформальный характер, вторая является формальной. Иногда процедуры сегментирования рассматриваются на долингвистическом этапе обработки текста, к собственно лингвистическому этапу относятся процедуры идентификации.

Исследуемый материал дан нам в виде непрерывного речевого потока, или связного текста. Начальный этап анализа состоит в расчленении его на сегменты определенного типа, например звуковые отрезки. Процедуры сегментирования носят произвольный характер, членение может начинаться от произвольной точки в потоке речи. Механизм и правила сегментации не описаны формально. Здесь нельзя предложить определенного рецепта, можно только высказать некоторые рекомендации «как взяться за дело». Поэтому операции сегментирования занимают особое место в анализе, для них не создана какая-либо теория.

Собственно лингвистический этап начинается с процедур идентификации, которые проводятся последовательно за два шага.

Вначале исходные данные должны быть представлены в виде высказываний, расчлененных на сегменты. Задачи анализа на этом шаге состоят в отождествлении сегментов, сведении их в эквивалентные классы. С этой целью рассматриваются дистрибутивные отношения между разными сегментами. Возможны два типа отношений – эквивалентность и неэквивалентность.

Два сегмента считаются эквивалентными, если они выступают как свободные варианты друг друга, т.е. допускают взаимозамену, не изменяя содержания высказывания. Этот тип дистрибутивных отношений обычно называют отношением свободного варьирования или нефункциональным варьированием.

Примеры свободного варьирован6ия звуков: | г | и | γ | в высказываниях | дарога | и | дароγа |,

| бога | и | боγа | и т.д.

Отношение свободного варьирования представляет собой простейший вид эквивалентности, дистрибутивную эквивалентность «первой степени». На первом шаге анализа устраняется свободное варьирование сегментов, такие сегменты сводятся к одному элементу и в дальнейшем перестают различаться.

Противоположный тип отношений – неэквивалентность – имеет место при контрастной дистрибуции (анг. contrastive distribution) или функциональном варьировании. Два сегмента находятся в отношении контраста, если они встречаются в минимально различающихся парах высказываний. Например, | д | и | т | в дом : том. Варьирование звуков в таких парах высказываний сопровождается изменением их смысла (имеет место ковариативность звучания и значения). Такие звуки не допускают взаимозамены без изменения содержания высказываний. Они безусловно неэквивалентны друг другу и должны быть отнесены к разным элементам.

На втором шаге анализа исходные данные, высказывания представлены в виде последовательностей элементов. Задачи теперь сводятся к рассмотрению отношений между элементами с целью выделения классов эквивалентных элементов. На этом этапе мы обнаруживаем более сложный тип дистрибуции – дополнительную дистрибуцию (анг. complementary distribution). Отношения дополнительной дистрибуции связывают два (или более) таких элемента, один из которых встречается в таком окружении, где не встречается другой, и обратно, второй встречается в таком окружении, где невозможен первый. Оба элемента рассматриваются как позиционные варианты одного и того же класса элементов, для которого устанавливается суммарная дистрибуция. Например: | а | и | ’а’ | в мат – мять.

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5209
Авторов
на СтудИзбе
430
Средний доход
с одного платного файла
Обучение Подробнее