Гладкий - Формальные грамматики и языки - 1973 (947381), страница 65
Текст из файла (страница 65)
0 ПП.З. Окрестности, классы и типы Рассмотренная в предыдущем параграфе система понятий может служить примером анализирующей лингвистической модели. Эта модель описывает некоторые отношения, возникающие между элементами языка в р е ч и (более конкретно — в предложении), или, как говорят лингвисты, «сннтагматические отношения»; модели, описывающие такие отношения, принято также называть синтагматнческими в отличие от парадигм атнческих моделей, описывающих отношения между элементами языка в его с и с те м е — «парадигматнческие отношения». В настоящем параграфе будет рассмотрена одна из анализирующих моделей этого последнего типа, также основанная на понятии замещаемости. Пусть Š— язык в словаре У, р — отношение эквивалентности на У и Π— алфавитный гомоморфизм У' на ( У/р)*.
Пусть, кроме того, р' — некоторое укрупнение р. Мь< будем говорить, что р' есть Ь-р е г у л я р н о е укрупнение р, если любые два р-кчасса, содержащиеся в одном р'-классе, взаимозамещаемы относитель. но 0(Ь). В частности, мы получи>л Ь-регулярное укрупнение р, если будем считать два элемента У эквивалентными тогда и только тогда, когда они содержатся в р-классах, взаимозамещаемых относительно 0(Ц. Такую эквивалентность мы будем называть Е-п р о и з водно й для р; она является, очевидно, наибольшим Ь-регулярным укрупнением р, т.
е. служит укрупнением любого Ь-регулярного укрупнения р. В дальнейших утверждениях Е будет означать язык в словаре У, р, и рг — эквивалентности на У такие, что р, †укрупнен р» и 0» Оь т«т — алфавитные гомоморфизмы У' на (У/р>)*, У" на (У/рг)' и (У/р<)' на (У/р,)' соответственно. Л ем м а ПП. 3. Если рт — Ь-регулярное укрупнение р» то ХЕИО,(Ь) тогда и только тогда, когда цте(Х) ~ е:— Ог(!.). Доказательство. а) Поскольку Ог(Ь) = = т«з(О>(Ь)), из Х ен 0,(Ь) вытекает т«т(Х) ен Оа(Ь). б) Из определения Ь-регулярного укрупнения следует — так как взаимозамещаемость является конгруэнцией,— что если Х, Уен (У/р<)«и т<>т(Х) пм(У), то Х 4=Ь У. Поэтому, если т<гг(Х) = ХыОА(Е) и г — прог,<ь> извольная цепочка из Ь такая, что Ог(г) =т«ь(0<(г)) = = Х, имеем Х 4=Ь О, (г), откуда Х ен 8, (! ), е,<ы Т е о р е м а ПП.З.
Если р, — Е-регулярное укрупнение р„то: а) Х 1> У тогда и только тогда, когда цм (Х) Ф т><г (У)' е,<ы е,<ы б) Х является конфигурацией ранга г язьска 8,(Ь) с результирующим А тогда и только тогда, когда т»т(Х) является конфигурацией ранга г языка От(Е) с резуль. тирующим т<<т(А). Зйб ЗАМЕШАЕМОСТЬ й пп.з) ОКРЕСТНОСТИ, КЛАССЫ Г1 ТИПЫ 327 Доказательство. а) Пусть Х=)зУ, и пусть Хи впы Яз — произвольные цепочки из (У/рз)" такие, что Х,т),з(Х) Хаен 0,(Е).
Если Т„ Т, — произвольные т)„-прообразы цепочек Х, и Хх соответственно, то пш(Т,ХТ,) = = Хзт)~з(Х) Хх, откуда по лемме ПП.З Т,ХТ, ~ 0,(1.); отсюда следует Т,УТзеяОг(Е) и — снова по лемме П11.3— т)аз(Т1УТз) = Х1т)1з(У)Хз ен Оз(1.). Аналогично доказывается, что енз(Х)=)з т)~з(У) влечет Х =)» У. впы впы б) При с=1 утверждение справедливо в силу а), Пусть оно доказано для всех г < г, н пусть Х вЂ” конфигурация ранга г языка О,(Е) с результирующим А. Пусть Хы Яз — цепочки из ()г/рт)', Т„Т, — произвольные их т)ш-прообразы, и пусть прн этом цепочка Х,тнз(Х) Хз принадлежит Оз(Е) и не содержит вхождений конфигураций рангов, меньших г, языка Оз(Е), перекрывающихся с выделенным вхождением т),з(Х), ио не содержащихся в нем целиком. Тогда в силу индуктивного предположения цепочка Т,Х!'з не будет содержать вхождений конфигураций рангов, меньших г, языка 0,(Е), перекрывающихся с выделенным вхождением Х, но не содержащихся в нем целиком; следовательно, поскольку Т,ХТ, ен 0,(Е), имеем Т,АТ, ен О,(1.), откуда Х|тйз(А)Хз е ~ 0,(Е).
Кроме того, в силу а) будет т),з(А) =,='ьт)1з(Х). Итак, в1гс) тъз(Х) есть конфигурация ранга г языка Оз(Е) с результирующим тйз(А). Обратное доказывается аналогично. Л е м м а ПП.4. Если рз — Е-регулярнсе укрупнение р, и рз — Е-регулярное укрупнение р„то рз есть Е-регулярное укрупнение рн Доказательство. Пусть А, А' еп )г/ри С я )г)рз, А, А: — С. Положим т)~з(А) =В, т)ш(А ) =В . Поскольку А: — В и А'~В', пересечения ВДС и В'ПС не пусты и, следовательно, В«=.С, В'~С; поэтому В(=Ф В', ото,, из куда по теореме ПП.З А (=Ф А'. влы Из леммы ПП. 4 немедленно вытекает Т е о р е м а ПП. 4, Если р' — Е-производная эквивалентность для р и р" — Е-производная эквивалентность для р', то р" совпадает с р'.
Рассмотрим теперь эквивалентность, Ентроизводную для равенства. Эта эквивалентность есть, очевидно, не что иное, как взаимозамещаемость относительно Е, ограниченная цепочками длины 1. Для этой эквивалентности мы будем, наряду с записью (О, пользоваться у,ь также обозначением Вь; соответствующие классы эквивалентности будем называть семействам и. Разбиение на семейства, т, е, на классы «синтаксически эквивалентных» ЛЗ-сегментов, представляет собой, видимо, единственную содержательно интересную классификацию слов, точнее, ЛЗ-сегментов, которую можно получить, исходя лишь из языка 1., т.
е. пользуясь только понятием грамматической правильности и не принимая во внимание лексических значений, как мы до сих пор фактически поступали "). Чтобы получить другие классификации, в частности такие, которые могли бы служить в какой-то степени моделями понятий части речи, грамматического рода и т. и., нужно учитывать и лексические значения. А поскольку элементарный символ, т. е. ЛЗ- сегмент, является для нас неразложимой единицей, лексические значения тем более неразложимы, н поэтому нх учет не может означать ничего другого, кроме включения в число исходных данных сведений о том, какие ЛЗ-сегменты отвечают одинаковым лексическим значениям н какие — разным.
Иначе говоря, мы должны считать заданными множества ЛЗ-сегментов, имеющих одинаковые лексические значении, т. е. являющихся «формами одного слова». Эти множества мы назовем о крести остя ми. Примеры окрестностей для русского языка: (физик, физика, физику, физиком, физике, физики, физиков, физикам, физиками, физиках), (пальто), (над) *').
«) Это означает, что злемеитариые символы во всех предыдуших рассмотрениях можно было бы интерпретировать и как сегменты (ср. етр. З)5). Конкретные результаты зависят, разумеется, от выбора интерпретации. Например, сегменту физику отвечают два ЛЗ-сегмеита, скажем а, — с лексическим значением, включающим компонент «иаука», — и аз — с лексическим зиачеиием, включающим компонент «специалист»; в то же время для сегментов химию и химику имеется по одному ЛЗ-сегменту — пусть зто будут Ь и с. Трактуя предложеиия как цепочки ЛЗ-сегмеитов, получим а~ (=) Ь, аз (=Э с, а при отказе от учета лексических значений сегменты физику, химию и химику распределятся по трем разным семействам.
"") Здесь для простоты вместо ЛЗ.еегмеитов выпигаиы сегмеяты; необходимое уточнение очевидно — например, вместо сегмента физику следовало бы взять ЛЗ-сегмеит аз из предыдущей сноски. 328 ЗАМЕШАЕМОСТЬ в пи,з! [П, П ОКРЕСТНОСТИ, КЛАССЫ И ТИПЫ 329 Ясно, что каждый ЛЗ-сегмент принадлежит одной и только одной окрестности. Таким образом, в число исходных данных наряду со словарем и языком должно быть включено некоторое отно[пение эквивалентности на словаре, интерпретируемое как совпадение лексических значений. Это приводит нас к рассмотрению в качестве исходного объекта упорядоченной тройки ( У, Е, Г), где У вЂ” конечное множество (словарь), Š— язык в словаре У и à — эквивалентность на У.
Такую тройку мы назовем лексически размеченным я вы ком; классы эквивалентности по Г будем называть окрестностями и. Для произвольной эквивалентности р на У и произвольного а ее У мы будем обозначать через р(а) тот р-класс, который содержит а. Пусть (У, Е, Г) — лексически размеченный язык. Эквивалентности Вь и Г индуцируют две системы подмножеств словаря У[ систему семейств и систему окрестностей. Определим теперь с помощью тех же эквивалентностей еще две системы подмножеств У[ систему классов и систему типов.
!) Для произвольного семейства о, соответственно для произвольной окрестности у, будем называть к л а ссом, порожденным семейством о (окрести о от ью у), объединение всех окрестностей (соответственно семейств), пересекающихся с о (с у). 2) Классы эквивалентности, Е-производной для Г (эта эквивалентность будет обозначаться Ть г), мы будем называть т и и а м и. Классы, в отличие от типов, не обязаны быть попарно непересекаюшимися множествами. Это, однако, имеет место в одном интересном частном случае, который мы сейчас рассмотрим.
















