И.А. Волкова - Введение в компьютерную лингвистику. Практические аспекты создания лингвистических процессоров (1157208), страница 8
Текст из файла (страница 8)
В этих моделях под семантическим языком понимаетсяа) семантический словарь, в который входит словарь элементарныхсемантических единиц — сем (имен предметов и предикатов), словарьпромежуточныхсемантическихединицисловарьсимволов,характеризующих коммуникативную организацию смысла: тема — рема,старое — новое, выделено — не выделено и т.п.;б) правила образования, по которым из семантического словаря могут строитсясемантические представления высказываний и которые касаются толькоформальной правильности семантических представлений;в) правила преобразования, которые задают синонимичность двухсемантических представлений.Кроме того, для использования семантического языка необходимо иметь наборсемантических аксиом и набор правил семантической «комбинаторики» — правилрасчленения/сочленения семантических представлений при переходе от смысла ктексту и наоборот.Словарная статья каждой словарной единицы С0 должна содержать все слова илисловосочетания, определенным образом связанные с ней по смыслу, а именно:1) ее «парадигматические варианты» или «замены» — языковые средства, которыемогут или должны заменять С0 в тех или иных контекстах и при тех или иныхусловиях;2) ее «синтагматические партнеры» или «параметры» — языковые средства,которые идиоматично выражают при данной словарной единице некоторыесмыслы.Парадигматические варианты и синтагматические партнеры С0 называютсялексическими коррелятами.Зависимости, связывающие слова с их лексическими коррелятами, в моделях«СМЫСЛ⇔ТЕКСТ» предлагается описывать с помощью лексических функций.31Волкова И.А.
Введение в компьютерную лингвистику.Лексическая функция (ЛФ) f описывает зависимость, определяющую для некоторогослова или словосочетания X такое множество слов или словосочетаний {Yi} = f (X), чтодля любых X1 и X2 верно следующее: если f (X1) и f (X2) существуют, то между f (X1) иX1 с одной стороны, и между f (X2) и X2 — с другой, всегда имеет место одно и то жесмысловое отношение.ЛФ вводятся как средство лексической сочетаемости, а не семантики.Полный перечень лексических функций см. в [13], здесь же приводятся лишьнекоторые из них в качестве примера.Syn — синоним: слово, совпадающее с С0 по смыслу, принадлежащее к той же частиречи и имеющее такие же активные валентности;Syn (лингвистика) = языкознание.Conv — конверсив: слово, которое называет то же самое отношение, что и С0, но взятоев «ином направлении», т.е.
с перестановкой тех же актантов в другие места;Conv (бояться) = пугать.Anti — антоним: слово, обозначающее свойство, состояние или действие,«противоположное» свойству, состоянию или действию, обозначенному С0;Anti (друг) = враг, Anti (закрывать) = открывать.Der — синтаксический дериват: слово, совпадающее с С0 по смыслу, нопринадлежащее к другой части речи;Der (искать) = поиск.Gener — название понятия, родового по отношению к понятию, обозначенному С0;Gener (клубника) = ягода.Attr — «атрибут»;Attr (актер) = сцена.Cous — «делать так, чтобы»;Cous (школа) = открывать.Примеры семантических представлений:32Практические аспекты создания лингвистических процессоров.
Учебное пособие.1. Костя обещает Юре, что Боря придет.однократноодновременноэксплицитномомент речиоднократнораньшекаузироватьприходитьКостяЮразнатьРема2Тема1заинтересованБорязависетьТема2Рема12. Иван читает только журналы.ИчитатьИванТемаЖурналыРеманеверноневернобытьсуществоватьчитатьбыть4.3.
Падежные системыСреди АОТ-систем, имеющих семантический компонент выделяются так называемыепадежные системы, в которых семантика предложения описывается как системасемантических валентностей, через связи главного слова с его семантическимиактантами, т.е. через семантические отношения или семантические падежи. Например,33Волкова И.А. Введение в компьютерную лингвистику.глагол «дать» требует семантических падежей дающего (агенса), адресата и объектапередачи.Слабым местом падежных систем является то, что в них, как правило, отсутствуютчеткие определения и критерия выделения падежей, неясна степень полноты их набораи границы между «падежными» и другими элементами предложения.4.4.
Звук и смыслВообще говоря, чтобы правильно использовать слова в разных ситуациях,недостаточно знать значения слов, их словарные толкования. Так, например,обозначающие одни и те же понятия слова «отец» и «папа», «бабушка» и «старуха» вразных ситуациях далеко не взаимозаменимы. Понятийное ядро слов как бы окруженоореолами созначений. Ближайший к ядру ореол — качественно-признаковоезначение слова. Это тот аспект значения, который можно описать путем перечислениякачественных признаков данного понятия.
Например, понятийное ядро слова«птица» — покрытое пухом и перьями животное из класса позвоночных с крыльями,двумя ногами и клювом, а качественно-признаковое значение — что-то быстрое,стремительное. У других понятий на первое место могут выдвигаться другие признаки,например, «слон» — большой и сильный, «любовь» — хорошее, светлое, возвышенное.Зная качественно-признаковое значение слов, можно понять, например, фразу «Онптицей полетел на свидание» или «Что за прелесть!», которая может относиться и кдевушке, и к платью, и к закату, и к цветку…Кроме того, и звуковая форма слов содержательна, информативна, служит одним изаспектов значения.
Звуковая содержательность чаще всего поддерживает, подчеркиваетпонятийный и качественно-признаковый аспекты значения. Соответствие значения извучания делает слово выразительнее, живее, «нагляднее». Ореол содержательностизвучания, или фоносемантический ореол, есть у любого слова, только чаще всего мыего не замечаем.Фоносемантический ореолКачественнопризнаковый ореолПонятийное ядроВообще говоря, в языке информативно, пропитано значением все — звучание речи,отдельные слова и их сочетания, способы соединения слов, устройство предложений,композиция текстов — все от мельчайших звуков до сложной архитектуры всегоздания языка.Оказалось, что самые тонкие и трудно уловимые ореолы значения поддаютсячисловому измерению, а значит, компьютерной обработке.Около 40 лет назад группа американских исследователей под руководством Ч. Осгудаопубликовала сенсационную книгу под заглавием «Измерение значения». Осгуддоказал, что в области семантики возможны измерения, и показал, как их можновыполнить.
С помощью методики Осгуда оказалось возможным измеритькачественный аспект (ореол) значения. Свой измерительный инструмент Осгуд назвал«семантический дифференциал» — это некоторая шкала, например «хорошее —плохое»:34Практические аспекты создания лингвистических процессоров. Учебное пособие.1 – очень хорошее2 – хорошее3 – никакое4 – плохое5 – очень плохое.Шкала предлагается носителям языка — информантам (не менее 50-60 человек),которым предъявляются слова, и они должны поставить словам оценки.
По ответаминформантов вычисляется средняя оценка слова по данной шкале. Например, оценкаслова «дом» по шкале «хорошее — плохое» — 2.2.Чтобы получить полное описание качественно-признаковой ореольной семантикиязыка, надо брать шкалы из всех прилагательных и мерить по ним все остальные словаязыка. Это огромная работа.
К счастью, оказалось, что есть всего три основные шкалы,три фактора, вокруг которых группируются все остальные (т.е. по ним получаютсяпочти такие же значения). Это1. Фактор оценки (хорошее плохое, полезное — вредное, светлое — темное,красивое — безобразное…),2. Фактор силы (сильное — слабое, легкое — тяжелое, большое — маленькое…),3. Фактор активности (подвижное — статичное, быстрое — медленное, активное —пассивное…).А в русском языке выделяется еще один фактор:4. Фактор родокомфортности (нежное — грубое, мягкое — твердое, женственное —мужественное, удобное — неудобное…).Т.е. получается, что качественно-признаковому ореолу каждого слова соответствуетточка в трехмерном (четырехмерном) кубе, и координаты точки можно измерить.
Норабота по составлению такого куба достаточно трудоемка и сопряжена с рядомсложностей.Выяснился поразительный факт, что «семантическим дифференциалом» можно«измерить» и звуки речи. Исследованием проблемы соотношения звука и смысла вРоссии занимается группа ученых под руководством профессора А.П. Журавлева [14].При «измерении» звуков информанты ставили им оценки по тем же признаковымшкалам, которые объединились в те же группы (факторы). В результате выявилисьнепреложные закономерности: О — светлый, Ы — темный, Р — устрашающий, И —безопасный, К — быстрый, Ш — медленный… После измерения всех звуков почетырем шкалам и размещения их в семантическом кубе получилось русское фонетикосемантическое пространство. Имея его компьютер моментально вычисляетфоносемантический ореол любого слова (учитывая частоту встречаемости каждогозвука в речи, ударение и первую букву слова).Конечно же, нет прямой связи между понятиями о предметах, предметами и ихназваниями.
А вот качественный и фоносемантический ореолы, как правило,совпадают. Т.е. у большинства слов значение и звучание находятся во взаимномсоответствии, и опыт показывает, что дисгармония аспектов значения затрудняетфункционирование слов в речи.Вот несколько наиболее ярких примеров вычисления фоносемантического ореола слов:БОГАТЫРЬ — большое, мужественное, сильное, громкое, могучее.ИДЕАЛ— хорошее, светлое, красивое, яркое, доброе.ЛАСКА— хорошее, гладкое.ШУШЕРА — плохое, темное, отталкивающее, низменное, тусклое.35Волкова И.А.
Введение в компьютерную лингвистику.А вот интересное соотношение фоносемантических оценок близких по смыслу слов понекоторым показательным шкалам:2.0быстроелик2.1красивое36ракета2.2лайнер3.1лицо2.5морда2.7самолет3.3рожа3.0 3.1аэроплан3.5медленноерыло харя3.4 3.5отталкивающееПрактические аспекты создания лингвистических процессоров.
Учебное пособие.5. Прагматический компонент ЕЯсистемПрагматика — наука, изучающая язык в его отношении к тем, кто его использует,функционирование языковых знаков в речи.Пропозиция — факт, передаваемый предложением; смысловое содержаниепредложения; семантический инвариант, общий для всех членов модальной икоммуникативной парадигм предложения и производных от предложения конструкций.Пропозиция является пресуппозицией в прагматическом смысле, если говорящийсчитает ее истинность само собой разумеющейся и исходит из того, что другиеучастники контекста считают также.Набор пресуппозиций человека определяется на основании тех утверждений, которыеон делает, вопросов, которые он задает. Пресуппозиции — это пропозиции, неявноподразумеваемые еще до начала передачи речевой информации. Пресуппозиции,естественно, не обязаны быть истинными.
В нормальной ситуации человек, по меньшеймере, убежден в истинности своих пресуппозиций. Именно поэтому мы частоизвлекаем из высказываний данного лица больше информации о его убеждениях, чемон нам сообщает. Иногда, однако, в пресуппозиции может быть пропозиция, вистинности которой мы сомневаемся, или даже про которую считаем или знаем, чтоона ложна. Это происходит в ситуации обмана.Модальность — отношение значения предложения к действительности.Вербализация — речевое выражение чего-либо.Анафора (anaphora (греч.)) — повторение.Анафорический — отсылочный.Номинация (лат. nominatio — наименование) — образование языковых единиц,характеризующихся номинативной функцией, т.е.