41693 (Лингвистическое обеспечение искусственного интеллекта), страница 4

2016-07-31СтудИзба

Описание файла

Документ из архива "Лингвистическое обеспечение искусственного интеллекта", который расположен в категории "". Всё это находится в предмете "иностранный язык" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "иностранный язык" в общих файлах.

Онлайн просмотр документа "41693"

Текст 4 страницы из документа "41693"

Р. Шенк указывает, что вычислительная лингвистика – это «проблема наделения машин способностью общаться с человеком на естественном языке. Наш метод состоит в том, чтобы попытаться понять, как люди общаются друг с другом, и исследовать эти процессы». Н. Черконе пишет: «Вычислительная лингвистика должна построить общую теорию понимания естественного языка в качестве основы для таких программ ЭВМ, которые понимают естественный язык».

По мнению Томпсона, теоретическая вычислительная лингвистика представляет собой попытку охарактеризовать природу языка с точки зрения «лингвистических вычислений» – процедур над речью, аналогичных тем, которые выполняются по ходу собственно вычислительных работ. В американской вычислительной лингвистике на сегодняшний день было предложено несколько концепций теоретической вычислительной лингвистики: «функциональная грамматика» М.Кея [M.Kay 1979], «когнитивная грамматика» [Lakoff, Thompson 1975], «лексическая функциональная грамматика» [J.Bresnan ed. 1982] и др.

Обработка естественного языка (ОЕЯ)


Область построения систем, обрабатывающих (или «перерабатыващих») естественный язык, точнее было бы назвать переработкой речи (текстов) на естественных языках. Эта область, в том виде, какой она приобрела в последние годы, занята построением и проверкой концепций (и технических их воплощений) общения с ЭВМ на естественном языке. В частности, сюда относится задача построения таких программ для ЭВМ, которые позволяют организовать диалог с ЭВМ. В отличие от задачи «распознавания устной речи», где решается проблема акустического распознавания сигналов, ОЕЯ занимается операциями более абстрактного, более символического порядка: операциями над значениями и логическим выводом, необходимыми для распознавания речи.

Объектом ОЕЯ обычно считается текст. В системе же, претендующей на перспективность, ставится задача не просто распознать этот текст, а выяснить те обычно скрытые движущие силы, которые его сформировали. Напомним, что текст в его становлении называют дискурсом.

Система обработки текста, по Фридману, решает две проблемы: 1) выясняет истоки информации, из которой «композиционным» путем может быть выведена конкретная семантическая информация для каждого отдельного предложения текста (т.е. выявляет семантику предложения исходя из структуры целого текста), и 2) устанавливает роль и функции этой информации высокого порядка в рамках целого дискурса.

Вообще говоря, система ОЕЯ должна: а) планировать высказывания, необходимые для достижения конкретных коммуникативных целей, что находится в зависимости от знаний, мнений и намерений пользователей такой системы, и б) распознавать в высказываниях пользователя те планы, которые могут быть сообщены в результате нескольких высказываний или которые, по замыслу пользователя, могут быть логически выведены из презумпций общающихся сторон (человека и ЭВМ). Один из возможных путей достижения этого – следующий цикл:

1. Рассмотреть текущее высказывание (предложение).

2. Основываясь на наклонении этого предложения (повествовательное, вопросительное, повелительное), приписать эффект высказывания намерению пользователя.

3. Используя алгоритмы распознавания, а также базу общих презумпций, вывести, если это возможно, каким образом наблюдаемые действия укладываются в план достижения цели, которую, как ожидается, преследует пользователь. Если этот план не может быть однозначно выявлен, выработать цель системы, направленную на вскрытие цели пользователя.

4. Выработать задачи системы для тех целей, которые пользователь намеревался активизировать в системе.

5. Используя частные (т.е. не общие) презумпции, определить препятствия, которые могут помешать осуществлению планов пользователя, а также пункты, в которых пользователю потребуется помощь.

6. Принять отрицания для некоторых из препятствий в качестве целей системы.

7. Пользуясь частными презумпциями, построить план достижений целей системы, особенно целей для преодоления препятствий для пользователя. В зависимости от этих целей план может включать в себя такие коммуникативные действия, как вопросы, проясняющие намерения пользователя.

8. Выполнить результирующую последовательность действий.

9. Перейти к пункту 1.

Разумеется, этот цикл не обладает статусом идеала: это скорее пример того, в каких терминах могут формулироваться общие планы построения системы обработки естественного языка. Более узко ставится проблема в том направлении, которое связано с именем Р.Шенка: 1) отображение предложений в их смысловое представление; 2) хранение в памяти и осуществление умозаключений относительно полученного смысла; 3) перевод смыслового представления на естественный язык. Основные режимы работы в этом направлении – перифразирование и умозаключение.

Необходимо учитывать то, что ОЕЯ с помощью ЭВМ («искусственная ОЕЯ») отлична от ОЕЯ человеком (т.е. «естественной ОЕЯ») в следующих отношениях:

а) последняя не может ограничиться анализом и синтезом вне контекста ситуации во всех ее деталях;

б) последняя не только преодолевает неоднозначности естественного языка, но и эксплуатирует их в своих целях.

Языковой процессор, разрабатываемый коллективом Р.Шенка, функционируя в интерактивном режиме, должен находить наиболее вероятную для данного предложения интерпретацию, а не просто выявлять все возможные способы истолкования предложений: человек обычно не замечает тех неоднозначностей в тексте, которые чересчур скрупулезная система обработки естественного языка способна, в принципе, выявить. Анализ происходит пословно, от начала к концу предложения, в результате однократного, а не многократного «прохода» по предложению: обычно же число проходов достигает пяти. Кроме того, система обработки естественного языка обладает знаниями о мире в той мере, какая необходима для решения проблем анализа.

Система ОЕЯ, разумеется, – не самоцель. Ее задачи упорядочены и определяют «уровни ОЕЯ». Так, неязыковым целям подчинены процедуры, направляющие любой вид ОЕЯ; этим процедурам, в свою очередь, подчинен уровень речевых актов (при интерпретации или порождении отдельных высказываний). Самый низкий уровень составляют процедуры собственно языковой обработки (языковой анализ).

Общими для предложенных систем ОЕЯ являются следующие компоненты: ЕЯ -> ФР -> ИНТ -> СОД -> БД. А именно, естественно-языковой вход (ЕЯ) переводится в форму репрезентации (ФР) знаний; интерпретатор (ИНТ) устанавливает связь между репрезентацией для положений дел в (ФР) и, посредством языка системы обработки данных (СОД), банком данных (БД). В рамках этих систем операции, связанные с обработкой текста («лингвистические вычисления» обладают различными свойствами; анализ проведенных на сегодняшний день разработок показывает скорее не то, в чем они состоят, а то, чем эти операции не являются: они работают не исключительно аддитивно, не исключительно одна за другой (последовательно), не исключительно на микроуровне и не статистическим образом.


История ОЕЯ

Предыстория ОЕЯ определена многими факторами, из которых можно выделить в особенности два: 1) попытки моделирования нейронов в виде логического устройства, связанные с именами МакКаллоу и Питтса; 2) зарождение «информационной» парадигмы – взгляда на числа и на текст как на то, что представляет общее понятие «информации» (Шеннон), обладающее количественными характеристиками, со всеми вытекающими последствиями для математической теории информации. Понятие «информативность» принадлежит указанной парадигме.

Собственно же историю ОЕЯ иногда представляют как состоящую из трех этапов:

1. Начало 1950-х – начало 1960-х годов. Идея «информации» привела к концепции «машинного перевода» как установления той информации, которая скрыта за предложением на естественном языке, и выражения ее на другом – целевом языке. Язык информационного содержания был назван «языком-посредником». На этом этапе была введена и идея эвристического поиска, а также языка программирования для решения задач ОЕЯ (наиболее популярным языком, начиная с этого времени, был ЛИСП, введенный и описанный впервые в работе.

2. «Эпоха обработки семантической информации» (примерно 1962-1973 гг.). Ее основные идеи: а) необходимо использовать ограниченные содержательные области для моделирования ОЕЯ; б) следует построить как можно больше систем для обработки ограниченных подъязыков, присвоив этим системам статус «экспертов» в таких областях, а затем объединить все эти системы в одну, в рамках «крупного эксперта», определяющего, какой из подчиненных должен начать работать на конкретном этапе обработки, при решении конкретной задачи – концепция «крупного переключения»; в) использование «ключевых слов», управляющих выбором конкретных действий по ходу обработки текста; г) перевод естественного языка на формальные языки (некоторые из формальных языков при этом обладают собственными исчислениями, типа исчисления предикатов формальной логики; имеются языки поиска в базе данных. Эту эпоху иногда называют эрой «инженерного подхода»: основной упор делался на решение конкретных (как правило, прикладных) задач, без попытки моделировать психологическую реальность.

Начало 1970-х годов ознаменовалось интересом к обработке семантической информации; появились даже первые ростки интереса ж «когнитивной науке» (названной в те же годы «когитологией»).

В результате исследований этой «эпохи» выяснилось: а) даже в очень простых ситуациях (использование языка гораздо более разнопланово, чем можно было бы ожидать; б) специализация той или иной системы ОЕЯ и перспектива расширения этой системы находятся в серьезном конфликте между собой; в) репрезентации для языковых выражений, используемые в рамках таких систем (скажем, формальные языки), весьма неточны и неадекватны выразительным способностям естественного языка; г) приходится поступиться очень многими типами выражений, реально используемых на естественном языке (в частности, выражениями для физических событий и действий, описаниями сцен, карт, путей, предписаниями; реальными разговорами, спорами, дебатами, обсуждениями, эмоционально окрашенными высказываниями и высказываниями об эмоциональных состояниях; метаописаниями теорий; поэтическим языком, юмором, иронией, ложью и т.п. – т.е. всем, что требует гораздо более богатого метаязыка, чем тот, который могут на сегодняшний день предоставить в наше распоряжение существующие нотации логики).

3. Современная эпоха (1970-1995 гг.). В это время в центре внимания находятся следующие проблемы: а) соотнесенность речевых актов, фокусов внимания и общих (для ЭВМ и человека) презумпций; б) использование «новаторского» потенциала языка (в частности, интерпретация метафор); в) постройте прикладных систем, понимающих естественный язык (а не просто его обрабатывающих), г) обработка высказываний о пространственных событиях; д) введение факторов «здравого смысла» в состав логического вывода систем ОЕЯ, в частности, учет степени правдоподобности при интерпретировании высказываний.

Система, «понимающая» естественный язык

Смоделировать понимание и обработку естественного языка – это не одно и то же. Так, мы можем (не понимая полностью или частично) манипулировать символами, повторить сказанное на чужом (и непонятном нам) языке и т.п. Все это, пусть огрубление, соответствует ситуации ОЕЯ без понимания. С другой стороны, сам факт того, что мы нечто понимаем, равносилен тому, что мы над выражением производим определенные лингвистические операции. Таким образом, понимание естественного языка – специальный случай ОЕЯ. Многие из построенных систем ОЕЯ не понимают естественного языка в том смысле, который разумно вкладывать в термин «понимание».

Прежде всего, не все такие системы обладают целенаправленностью: выработка собственных целей, планирование, воплощение стратегий в виде тех или иных тактических приемов, «прослеживание» результатов этих приемов и предсказание (предвидение) дальнейших результатов – все это пока еще не более чем проект хорошей системы ОЕЯ. Так, система SHRDLU обладает системой планирования, но цели в ней достигаются не посредством высказываний; и кроме того, эта система не в состоянии распознавать цели человека: в диалоге с ЭВМ именно человек обладает инициативой. Несколько более замаскировано отсутствие целенаправленности в системах ЭЛИЗА и ДОКТОР. Только сравнительно недавно целенаправленность и моделирование намерений вошли в круг интересов разработчиков ОЕЯ.

Другое временное упущение: понять новое высказывание в диалоге или в тексте – значит, кроме прочего, связать его с тем, что было сказано раньше. В системах «искусственного интеллекта» эта задача решается, в основном, опосредованно, в два шага:

1) сначала, на основании протокола анализа предшествующего диалога или текста, активируются «фреймы», или «скрипты» (т.е., неформально говоря, те схемы из базы знаний, в которые можно уложить поступившую новую информацию), а затем

2) новое, текущее сообщение сопоставляется с этими схемами (но не с предшествующими предложениями непосредственно).

В результате, в частности, упускается такая возможность, реально используемая на самом деле в общении между людьми, как «ловля на слове», непоследовательность в употреблении терминов и т.п.

Третье отличие состоит в слабой реализованности влияния контекста непосредственно на направление работы анализатора. Так, в большинство систем ОЕЯ имеется две отдельные подсистемы: а) анализатор («парзер») перерабатывает входной текст в некоторую промежуточную форму (на язык синтаксических деревьев – как в системах типа, на упрощенный естественный язык – как в работе или на язык понятийных примитивов – как у Шенка), а затем б) подсистема логического вывода строит репрезентацию для значения входного текста (посредством заполнения недостающих деталей в репрезентации, полученной на выходе из анализатора); тогда включаются те неупомянутые события, которые связывают в единое целое факты, упоминаемые в тексте. Часто представленные другие компоненты (система ответа на вопросы и система построения аннотации к статье) скорее демонстрируют достигнутость понимания, чем являются частью процесса понимания. Назначение промежуточного представления для значения текста всегда одно и то же: защитить систему логического вывода от «капризов» естественного языка. Однако эта направленность не выдержана последовательно: логический вывод всегда бывает при этом связан с дополнительным анализом – на основе теперь уже промежуточной репрезентации. Но на работе анализатора никак не сказывается (в названных системах) то, к каким выводам придет система логического вывода. Попытка восполнить это упущение сделана разработчиками системы FRUMP, где знания о мире отделены от чисто языковых сведений, не где, тем не менее, контекстная информация влияет на процесс анализа, В этой системе содержатся, среди прочего, два модуля: Предсказыватель (предсказывает ограничения на то, что может дальше появиться в тексте) и Выяснитель (верифицирует эти гипотезы Предсказывателя). Однако эта система находится в стадии проектирования.

Другой вид проблем: отношение между синтаксисом и семантикой в рамках анализа предложения. Имеем здесь, как минимум, три возможности:

1) при переходе от предложения к представлению его значения сначала полностью восстанавливается синтаксическая структура предложения; на втором же этапе эта структура переводится в семантическое представление;

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5184
Авторов
на СтудИзбе
435
Средний доход
с одного платного файла
Обучение Подробнее