AI-2010 Day 13 - part 2 (1156527)
Текст из файла
Искусственный интеллект – IV курс – День 13, лекция № 26 07.12.2010.
ОБЩЕНИЕ ЧЕЛОВЕКА С СИСТЕМОЙ ИИ
(Искусственный интеллект и естественный язык)
Естественный язык в работах по искусственному интеллекту. Первые шаги.
В 60-е – 70-е гг. ХХ века специалистов в области искусственного интеллекта интересовала прежде всего проблема моделирования понимания сообщений/текстов. Были реализованы системы, способные «поддерживать диалог» с человеком на естественном языке, интерпретировать словесные команды роботу (действующему в «Мире кубиков»), решать задачи в словесной формулировке.
Система ELIZA (DOCTOR) – Дж. Вейзенбаум (1966)
Система относится к классу Conversation Machines, разработчики которых надеялись на то, что их творения смогут пройти Тест Тьюринга.
Версия DOCTOR моделирует диалог врача-психоаналитика (система) с пациентом (человек).
Фрагмент диалога с системой ELIZA:
USER: MY MOTHER TAKES CARE OF ME
ELIZA: WHO ELSE IN YOUR FAMILY TAKES CARE OF YOU
USER: MY FATHER
ELIZA: YOUR FATHER
USER: YOU ARE LIKE MY FATHER IN SOME WAYS
ELIZA: WHAT RESEMBLANCE DO YOU SEE
USER: YOU ARE NOT VERY AGGRESSIVE
ELIZA: WHAT MAKES YOU THINK I AM NOT VERY AGGRESSIVE
Для формирования ответов система использует простейшие шаблоны и связанные с ними правила, например:
(<any-1> you <any-3> me) → (what makes you think I <any-3> you)
USER: IT SEEMS THAT YOU HATE ME
ELIZA: WHAT MAKES YOU THINK I HATE YOU
(<any-1> you are <any-3>) -> (what makes you think I am <any-3>)
USER: YOU ARE NOT VERY AGGRESSIVE
ELIZA: WHAT MAKES YOU THINK I AM NOT VERY AGGRESSIVE
Система APRIL – М.Г.Мальковский (1969)
Система APRIL решает арифметические задачи в словесной формулировке. Результатом ее работы является ответ (формула или число), иногда сопровождаемый некоторыми комментариями, или сообщение (также сопровождаемое комментариями) о том, что задачу решить не удалось.
Система решает довольно узкий круг задач из школьного курса математики (1-2-й классы) – так называемые задачи «на владение». Каждая задача решается независимо от других.
На входной язык системы наложены достаточно жесткие ограничения, которые, впрочем, абсолютно естественны для рассматриваемого класса задач. Так, условие задачи должно быть сформулировано в виде трех простых предложений, а все слова, встречающиеся в тексте условия, должны быть знакомы системе (записаны в ее словарь).
Наиболее серьезное внимание было уделено разработке методов, позволяющих учитывать возможность варьирования словесных формулировок условий задач и употребления в тексте неполных (эллиптичных) конструкций. Так, внешне непохожие задачи № 1, № 2 и № 3 система сводит к одному типу задач, а решая задачи, которые человек воспринимает как имеющие решение и притом единственное, несмотря на отсутствие подразумеваемых уточняющих слов, она делает примерно те же предположения, что и человек.
Задача N 1: У Саши 5 яблок. У Пети 10 груш. Сколько фруктов у ребят?
ОТВЕТ: 15
Задача N 2: У человека 10 книг. У второго человека в 2 раза меньше. Сколько книг у них вместе?
ОТВЕТ: 15
Задача N 3: На стол положили 6 книг. Затем еще 4 книги. Сколько книг на столе?
ЕСЛИ ВО ВСЕХ ФРАЗАХ ИМЕЕТСЯ В ВИДУ "СТОЛ", ТО
ЕСЛИ В НАЧАЛЬНЫЙ МОМЕНТ КОЛИЧЕСТВО ОБЪЕКТОВ "КНИГА" В МЕСТЕ "СТОЛ" = 0, ТО
ПРЕДПОЛОЖИТЕЛЬНЫЙ ОТВЕТ: 10
Первые эксперименты показали и принципиальную возможность моделирования процессов владения языком, и чрезвычайную сложность естественного языка как объекта исследования.
Естественный язык в деятельности человека
Как мы знаем, интеллектуальная деятельность предполагает создание и использование абстрактных объектов (понятий), освобожденных от второстепенных, привходящих характеристик и отражающих наиболее существенные стороны действительности. Она реализует высшую форму регуляции деятельности человека в предметной среде.
В свою очередь существенность, значимость отражаемого определяется деятельным контекстом: в процессе управляемой мышлением деятельности и в соотнесении с ее целями и средствами. Очевидно, что деятельность человека нельзя рассматривать в отрыве от его общественных отношений. В социальной среде, в условиях общественного разделения труда структура человеческой деятельности усложняется. Человек может выполнять лишь отдельные этапы решения задачи, а цель деятельности может быть связана с его непосредственными потребностями косвенным путем. При этом функции регуляции совместной и дифференцированной деятельности выполняет коммуникативная деятельность (общение), заключающаяся в обмене информацией о деятельности индивидуальной.
В качестве средства такого обмена (средства общения) используется знаковая система социального уровня – язык. Связи языковых знаков (элементов языка) с психическими явлениями и объектами психического взаимодействия объективированы в социальной группе носителей данного языка и относительно константны для нее. Каждый член группы воспринимает эти связи как данные извне, как существующие объективно, а процесс усвоения этих связей (и знаков языка) – одна из необходимых предпосылок формирования личности, включения человека в систему общественных отношений. Овладевая языком, человек приобретает детально разработанную систему объективации и реализации собственной психической деятельности, активно используемую им в ходе социальных взаимодействий.
Основными элементами языка как знаковой системы являются языковые знаки, образующие субстанцию языка. Они связаны внутрисистемными отношениями, определяющими как структуру языка в целом, так и структуру конкретных знаковых конструкций, и участвуют в отношениях с внеязыковыми объектами.
Языковой знак – материальный объект, поставленный в соответствие некоторому другому объекту и заменяющий последний в ходе деятельности (свойство знаковости). Другими словами, если некоторый объект является знаком, то он поставлен в соответствие некоторому другому объекту и способен его заменять. Отметим также, что знаки следует отличать от единиц языка: фонем, морфем и слов (в естественном языке). Фонемы свойством знаковости не обладают и служат лишь исходным материалом для построения знаков языка, а морфемы и слова являются знаками.
Второй атрибут языкового знака – его конвенциальность, или немотивированность. Это свойство означает, что устанавливается указанное соответствие соглашением людей, использующих язык (всюду в данном разделе, если специально не оговаривается иное, речь идет о языке человека). Знак может не иметь никакого сходства с объектом, в соответствие которому он поставлен, и не быть связанным с ним причинно-следственными отношениями.
Однако выбор материального объекта на роль знака не может быть произволен абсолютно. Объект должен обладать так называемыми системообразующими свойствами – необходимыми для включения его в систему языка.
К числу системообразующих свойств языка относятся дискретность («членораздельность») и неоднородность («различаемость») его элементов. Неоднородность языка проявляется и в его иерар- хичности – в языке может быть выделено несколько иерархических неоднородных уровней, единицы каждого из которых относительно однородны (морфемы – как единицы морфологического уровня, например). С особенностями речевого аппарата человека связан принцип линейности в языке – в конструкциях, построенных по правилам языка, знаки могут располагаться лишь в линейной последовательности, то есть цепочкой.
Как элементы системы (языка) знаки обладают еще рядом свойств. Связь знака с внеязыковыми объектами задается отношениями: сигматическими – связь знака с реальными объектами и явлениями действительности или отдельными аспектами их; семантическими – связь с психическими моделями соответствующих сторон реальности или с моделями реально не существующих объектов; прагматическими – связь с людьми, использующими знаки языка в своей деятельности. Синтаксические отношения (при описании естественных языков обычно рассматриваются два уровня синтаксических отношений: морфологический и синтаксический в узком смысле) характеризуют связи между знаками как элементами языка: иерархические – отношения вхождения знака в сложный знак; синтагматические – отношения взаимодействия знаков или их классов; парадигматические – отношения между элементами одного класса, например, формами одного слова.
Характеристика языка как знаковой системы, элементы которой связаны отношениями с различными сторонами действительности, полезна и при рассмотрении процессов его использования (традиционная, начиная с работ Ф. де Соссюра, проблема лингвистики «язык – речь»). Язык является знаковой системой социального уровня. Выбор знаков, правил их комбинирования и соотнесения с явлениями объективного и субъективного планов закреплен общественным соглашением, которое разделяют все владеющие данным языком. Тем самым язык задает нормы интерпретации и употребления знаков. А в реальных процессах его использования языка на основе этих общих норм строятся и анализируются конкретные знаковые конструкции, описывающие конкретные ситуации.
Таким образом, процесс использования языка – речевая деятельность (РД) – может быть охарактеризован как актуализация и конкретизация существующих в языке в потенциальной форме синтаксических отношений и отношений знаков с внеязыковыми объектами: выбор нужной формы слова при синтезе, установление актуального сигматического отношения с реальным объектом – денотатом и т.п. Результатом РД при синтезе является сообщение, несущее определенную информацию и о самом языке (по правилам которого оно построено), и о ситуации, в которой оно было синтезировано, и об авторе.
В структурном плане сообщение представляет собой наделенную структурой линейную последовательность знаков. Каждый знак характеризуется его позицией в цепочке и актуальными синтаксическими отношениями с другими знаками. «Нечленимые» в языке знаки – материальные оболочки «элементарных» языковых единиц (морфем, неизменяемых слов, фразеологизмов) – «воспроизводятся» в речевом произведении в готовом виде. Структурно сложные знаки строятся из составляющих по правилам языка.
Общение, или коммуникативная деятельность, предполагает наличие не менее двух носителей языка – автора сообщения и субъекта, которому это сообщение адресовано, – реципиента (в случае диалога они естественным образом поочередно «меняются местами»), а также наличие некоторой совместной деятельности, которую общение должно регулировать.
Определенное сходство в структурном и функциональном плане с естественными языками имеют и представители класса искусственных языков.
Хотя проблема соотношения естественных и искусственных языков представляется на первый взгляд (и является на самом деле) тривиальной, при ее рассмотрении часто допускаются ошибки. Одна из наиболее распространенных – абсолютизация временных и несущественных различий (существенные при этом как правило упускаются из виду), учет особенностей искусственных языков, существующих в данный момент, и неоправданный перенос выявляемых при этом различий на весь класс искусственных языков вообще. Очевидно, что в этом случае и сама проблема подменяется другой.
Единственное непреходящее отличие естественного языка от всех прочих – которые и следует называть искусственными – связано с историей его возникновения. Естественный язык – продукт, естественно-исторически возникший из объективных общественных потребностей (в первую очередь из потребности в общении, регулирующем совместную и дифференцированную деятельность) на ранних этапах общественного развития, когда человеческое познание было практически нерефлексивным и никакое активное сознательное регулирование процесса создания языка было невозможно.
Объективность существования ЕЯ объясняет, почему многие языковые реликты, исключения и нерегулярности «живут» в языке до сих пор, а попытки избавиться от них, модернизировать, улучшить язык часто заканчиваются неудачей. Для того, чтобы некоторые новшества попали в язык, «закрепились» в нем, их должно усвоить большинство носителей языка (и при спонтанном развитии языка новшества, возникшие в речи, попадают в язык лишь в этом случае). Это и есть объективация. В противном же случае (без объективации) модернизатор, пусть даже руководствующийся самыми благими намерениями, окажется в положении Шалтая-Болтая из «Алисы в Зазеркалье».
Примечательно, что хотя существенные отклонения от общих языковых правил и норм недопустимы, индивидуальные модели ЕЯ (индивидуальные языковые модели – ИЯМ), усвоенные его носителями и определяющие особенности речи последних, могут иметь некоторое своеобразие. Они описывают своего рода «подмножество-расширение» эталонного языка, не содержащее неизвестных конкретному носителю языка знаков и правил и включающее ряд конструкций и форм, не входящих в общелитературный язык (заведомо неграмматичных) или используемых в рамках узких социальных групп (формы просторечные и разговорные, жаргонизмы, профессионализмы). Несмотря на формальную недопустимость или ограничения на употребление подобных форм, они (эти формы) не только встречаются в повседневной речи (соответствующие запреты либо вообще не входят в ИЯМ носителя языка, либо случайно или намеренно им игнорируются), но и понимаются людьми.
Понятие ИЯМ подчеркивает факт субъективного преломления естественного языка как знаковой системы социального уровня в ходе его усвоения и использования. Формирование ИЯМ – сложный и длительный процесс, включенный в процесс развития человеческой психики и детерминируемый как внешними (социальная среда), так и внутренними (индивидуальные психофизиологические особенности) факторами. Примечательно, что с уменьшением социальной группы (производственный коллектив, семья) своеобразие используемого в ней подмножества-расширения ЕЯ возрастает. И это естественно: усвоить отклонения от языка-эталона должно в этом случае небольшое число лиц.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.