AI-2009 Day 07 (1156467)
Текст из файла
Искусственный интеллект – IV курс – День 07, лекции № 13, № 14 13.10.2009.
Проблема знаний - центральная проблема ИИ
В данном разделе курса речь идет о проблемах формирования, хранения и использования «знаний» (пока мы считаем, что «знания» – любая информация о системе и ее окружении) на всех этапах жизненного цикла системы искусственного интеллекта (системы ИИ)/интеллектуальной системы (ИС).
1.Терминологические замечания:
а) Предметная область (ПО) – «срез» действительности, со своими объектами, отношениями.
Проблемная область (ПО) – Предметная область + характерные задачи.
Примеры:
Предметная область – Лисп как язык для обработки списков
Проблемные области: автоматический синтез программ на Лиспе,
автоматизированное обучение приемам программирования на Лиспе.
б)Из психологии и педагогики нам известна триада: знания – умения – навыки.
Знания – усвоенные Понятия.
Умения – способность выполнять новые действия в новых условиях.
Навыки – действия, автоматизировавшиеся в процессе их усвоения и выполнения.
В работах по ИИ знаниями обычно называют и собственно знания, и умения, и навыки.
Поэтому говорят о: базах понятий, базах фактов, базах правил и т.п.
Вот, например, два определения из Интернет-ресурса «Тематическая служба толковых словарей» – http://www.glossary.ru.
Знания (в информатике) – вид информации, отражающей опыт специалиста (эксперта) в определенной ПО, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому.
Знания о ПО подразделяются на:
-факты, относящиеся к ПО;
-закономерности, характерные для ПО;
-гипотезы о возможных связях между явлениями, процессами и фактами;
-процедуры для решения типовых задач в данной ПО.
Чтобы не вступать в противоречие с литературными источниками, мы согласимся с такой трактовкой (расширенной) термина знания.
в)Базы знаний (БЗ) в работах по ИИ часто не совсем корректно противопоставляются базам данных (утверждается, например, что базы знаний в отличие от баз данных имеют встроенный дедуктивный механизм вывода следствий из известных фактов и т.п.).
Для нас это феномены разноплановых уровней:
База знаний – (у нас) – совокупность «знаний» системы ИИ в компьютерном представлении. Средством представления «знаний» может быть, в частности, та или иная штатная база данных (в обычном смысле).
2.Некоторые острые аспекты проблемы знаний:
Проблема извлечения знаний
Извлечение знаний – процесс взаимодействия инженера по знаниям с источником знаний (экспертом), в результате которого становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.
Проблема приобретения знаний
Приобретение знаний – автоматизированное построение базы знаний посредством диалога эксперта и/или инженера знаний со специальной программой формирования БЗ.
Экспертные знания – знания, которыми располагает специалист в некоторой проблемной области.
Эксперт – специалист в некоторой проблемной области.
Инженер знаний/Инженер по знаниям/Когнитолог – специалист по искусственному интеллекту, проектирующий и создающий базу знаний системы ИИ. Обычно инженер по знаниям выступает в роли «посредника» между экспертом и базой знаний
Проблема открытости знаний
Совокупность «знаний» системы ИИ неизбежно должна быть открыта для включения в нее новой информации, отражающей динамику проблемной среды и динамику поручаемых системе ИИ заданий.
Открытость может быть реализована по-разному:
- пополнение БЗ «хирургическим путем» (программист/администратор вносят изменения в тексты БЗ),
- обучение системы пользователем в рабочем режиме,
- самообучение системы (приспособление ее к новым условиям/задачам).
3.Базовые методы представления знаний:
Метод представления знаний – совокупность взаимосвязанных средств формального описания знаний и оперирования (манипулирования) этими описаниями.
(аналог модели данных в теории Баз Данных – понятие концептуального уровня)
Логические методы (язык предикатов)
Знания, необходимые для решения задач и организации взаимодействия с пользователем, – факты (утверждения).
Факт – формула в некоторой логике.
Система знаний – совокупность формул.
База знаний – система знаний в компьютерном представлении.
Основные операции: логический вывод (доказательство теорем)
Примеры:
иметь (Саша, книга) «Саша имеет книгу»
иметь (Саша, книги) иметь (Саша, книга) «Если Саша имеет книги, то он имеет книгу»
(x) [человек (x) иметь (x, книга)] «Каждый человек имеет книгу»
(x) [свободен (x) (y) (на (y,x))] «Если кубик x свободен, то нет такого кубика y,
который находится на кубике x»
Достоинства:
-
формальный аппарат вывода (новых фактов/знаний из известных фактов/знаний),
-
возможность контроля целостности,
-
простая и ясная нотация.
Недостатки:
-
знания трудно структурировать,
-
при большом количестве формул вывод идет очень долго,
-
при большом количестве формул их совокупность трудно обозрима.
Семантические сети
Знания, необходимые для решения задач и организации взаимодействия с пользователем, – объекты/события и связи между ними.
Статические семантические сети - сети с объектами.
Динамические семантические сети (сценарии) - сети с событиями.
Система знаний – совокупность сетей (или одна общая сеть).
База знаний – система знаний в компьютерном представлении.
Для представления семантических сетей используются графы:
вершина - атомарный объект (событие),
подграф - структурно сложный объект (событие),
дуга - отношение или действие.
Примеры отношений:
род-вид («компьютер» – «персональный_компьютер»)
целое-часть («компьютер» – «память»)
понятие-пример («компьютер» – «конкретный компьютер . . . »)
Основные операции: сопоставление с образцом, поиск, замена, взятие копии
Пример сети:
<описание компьютера>
Достоинства:
-
знания хорошо структурированы, структура понятна человеку.
Недостатки:
-
при большом объеме сети очень долго выполняются все операции,
-
при большом объеме сети она трудно обозрима.
Фреймы
Знания, необходимые для решения задач и организации взаимодействия с пользователем, – фреймы.
Фрейм-понятие – отношение/действие + связанные этим отношением/участвующие в этом действии объекты.
Фрейм-пример – конкретный экземпляр отношения/действия + конкретные объекты (связанные этим отношением/участвующие в этом действии).
Система знаний – совокупность фреймов-понятий и фреймов-примеров.
База знаний – система знаний в компьютерном представлении.
Фрейм: ИМЯ - отношение/действие
СЛОТЫ - объекты или другие фреймы
С каждым слотом может быть связана такая информация:
УСЛОВИЕ НА ЗАПОЛНЕНИЕ (тип, «по умолчанию», связь с другими слотами)
АССОЦИИРОВАННЫЕ ПРОЦЕДУРЫ (действия, выполняемые, например, при заполнении этого слота)
Основные операции: поиск фрейма/слота, замена значения слота, взятие копии фрейма-понятия
Примеры:
Фрейм-понятие «Перемещать»
ПЕРЕМЕЩАТЬ (кто?, что?, откуда?, куда?, когда?, . . .)
Условия: кто? – человек, робот, . . .
откуда? – место
. . .
Фрейм-пример
ПЕРЕМЕЩАТЬ (Саша, Саша, Главное_Здание_МГУ, Факультет_ВМК, вчера в 15-30, . . .)
Фрейм-понятие «Персональный_компьютер»
ПЕРСОНАЛЬНЫЙ_КОМПЬЮТЕР (фирма-производитель?, процессор?, память?, . . .)
Фрейм-пример
ПЕРСОНАЛЬНЫЙ_КОМПЬЮТЕР (ASUS, Intel Celeron, 512Мб, . . .)
Достоинства:
-
знания хорошо структурированы, структура понятна человеку.
Недостатки:
-
при большом количестве фреймов долго выполняются все операции,
-
при большом количестве фреймов знания трудно обозримы.
Продукции
Знания, необходимые для решения задач и организации взаимодействия с пользователем, – продукции (продукционные правила).
Продукция – правило вида: p: (где: p – предусловие, - антецедент, - консеквент).
Система знаний – система продукционных правил + стратегия выбора правил.
База знаний – система знаний в компьютерном представлении.
Основные операции: вывод (применение правила, определение правила-преемника и т.д.)
Примеры:
True: T > 200C & P > 5 кПа открыть клапан № 3
True: Х - башня Х имеет_часть У1 & У1 есть КРЫША & . . .
Достоинства:
-
простая и ясная нотация.
Недостатки:
-
при большом количестве правил вывод идет очень долго,
-
при большом количестве правил их совокупность трудно обозрима.
4.Сложности формирования БЗ (на примерах):
Пример: Формирование описания объекта на основе знаний «здравого смысла»
При описании АРКИ одного из объектов Мира Кубиков с помощью семантических сетей мы будем использовать: 1)объекты/понятия: арка, блок, пирамида (пирам), многогранник (мног);
2)отношения: целое-часть (1), род-вид (2), поддерживает (3) и некоторые другие.
Рассматривается проекция трехмерных объектов на плоскость.
В описание не включается очевидный факт – работа с Кубиками ведется на плоскости (table).
Достаточно естественный вариант АРКИ: может быть описан так:
Другой возможный вариант АРКИ: имеет другое описание:
Если в БЗ будет указано, что блок и пирам –
частные случаи объекта мног → можно дать обобщенное описание АРКИ:
В этом описании не учтен «вырожденный» случай арки (см. ниже). Для того, чтобы исключить такой объект, следует указать, что блоки основания АРКИ не соприкасаются.
Не очень понятно, следует ли считать АРКОЙ объект, изображенный на следующем рисунке («феномен кучи»). Можно заменить в описании отношение не соприкасаются (4)
отношением расстояние между блоками > δ (5).
Отметим, что этот пример можно рассматривать не только в контексте описания (и его формализации) ПО человеком, но и в контексте обучения системы ИИ.
Пример: Использование в качестве источника информации о ПО энциклопедических источников
Некоторые словарные статьи из «Толкового словаря Ожегова» (http://www.ozhegov.ru/):
АВТОБУС: многоместный автомобиль для перевозки пассажиров
АВТОМОБИЛЬ: транспортное средство на колесном ”реже полугусеничном или другом” ходу с собственным двигателем для перевозок по безрельсовым путям
…
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.