Модели представления знаний
§2.2 Модели представления знаний
2.2.1 Общие сведения о моделях представления знаний
Одной из главных проблем, которую приходится решать в СПЗ. Является вопрос об оптимальном сочетании 2-х противоречивых концепций: общности СПЗ и эффективности ее использования.
В связи с этим вводят понятие эпистомологически полного представления, под которым понимается формальное описание всех фактов о внешнем мире, необходимых для выполнения определенного класса задач.
Еще одна проблема – соответствие модели ПО. Возникает понятие – эпистомологически адекватного описания.
Вводится еще понятие эвристически адекватного представления, которое заключается в допустимости лингвистического выражения последовательности рассуждений, приводящих к решению задачи.
Наряду с понятием ПО существует понятие проблемной области.
При создании моделей проблемной области используется понятие пространство состояний – дискретное, изображается в виде мульти-графа.
Рекомендуемые материалы
Модели представления знаний.
1. Классические
- формальные логические модели
- семантические сети
- фреймы
- продукционные модели
2. Новые (эта группа постоянно пополняется)
- критериальные модели
- нейронные сети
- стохастические модели – модели для представления знаний в условиях неопределенности.
2.2.2 Формальные логические модели – модели на основе формальной или математической логики.
Исторически первой моделью стала формальная логика Аристотеля, затем Кант, Буль.
Интерпретация – утверждение относительно правдивости высказывания в некотором возможном мире. Интерпретация определяет семантику.
Под предикатом понимается некоторая связь, которая задана на наборе констант и переменных.
Т.о., основными синтаксическими единицами логики предикатов являются константы, переменные, функции, предикаты, кванторы и логические операторы.
Синтаксис языка логики предикатов первого порядка определяется языком Бекуса Наура.
Для представления знания данной ПО необходимо установит область интерпретации, т.е выбрать константы, которые определяют объекты данной области, а также функции и предикаты, которые определяют зависимости и отношения между объектами. После этого можно построить логические формулы, описывающие закономерности данной ПО.
Все это возможно, когда знания являются полными, четкими и надежными, иначе задать знания с помощью математической модели невозможно.
2.2.3 Семантические сети
Семантика – наука, устанавливающая отношения между символами и объектами, которые эти символы обозначают.
Семантическая сеть – ориентированный граф, вершиной которого является понятие, а дуги – отношение между ними.
1968г. Куилиан. Основная идея подхода представления знаний, основанных на аппарте семантических сетей, состоит в том, проблемная среда рассматривается, как совокупность понятий (сущностей объектов) и отношений (связей между ними).
При построении семантической сети используются 3 основных типа объектов:
- понятие – объекты ПО
- событие - действия
- свойства – характеристики объектов или событий.
Сеть должна быть систематизирована, для возможности формализации.
Сети Куилиана систематизируют отношения по следующим признакам:
1. множество - подмножество
2. отношение близости
3. отношение сходства различия
4. логические связи
5. количественные связи
6. пространственные связи
7. временные связи
8. атрибутные связи
9. лингвистические связи и др.
Для реализации семантических сетей существуют специальные языки: NET, SIMER_MIR.
Преимущества данной модели:
- соответствие современным представлениям об организации долговременной памяти человека
- наглядное представление
Недостаток – сложность поиска вывода, сложность корректировки таких моделей (добавление, удаление знаний).
Семантические сети получили широкое распространение в системах распознавания речи и экспертных системах. Необходимость структуризации семантических сетей привела к появлению концепции фреймов.
2.2.4 Фреймы (англ. frame – рамка, скелет, каркас) – модель представления знаний, основанная на теории Минского, которая представляет собой психологическую модель памяти человека и его сознания.
Фрейм – абстрактный образ для представления некоего стереотипа восприятия путем сопоставления факта с конкретными элементами и значениями в рамках определенной для объекта образа в структуру БЗ.
Фрейм – минимально возможное описание сущности какого-либо объекта, явления, события, ситуации, процесса.
Фрейм имеет имя, служащее для идентификации описываемого им понятия.
Фрейм состоит из слотов и присоединенных процедур, связанных с фреймом или со слотами.
Основные структурные элементы определяются с помощью слотов. Текущие значения слотов помещаются в шпации.
Число слотов устанавливается проектировщиком.
Родитель объекта – системный слот AKO (A kind of)
15.10.2009
Слот может содержать не только конкретные значения, но также и имя процедуры, позволяющей вычислить это значение по заданному алгоритму. Такие процедуры называются присоединенными или связанными процедурами. В слоте могут содержаться данные сложных типов, массивы, списки, множество и т.д.
Таким образом, структуру фрейма можно представить в виде следующей таблицы:
Имя файла | ||
Имя слота | Значение слота | Значение типа данных слота |
Совокупность данных предметной области может быть представлена множеством взаимосвязанных фреймов, образующих единую фреймовую систему, в которых объединяются декларативные и процедурные знания. Такая система имеет, как правило, иерархическую структуру, в которой фреймы соединены друг с другом с помощью родовидовых связей. На верхнем уровне находится фрейм, содержащий наиболее общую информацию, истинную для всех фреймов. Указатели наследования показывают, какую информацию об атрибутах слотах из фрейма верхнего уровня наследуют слоты с одинаковыми именами в данном фрейме. Наследование происходит по АКО. Слот АКО указывает на фрейм более высокого уровня иерархии, откуда наследуются значения одинаковых слотов. В конкретных слотах указатели наследования могут быть организованы различными способами.
Рассмотрим фреймовую модель, описывающую понятие студент.
Студент
|
Человек
|
Млекопитающее
|
Фреймовые системы обычно реализуют на ООЯ. Основными преимуществами является наглядность и гибкость в употреблении.
2.2.5 Продукционные модели
Иначе называется моделью, основанной на знаниях. Эта модель позволяет представить знания в виде:
ЕСЛИ <условие>, ТО <действие> (2.1)
В качестве условия выступает предложение, по которому осуществляется поиск в базе знаний, а действие выполняется при успешном исходе поиска. Системы обработки знаний Поста, предложенные для формальной замены последовательности символов, использующие такое представление, получили название продукционных систем. Продукционную систему можно представить, как систему, состоящую из трех основных компонентов:
База правил содержит правила вида (2.1).
Рабочая область (рабочая память) – это база фактических правил, в которых хранятся исходные данные к задаче и выводы, полученные в ходе работы системы.
Интерпретатор правил реализует определенный механизм логического вывода, используя правила в соответствие с содержимым рабочей памяти.
Любое продукционное правило, содержащееся, в базе знаний, состоит из двух частей: антецедента и консеквента. Правило продукции обычно выглядит так:
, где – правило продукции, – антецедент, – консеквент. (2.2)
Антецедент представляет условие поведения правила . Консеквент определяет результат правила .
Пример: «если небо покрыто тучами» и «идет дождь» à «необходимо взять зонт»
Антецеденты и консеквенты знаний формируются из атрибутов и значений. В рабочей памяти продукционной системы хранятся пары «атрибут-значение», истинность которых установлена к некоторому конкретному времени при решении определенной задачи. Правило срабатывает, если при сопоставлении фактов, содержащихся в рабочей памяти с антецедентом анализируемого правила, имеет место совпадение. Заключение срабатываемого правила заносится в рабочую память. При реализации правил пространственных состояний для описания состояний используются символьные строки, как со скобками так и без, а операторы задаются в форме правил переписывания или продукций. Так, если продукция имеет вид « », а описание состояния « », где и – символьные строки, которые могут быть пустыми, то результатом применения оператора к описанию будет . Преимуществом является то, что здесь не надо применять условие применимости.
В качестве примера рассмотрим задачу об обезьяне и бананах. Представим решение данной задачи в виде четверки (w, x, y, z), где w – координаты обезьяны в горизонтальной плоскости, x – 1 или 0 в зависимости от того, находится обезьяна на ящике или нет, y – координаты ящика в горизонтальной плоскости. Пусть в начальный момент времени обезьяна имеет …
Вместе с этой лекцией читают "Технологии web-дизайна".
(w, x, y) a b c
(a, 0, b, 0) (c, 1, c, 1)
…
/* вообщем проще посмотреть методичку ко второй лабе по СИИ, нежели печатать сие безобразие с множеством табличек и схем */
Основными преимуществами продукционной модели является наглядность, высокая модульность, легкость внесения изменений и дополнений, простота логического вывода.
К недостаткам можно отнести сложность оценки целостного образа знаний, низкую эффективность обработки знаний, неясность взаимных отношений и правил.