kursovik (735313)
Текст из файла
3
Содержание
-
Введение 4
-
Различные типы знаний и их представления 5
-
Различные типы знаний. 5
-
Различные представления знаний в существующих системах. 7
-
Способы использования знаний и доступ к ним. 9
-
Преимущества и недостатки продукционных систем 10
3. Метазнание 12
-
Метазнание объектов окружающего мира 12
-
Метазнание стратегий 13
Заключение 15
Литература 18
1. Введение
Задание на курсовую работу по дисциплине "Базы данных"
Студент группы ОИН 10913
Зубко Д.В.
Направление: "Информатика и ВТ", № контракта 19000010602071
Тема: Базы знаний
Задание выдано:
2. Различные типы знаний и их представления
В настоящее время целью исследований в области ИИ является создание таких систем, которые, с одной стороны, могут использовать большое количество знаний, передаваемых им специалистами, а с другой - способны вступать в диалог и объяснять свой собственные выводы. Это предполагает наличие эффективного управления большой по объему и хорошо структурированной базой знаний, строгое разграничение между различными уровнями знаний, наличие множества удобных представлений для правил, схем предикатов или прототипов и четко определенный процесс обмена информацией между различными источниками.
Необходимо, чтобы система знала, что она знает. Если попытаться провести аналогию с людьми, то подобное метазнание означает постоянное использование в течение жизни информации о каждом прожитом дне. Если, например, вы забыли имя приятеля, встреченного на улице, то ваше метазнание состоит в том, что либо вы его имя знали, но забыли, либо этого имени никогда не знали. Впрочем, мы постоянно используем важные эвристические правила, основанные на подобном метазнаний, такие, как "если бы это была правда, то я бы это знал". Они зависят от двух важных параметров: значимости имеющего к ним отношения факта и степени нашей собственной компетентности в данной области. В действительности каждое человеческое знание сразу же требует метазнания, связанного с тем местом, которое мы отводим данному знанию в ряду другой информации, как мы к нему относимся, для каких целей оно нам полезно, к какому семейству принадлежит. Все эти моменты рассматриваются в следующих разделах, посвященных описанию реальных информационных систем.
2.1 Различные типы знаний
Выделим восемь основных типов знаний по следующим признакам.
-
Базовые элементы, объекты реального мира. Они связаны с непосредственным восприятием, не требует обсуждения, и добавляются к нашей базе фактов в том виде, в котором они получены.
-
Утверждения и определения. Они основаны на базовых элементах
и заранее рассматриваются как достоверные. -
Концепции. Они представляют собой перегруппировки или обобщения базовых объектов. Для построения каждой концепции используются свои приемы. Например, в системах МЕСНО (Bundy, 1979) или AM (Lenat, 1977) они построены на основе примеров, контр примеров, частных случаев, более общих или аналогичных концепций.
4) Отношения. Они выражают как элементарные свойства базовых элементов, так и отношения между концепциями. Кроме того, к
свойствам отношений относятся их большее или меньшее правдоподобие, большая или меньшая связь с данной ситуацией. Еще раз отметим, что представление знаний в экспертных системах близко к моделям, используемым в базе данных. Таким путем построена реляционная (обобщенная) модель базы данных в системах OPS, PROLOG, SNARK и TANGO.
Пара понятий "свойство - значение" (relationship - entity) хорошо известна в семантических сетях; фреймы и скрипты являются не чем иным, как наиболее простыми бинарными отношениями. Некоторые экспертные системы (INTERNIST, BAOBAB, SPHINX) в качестве базы факторов используют уже базы существующих данных.
-
Теоремы и правила перезаписи. Они являются частным случаем
продукционных правил с вполне определенными свойствами. Теоремы не представляют никакой пользы без экспертных правил их использования. Явное присутствие теорем в экспертных системах представляет главное отличие от систем управления классическими базами данных (СУБД), в которых они либо отсутствуют, либо программируются. Модификация или добавление новых теорем является весьма трудоемкой, хотя и необходимой процедурой, так как нужно обеспечить хорошее структурированное управление базой данных и оптимизировать получение ответов (Gallaire, 1987). -
Алгоритмы решений. Они необходимы для выполнения определенных задач. Во всех случаях они связанны со знанием особого типа, поскольку определяемая ими последовательность действий оказывается оформленной в блок в строго необходимом порядке в отличие от других типов знания, где элементы информации могут появляться и располагаться без связи друг с другом.
Очевидно что очень трудно работать с длинными процедурами, состоящими из большого числа различных действий. .Использование чистых алгоритмов ограниченно очень частными случаями, большая часть которых имеет дело с обработкой числовой информации. Человек же должен уметь работать со многими другими типами информации и оказывается, что ЭВМ в отличие от простого калькулятора может помочь человеку в подобных неалгоритмических ситуациях.
7) Стратегии и эвристика. Этот тип представляет собой врожденные
или приобретенные правила поведения, которые позволяют в дан
ной конкретной ситуации принять решение о необходимых действиях. Он использует информацию в порядке, обратном тому, в котором она была получена. В качестве примера можно привести рассуждение типа: "Я знаю, что это действие приводит к такому-то результату (информация типа 4), поэтому, если я хочу получить именно этот результат, я могу рассмотреть это действие". Человек постоянно пользуется этим типом знаний при восприятии, формировании концепций, решении задач и формальных рассуждениях.
Появление экспертных систем связанно с необходимостью принятия в расчет именно этого фундаментального типа человеческих знаний.
8) Метазнание. Без сомнения оно присутствует на многих уровнях и
представляет собой знание того, что известно и определяет значение коэффициента доверия к этому знанию, важность элементарной информации по отношению ко всему множеству знаний. Кроме того, сюда же относятся вопросы организации каждого типа знаний и указаний, когда и как они могут быть использованы.
2.2. Различные представления знаний в существующих системах.
Приведем краткий список наиболее распространенных в настоящее время методов. Фундаментальное различие между ними состоит в простоте модификации знания. В таблице ниже они приведены в порядке от наиболее процедурного (наиболее застывшего, структурированного) до наиболее декларативного (наиболее открытого, свободного, неупорядоченного) Такая классификация является несколько грубой, но правильно: отражает идею.
Напомним, что конечные автоматы, программы, исчисление предикатов и системы с продукционными правилами с теоретической точки зрения эквивалентны друг другу, поскольку их в принципе можно свести к универсальной машине Тьюринга, хотя их "эксплуатационные характеристики" сильно различаются.
Такие формальные понятия, как фреймы; скрипты, семантические сети, возникли из реальных потребностей искусственного интеллекта и приносят большую помощь в понимании языка.
Фреймы предложены Минским в 1975 г. и представляют собой сложные структуры данных, описывающих какую-либо типичную ситуацию, например ожидание в аэропорту или участие в семейном обеде. Фрейм состоит из позиций для размещения объектов, характеризующих данную ситуацию. Позиция может быть передана другому фрейму. Кроме того, он содержит информацию о выполняемых действиях, о том, как следует поступать в типичных и нетипичных случаях, о влиянии соседних фреймов.
Скрипт или схема представляет собой описание стереотипного сценария действий с участием определенных объектов. Скрипты связаны с текущей культурой и необходимым для понимания таких предложений, как "Я вошел в ресторан, официантка принесла мне меню". Они могут вызывать
другие скрипты и обладают большими, чем фреймы, возможностями для описания динамических аспектов знания.
Семантические сети - это графы, которые часто представляют собой объединение двух предыдущих понятий и объектом описания которых являются элементы окружающего мира и связи между ними. Они имеют много общего с реляционными моделями баз данных.
Изображения и графы эффективно используются для доказательства теорем. Они оказывают большую помощь в проверке отсутствия зацикливания этапов, в полном и эффективном хранении задачи в памяти, в организации ввода новых элементов.
2.3. Способы использования знаний и доступ к ним.
Имеются четыре способа использования простой информации в форме pq. Примером этого может служить "каждый человек ошибается".
Самый непосредственный способ состоит в прямом использовании его смысла в формулировках типа:
"Нечто ошибается, и я могу доказать, что это нечто - человек". Второй способ, использующий метазнание и обратный ход мыслей, состоит в следующем:
"Если я хочу доказать, что нечто ошибается, то возможная подцель состоит в том, чтобы показать, что это нечто - человек". Оба первых способа используют модус поненс, два следующих используют отрицание предложения q и модус толенс:
а) "Если нечто не ошибается, оно не может быть человеком". Б) "Если я хочу доказать, что нечто не является человеком, то я могу попытаться показать, что оно не ошибается".
Отметим, что принцип решения и, в частности, использующий его язык
Пролог применяют единый формальный подход к описанию этих способов вывода.
С практической точки зрения использование информации зависит от параметров, которые характеризуют ее правдоподобие. Каждая система
обработки информации должна быть в состоянии ответить на такие вопросы как:
• Какая часть утверждения А является истиной?
-
С какой степенью уверенности эксперт согласен с заключением?
-
Какова средняя вероятность достижения цели с использованием А?
-
В какой мере следует оказать предпочтение А перед другими?
Некоторые системы, основанные на продукционных правилах, используют процессы приближенного вывода, учитывающие эти обстоятельства. Системы, применяющие продукционные правила, описаны выше. В следующем разделе показано возможное различие между этими системами и подходом к решению тех же проблем с помощью логики первого порядка, отмечены также преимущества и недостатки подобного моделирования знаний.
2.4. Преимущества и недостатки продукционных систем
Начнем с недостатков. Выделим из них три главных, с которыми связаны определенные ограничения, лежащие в основе используемого формализма. Они относятся к концепции, формулировке и использованию правил.
-
Трудность составления продукционного правила, соответствующего элементу знания. Нужно, чтобы рассматриваемая область
уже была достаточно изучена и установлены хорошие примитивы и
чтобы уровень детализации не был излишне подробным, иначе по
требовалось бы иметь по одному правилу на каждую ситуацию
и неясно, как: человек смог бы разобраться в таком обилии информации. -
Трудность записи правила. Единый формат записи ЕСЛИТО-
приводит к громоздким выражениям в левой части и повторению
тех же посылок в схожих ситуациях; с его помощью трудно вы
разить сложные правила. Но мы видели, что жесткий синтаксис,
громоздкие записи представляют и определенные преимущества.
Во всех случаях проблема «поймать знания» остается главной при
написании экспертной системы. Трудности использования. Связаны не с самими правилами, а с единой системой их связи. При этом база фактов играет роль кратковременной памяти, которая реально смоделирована в разработанной Ньюэллом (Newell, ( 1975) системе «познавательной психологии» PSC. В ней запрещен взаимный прямой вызов одного правила из другого, и она неудобна для выполнения алгоритмов в обычном смысле слова. Однако именно благодаря ей система в каждый момент времени точно знает, что она делает и что она знает
К преимуществам относится следующее.
1. Модульность. Системы устроены так, чтакаждая единица информации. может быть удалена, изменена или добавлена независимо от всех остальных. Знания вводятся неупорядоченно, как в словаре или энциклопедии. Практика показывает, что это является естественным способом пополнения своих знаний для эксперта.
Как ни странно, многочисленные американские авторы (Дэвис, Ньюэлл, Куинлан, Стэфик) нарушают это правило, т. е. проблема реорганизации решается у них довольно плохо.
2. Модифицируемость. Если добавляется или модифицируется какое-либо правило, то все, что было уже сделано ранее, остается в силе и к новому правилу не относится. Таким образом, каждое изменение обладает свойством аддитивности и локальности.
В отличие от этого в процедурных программах подобные взаимодействия ограниченны, любая модификация является ерундой и может привести к непредсказуемым последствиям.
3. Доступность чтения.
-
Для нас это преимущество, безусловно, имеет место. Как уже говорилось выше, наше собственное знание является модульным, поэтому продукционные системы нам кажутся более близкими, более легкими для чтения. Этим преимуществом нельзя пренебрегать, поскольку подобные системы в первую очередь предназначены для врачей, биологов, архитекторов и т. д. Во многих областях реально существуют добавляемые знания и соответствующие базы правил. (Например, автоматизированные экспертные обучающие системы.)
-
Для машины. Более простой проверке поддается база знаний, представленная в форме правил, а не в форме процедур. Противоречия или избыточность в действительности легко определяется с помощью синтаксической обработки:
АВС и АВС одновременно невозможны; из DEFG следует EFG с помощью "подпосылки";
таким образом, первое правило является лишним.
Может быть также обнаружена семантическая несогласованность: АВС неприемлемо, если по определению и из свойств А и В с необходимостью АВ.
4. Способность к самообъяснению. Это свойство связано одновременно и с правилами, и с их структурами внешнего управления. Система легко прослеживает цепочку правил, которую она использовала для получения вы
вода, так же как и использовавшиеся метаправила.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.