Лекция 7
Лекция 7 по СИИ
1.3 Извлечение знаний и обучение
Модуль извлечения знаний в составе экспертной системы не является обязательным компонентом. СИИ должна обеспечивать функцию ввода и обновление знаний. Эта функция либо реализуется в направлении "эксперт ® система", либо СИИ извлекает новые знания из тех, которые уже содержатся в базе знаний. Последняя возможность осуществляется на основе механизмов вывода знаний и обучения. Существующие сложности, связанные с формированием понятий машиной, а также отсутствием эффективных формализмов для оперирования абстрактными значениями. Это обстоятельство не позволяет пока вести речь о коммерчески реализованных модулях обучения (самообучения) в составе экспертных систем. Вместе с тем, поскольку проблема обозначена, практически важные результаты научных исследований следует скорее всего ожидать в областях, где СИИ работает с задачами классификации и распознавания. Остановимся на этих вопросах подробнее.
1.3.1 Извлечение знаний от многих экспертов
Извлечение знаний от экспертов ставит следующие проблемы:
(1) в какой форме осуществляется диалог с экспертами?
(2) как обрабатывать информацию, представленную экспертами?
Первая проблема состоит в том, что СИИ "не имеет представлений" о том, что она призвана решать. Иначе говоря, она либо ведет один и тот же сценарий диалога, либо вообще является пассивной стороной, представляя эксперту набор директив редактора базы знаний. Однако, даже и в этом последнем случае встает проблема, чтобы введенная экспертом информация:
(а1) была непротиворечивой;
Рекомендуемые материалы
(а2) не нарушала целостность существующей базы знаний;
(а3) не была "пустой" или избыточной.
Таким образом, обеспечение требований (а1 - а3) является важнейшей функцией модуля извлечения знаний и обучения.
Рассмотрим, как осуществляется обработка экспертной информации на примере системы диагностирования. Предположим, эксперты оценивают некоторый диагноз (гипотезу), указывая оценки правдоподобности (коэффициенты уверенности - КУ) этой гипотезы. Таким образом, каждый эксперт формирует пару (Н, КУi), где Н - некоторая гипотеза. Если обозначить через a1, a2, ..., an - степени компетентности экспертов (веса), то результирующее значение КУ* для гипотезы Н полагаем равным:
(1.36)
При отсутствии информации о компетентности экспертов можно положить ai = 1 .
Для оценки статистической значимости найденного значения КУ* находят дисперсию
(1.37)
и далее, задавшись вероятностью ошибки Рош, определяют вероятность (1 - Рош), с которой случайная величина попадает в интервал
[КУ* - D; КУ* + D], (1.38)
где и t - коэффициент Стьюдента, устанавливаемый из таблиц по значению Рош и n.
Другой важной задачей при экспертизе является ранжирование продукций с учетом их важности. Очевидно, что от того, насколько точно ранжированы правила, определяется эффективность стратегии вывода.
В результате процедуры ранжирования строится следующая таблица (табл. 1.4)
Таблица 1.4.
Эксперты | Продукция | |||
1 | 2 | m | ||
1 | r11 | r12 | r1m | |
2 | r21 | r22 | r2m | |
. . . n | . . . rn1 | . . . rn2 | . . . rnm | |
рангов | r1 | r2 | r |
В нижней строке табл. 1.4 записываются суммы рангов, полученные каждой продукцией (чем больше сумма, тем продукция важнее). Результирующее упорядочение продукций осуществляется согласно оценкам ri.
Статистическая согласованность (значимость) ранжирования проверяется для случая отсутствия равных рангов в ранжировке каждого эксперта, на основании коэффициента конкордации (согласованности) W:
(1.39)
В случае нестрогого ранжирования (при наличии равных рангов) используется формула:
(1.40)
где k - число групп равных рангов, введенных i-м экспертом;
t - число одинаковых элементов в j-ой группе i-го эксперта.
Пусть значение W найдено. Вычисляется величина n(m - 1)W, для которой задаются вероятностью ошибки Рош. Согласно c2 - распределения с (m - 1) степенью свободы для Рош находят табличное значение Wтаб. Если найденное значение W³Wтаб, то W считается статистически значимой.
Другой вариант извлечения знаний, связан с ответом системы на запросы пользователя. При этом вопрос интерпретируется как теорема, которая подлежит доказательству, а нахождение ответа на вопрос ищется на основании метода доказательства теорем. В рамках этой концепции построена система логического пропсам- минования Пролог, рассматриваемая позднее. В качестве иллюстрации рассмотрим следующий Пролог - подобный пример.
Здоровое_тело (Y) ® Здоровый_дух (Y).
Спортсмен (Х) & Ведет_здоровый_образ_жизни (Х) ® Здоровое_тело (Х).
Здоровый_дух (Z) ® Подходящий_партнер (Z).
Спортсмен (Сидоров).
Спортсмен (Иванов).
Спортсмен (Петров).
Здоровое_тело (Федоров).
Ведет_здоровый_образ_жизни (Петров).
Ведет_здоровый_образ_жизни (Сергеев).
Зададим вопрос системе в форме
? - Подходящий партнер (Т).
Для того, чтобы ответить на этот вопрос, система должна построить дедуктивную цепочку с чаключением в виде теоремы-вопроса. Не приводя способа построения этой цепочки, укажем ее Симу (одну ич подходящих цепочек):
Спортсмен (Петров) ® Ведет_здоровый_образ_жизни (Петров) ® Здоровое_тело (Петров) ® Здоровый_дух (Петров) ® Подходящий партнер (Петров).
Следовательно, ответом на вопрос является Т = Петров.
1.3.2 Проблема непротиворечивости формализованной базы знаний
При добавлении информации от экспертов в базу знаний, необходимо обеспечить непротиворечивость базы знаний. Непротиворечивость означает, что в базе знаний не выводимы никакие два факта (формулы) вида а и (из которых один отрицает другой). Проблема непротиворечивости не является тотальной, т.е. вполне допустимы противоречивые системы, однако, нужно иметь в виду следующее.
Во-первых, практически многие хорошо разработанные теории вывода работают с непротиворечивыми системами формул. Действительно, если система противоречива, то в ней выводимо все что угодно! Это обстоятельство практически лишает смысла само понятие вывода в противоречивой системе. В такой системе, следовательно, вывод заменяется иными механизмами (например, механизмами классификации - распознавания и принятия решений).
Во-вторых, сам характер задачи, стоящей перед СИИ, не допускает противоречивого толкования знаний (например, заключения : "пациента нужно немедленно прооперировать" и : "пациента не нужно немедленно оперировать" таковы, что неясность в смысле их выбора может стоить жизни человеку. (Такова, к примеру, фабула романа А. Хейли "Окончательный диагноз").
В формальных логических системах первого порядка противоречивость эквивалентна выводимости в системе пустой формулы (интерпретируемой как ложь).
Неизбыточность. Требование незбыточности означает, что в базе знаний хранятся лишь независимые друг от друга знания. Формула зависима от формул x1, x2, ..., xk, если выводима из x1, x2, ..., xk в силу правил вывода. Неизбыточность знаний не является императивным требованием. Фактически, избыточность имеет сильный положительный момент, который заключается в следующем.
Пусть СИИ в результате доказательства цели построила цепочку
Пi1, Пi2, Пi3, ..., Пi n-1
C0 ® C1 ® C2 ® ... ® Cn,
где Сk - k-ый контекст вывода (k-ое состояние трассы вывода);
Пij - правило вывода (продукция), применяемое к контексту Сj-1.
Это позволяет ввести в базу знаний новую продукцию
,
где является выводом по образцу из С0 и Сi1 (Ci1 - условная часть продукции Пi1 ),
П* = <Пi1, Пi2, ..., Пi n-1> - представляет последовательную цепочку операционных частей продукций Пi1, Пi2, ..., Пi n-1.
Добавление продукции в базу знаний при следующем решении задачи <, Cn - ?> избавит от необходимости строить план решения задачи снова, т.е. приводит к увеличению быстродействия СИИ. Рассмотрим, как определяется зависимость формул в логике высказывании, являющейся тон частью логики предикатов, которая позволяет формализовать фактуальные знания (т.е. знания, представленные совокупностью фактов). Итак, пусть требуется установить выводимость пропозициональной формулы G, представленной в виде
G = g1 Ú g2 Ú g3 Ú ... Ú gm, (1.41)
где gi - формулы (гипотезы), взятые с отрицанием или без него, из формулы F произвольного вида, т.е. доказать справедливость:
F ® g1 Ú g2 Ú g3 Ú ... Ú gm, (1.42)
Суть предлагаемого метода заключается в последовательном умножении обеих частей (1.42) на , . Например, в порядке возрастания индекса i, пока не будет получена одна из следующих ситуаций:
(a1) F* ® ð
(a2) F* ® F* (ð ® ð или F* ® 1)
(a3) ð ® F*,
где ð - символ пустой формулы, ð = х & ;
F - непустая формула формальной системы.
Тогда справедливы следующие заключения:
Ситуация (а1) означает невыводимость G из F (G не находится в отношении логического следствия из F);
Ситуация (а2 и а3) означает, что G логически следует из F, 1 = х Ú .
Таким образом, для доказательства произвольной формулы F ® G, ее необходимо привести к виду (1.42) и выполнить описанную процедуру, доказательство которой здесь опускается.
Пример. Пусть даны формулы
f1 = a ® b&c&,
f2 = b ® &f,
f3 = c Ú ® x Ú y.
Покажем, что имеет место
a&f1&f2&f3 ® x.
Умножим обе части на х:
® ð.
Заменим (p ® q) на :
® ð.
Откуда, раскрывая скобки, имеем
ð ® ð,
что устанавливает доказываемое соотношение.
Обратите внимание на лекцию "15. Антропологическая квалификация народов мира".
С другой стороны, отношение
a&f1&f2&f3 ® y
невыводимо, поскольку имеет место:
® ð.
Или ð.
Итак, проблема избыточности решается с помощью механизма вывода.