Лекции по экспертным системам (549046), страница 3
Текст из файла (страница 3)
Пример
Обозначим:
P(H|E)=
P(H|E1..En) =
БЗ: <Hj, Pj, Kj, {(NEi, ,
)}>
БД: < NEi, название свидетельства, источник получения>
Например: <Грипп, р, {(1; 0,99; 0,01), (2; 0,9; 0,1)}>
<1, повышенная температура, осмотр>
<2, наличие кашля, осмотр>
2 случая: А) нет эпидемии
Априорная вероятность заболевания р=0,01
-
Наблюдается Е1 – повышение температуры
-
Кашель Е2
-
Е1 и Е2
Б) есть эпидемия р=0,1
1) Е1
-
Е2
-
Е3
Ограничения для схемы Байеса:
-
Независимость свидетельств (при использовании Байесовских сетей доверия неважно)
-
Сложности в использовании правдоподобных свидетельств
Шкалы
0 1 (100%)
-а +а
-100 0 А +100
0 – не проявляется
1 – очень слабо
2 – слабо
3 – средне
4 – сильно
5 – очень сильно
P(H|A) = P(H|E)P(E|A) + P(H|⌐E)P(⌐E|A)
А – ответ пользователя по опыту свидетельства
P(H|A=0)=P(H)
Не знаю
Используются графики пересчета
P(H|А)


P(H|E)

P(H|А)
P(H)
P(H|⌐E)


А
А
а
-а
-
Базируется на классической теории вероятности
P(H)+P(⌐H) = 1
P(H|E1..En) = 0.6
P(⌐H|E1..En) = 0.4
P(H) P(⌐H)
P(H) зона P(⌐H)
неопределенности
Зона противоречия
Решение: использовать трехзначную логику {0; 0,5; 1},
четырехзначную логику {t, f, τ, 0},
шестизначную логику {-1; -0,5; 0; τ; 0,5; 1}
Байесовские сети доверия (Bayesian belief networks)
1988г – Pearl предложил эти сети
Ситуация снижения скорости движения на дороге:
Р емонт дороги(R) авария (A) - гипотезы
Дорожные рабочие(D) замедление(Z) машина с мигалкой(M)
При классической схеме:
P(Z) = P(Z&R)+P(Z&⌐R)
Надо иметь статистику:
R | Z | P |
T | T | 0.3 |
T | F | 0.2 |
F | T | 0.1 |
F | F | 0.4 |
P(R|Z) = 0.3 / (0.3+0.1) 0.75
P(R,A,D,Z,M) =
Таблица 25
При использования Байесовского метода:
P(R,A,D,Z,M) =
5 параметров, таблица 20 строк
30 параметров, не более двух родителей → <250 строк
30 параметров, не более трех родителей → <480 строк
Построение: сводят к циклическим графам или к ациклическим направленным графам.
Метод субъективных коэффициентов уверенности (субъективных вероятностей)
MYCIN
M
д(H,E) =
Доверие (гипотеза, мера)
M
н(H,E) =
Недоверие
K(H,E) = Мд(Н,Е) – Мн(Н,Е)
Мн 1, Мд
0
-1
P(R)=0.5 P(R|Z)=0.75
Мд = = 0.5
Мн= = 0
K(R,Z) = 0.5 – 0 = 0.5
Можно ввести Kверхпорог(H,E) = 0.2
Kнижпорог(H,E) – не зависит от ситуации
Сложное свидетельство – есть ряд свидетельств, которые используются для гипотезы.
Если Е1 и Е2 независимы, то:
-
Мд(H,E1&E2) =
-
Мн(H,E1&E2) =
Сложная гипотеза – свидетельство в поддержку всех гипотез
Мд(H1&H2, E) = min{ Мд (H1,E), Мд (H2,E)}
Мн(H1&H2, E) = max{ Мн (H1,E), Мн (H2,E)}
Мд(H1&H2, E) = max{ Мд (H1,E), Мд (H2,E)}
Мн(H1&H2, E) = min{ Мн (H1,E), Мн (H2,E)}
Мд(Ht&Hq, Ei&Ej) = min{ Мд (Ht, Ei&Ej), Мд (Hq, Ei&Ej)}
по (1)
Мн(Ht&Hq, Ei&Ej) = max{ Мн (Ht, Ei&Ej), Мн (Hq, Ei&Ej)}
по (2)
Если сами свидетельства правдоподобны, то надо перейти на метод шкалирования.
-а 0 +а
Мд(H, E) = Мд (H,E) max{ К(E,А); 0}
Мн(H, E) = Мн (H,E) max{ К(E,А); 0}
Теория свидетельств Демпстера-Шефера
Схема Байеса основывается на:
-
Р(Н)+Р(⌐Н)=1 – свойство дополнительности
-
Свойство индифферентности
-
Точечная оценка
Аксиоматика ТВ по Колмогорову:
-
0
-
P(true)=1, P(false)=0
-
P(HvQ) = P(H)+P(Q)-P(H&Q) => P(Hv⌐H)=1
Базовые посылки ТС:
-
Использование субъективных свидетельств
-
Различение ситуаций неопределенности и незнания
-
Использование правила объединения свидетельств
1967г
[Р+(Н), Р+(Н)] – вероятностный интервал доверия
Шефер ввел понятия меры (функции) доверия гипотезы Н (Bel(H)) и меры правдоподобия Pl(H)=1 - Bel(⌐H). Вероятностный интервал доверия – [Bel(H), Pl(H)]
– множество всех возможных подмножеств из {H} гипотез.
Задается базовое распределение вероятностей (мера m(Нi)) на множестве :
Функция (мера) доверия к гипотезе Н:
Мера недоверия (правдоподобия) к гипотезе Н:
Пример
Вы миллионер и думаете, покупать ли фирму.
-
1) пригласили эксперта А
Р(Ав)=0,9 Р(Ан)=0,1
h – покупать акции
Bel(h)=0,9 Pl(h)=1- Bel(⌐h)=1
Вероятностный интервал доверия – [0.9; 1]
2)пригласили эксперта Б
Р(Бв)=0,8 Р(Бн)=0,2
Эксперт Б говорит h.
Нужно посчитать:
Р(Ав&Бв) = Р(Ав) Р(Бв) = 0,9
0,8 = 0,72
Р(Ан&Бн) = Р(Ан) Р(Бн) = 0,1
0,2 = 0,02
Р(Ав v Бв) = 1 - Р(Ав&Бв) = 1 – 0,02 = 0,98
Bel(h)=0,98 Pl(h)=1- Bel(⌐h)=1
Вероятностный интервал доверия – [0.98; 1]
-
А → h, Б → ⌐h
Р(Ав&Бн) = Р(Ав) Р(Бн) = 0,9
0,2 = 0,18
Р(Ан&Бв) = Р(Ан) Р(Бв) = 0,1
0,8 = 0,08
Р(Ан&Бн) = Р(Ан) Р(Бн) = 0,1
0,2 = 0,02
Р(Ав v Бв) = 1 - Р(Ав&Бв) = 0,18 + 0,08 + 0,02 = 0,28
Вероятностный интервал доверия h – [0.643; 0.714]
Вероятностный интервал доверия ⌐h – [0.286; 0.357]
-
Р(Aв)=0,9 Р(Бв)=0,9
-
А → h, Б → h
Вероятностный интервал доверия h – [0.99; 1]
-
А → h, Б → ⌐h
Вероятностный интервал доверия h – [0.47; 0.53]
Вероятностный интервал доверия ⌐h – [0.47; 0.53]
Правило объединения свидетельств
– образует всевозможные подмножества взаимоисключающих гипотез.
mn(H) – мера доверия к гипотезе Н, а n – число источников свидетеств.
(*)
Пример
4 гипотезы: пациент – h1 – в шоке, h2 – грипп, h3 – мигрень, h4 – минингит
Свидетельство 1: у пациента лихорадка
m1({h1,h2,h4})=0.6
m1( )=0.4
Свидетельство 2: у пациента рвота
m2({h1,h2,h3})=0.7
m2( )=0.3
m1 | m2 | m3 |
m1({h1,h2,h4})=0.6 | m2({h1,h2,h3})=0.7 | m3({h1,h2})=0.42 |
m1( | m2({h1,h2,h3})=0.7 | m3({h1,h2,h3})=0.28 |
m1({h1,h2,h4})=0.6 | m2( | m3({h1,h2,h4})=0.18 |
m1( | m2( | m3( |
Вывод:
-
Высокая мера доверия
свидетельствует о конфликте свидетельств на множестве
-
При наличии большого множества гипотез и сложности свидетельств метод хотя и может привести к большим и сложным вычислениям, но их все же меньше, чем для Байесовской схемы.
-
Подход Демпстера-Шефера, основанный на свидетельствах, во многих приложениях позволяет более адекватно учитывать неопределенность, чем строгий Байесовский подход.
Вероятностная логика
Нильсон, Банди
Множество инциденций
w – множество элементарных событий
i(A), – инциденция А (множество элементарных событий, где А истинно)
Постулируется, что:
Для моделирования качественных рассуждений используются модальные логики (для представления правдоподобных рассуждений).
□ → L – вероятно
◊ → М
LA – вероятно А
LLA – вероятно, что вероятно А (менее вероятно, чем LA)
LnA слабее LmA, если n>m
Вводятся продукционные правила: если Е, то LnН
n – показатель доверия
Поиск решения в условиях неопределенности с использованием деревьев решения (ДР)
-
Конъюнктивные вершины
Р (ci&cj → R, k)
R
k
ci cj
k(ci) k(cj)
k(R) = f(k(ci),k)
-
Maxmin
k(R) = min{k(ci), k(cj)} k
-
Вероятностная логика
-
Дизъюнктивные вершины
Р(ci → R, ki)
Р(cj → R, kj)
R
ki kj
Pi Pj
ci cj
k(ci) k(cj)
-
Maxmin
k(R) = min{k(ci), k(cj)} k
-
Вероятностная логика
k(R) = k(ci) ki + k(cj)
kj + k(ci)
k(cj)
ki
kj
Пример
{Ri} – набор правил
{Fj} – наблюдаемые факторы (свидетельства)
{ci} – промежуточные заключения
R – целевое заключение
P1 = (F1 → c1, 0.8)
P2 = (F2 → c1, 0.7)
P3 = (F3 → c2, 1)
P4 = (F4&F5 → c3, 0.9)
P5 = (F6 → c6, 1)
P6 = (F7 → c6, 0.7)
P7 = (F8&F9 → c4, 0.4)
P8 = (c1&c2&c3 → c5, 0.9)
P9 = (c4→ c6, 0.8)
P10 = (c5&c6 → R, 1)
-
Построить ДР (обратный проход)
В
идим, что R выводимо и есть альтернативные пути решения (ДР строим сверху-вниз)
R
P10
c5 c6