Лекции по экспертным системам (549046), страница 2
Текст из файла (страница 2)
Конец 50х-60е – логическая парадигма (моделирование левополушарных механизмов)
Была построена GPS (Newell, Shaw, Simon)
1958г – LISP (McCarthy)
70е – Prolog
70е годы – отказались от парадигмы универсальных решений; упор на системы, основанные на знаниях (ЭС); ориентировка на решение определенного класса задач на уровне эксперта.
Для плохо формализованных слабо структурированных задач:
F (x) → ext
x Xдоп
Модели (средства) представления знаний:
-
Логические МПЗ (ИППП) → неклассические логики
Дедукция → абдукция + индукция + аналогии + аргументация
-
Продукционные МПЗ (90% всех систем)
С помощью правил продукции «если <УП>, то <результат, k>»
1975г – OPS5 (написан на LISP): правила продукции + фреймы; плохо представляются структурированные знания (поэтому использовались фреймы)
1965г – Dendral (спектрограммы)
1969г – Macsima
70е годы – системы Hearsai I → Hearsai II – агент-коммуникатор (идея классной доски); Mycin → ЕMycin → Teirasias Prospection (полезные ископаемые, используется байесовский метод) → Kas
-
Модели представления структурированных знаний
Семантические сети и фреймы (M. Minsky)
< имя фрейма, <слот>>
<имя слота, тело, комметарий>
-
Интегрированные (объектно-ориентированные) МПЗ
85г – CLIPS(COOL)
1948г – Н.Виннер «Кибернетика»
1955г – «Логик-теоретик», Newell, Simon, Shaw
1955-56г – J. McCarthy → AI
1956г – школа-семинар – официально озвучили термин AI
1957г – универсальный решатель задач GPS
1971-74г – Prolog
Начало 70х – новые исследования в ИИ (ЭС) и представлении знаний, работы по анализу естественного языка и машинного обучения, машинное зрение и тп.
1975г – Minsky предложил Frame
Середина 70х – ЭС – Dendral и Mycin
Конец 70х – первые коммерческие ЭС: XCon для фирмы Dec (3000 правил, позволила комплектовать 10 типов компьютеров)
У стройство: дисковод
Т ип: Е1203 фрейм
…
1980г - создание американской ассоциации ИИ (AAAI)
-
Середина 80х – бум по поводу успехов ЭС
-
Prospector
-
Folio
-
Willard
-
Empty и Shell (пустые ЭС и системные оболочки)
-
LISP и Prolog машины для разработки ЭС
Конец 80х – проблемы:
-
сложность поддержки массивных БЗ,
-
негибкость,
-
высокая стоимость разработки,
-
трудности работы с противоречиями,
-
невозможность обмена знаниями между ЭС,
-
необучаемость,
-
проблема извлечения и структурирования знаний.
Появилось направление «Инженерия Знаний» (Knowledge Engineering)
Статические ЭС
Интерфейс с внешними программными средствами
Ядро ЭС
Пользователь
Блок приобретения и накопления знаний
Блок объяснения результата
Интерфейс пользователя
ЛПР Э (КЕ)












-
ф
этапы
ормирование знаний → полнота, неопределенность -
принятие решений
1997г – Deep Blue vs Каспаров
Конец 1999-2000е – коммерческие ИС:
-
Звук в текст (распознавание речи > 100 тыс слов+дикторский текст, распознавание голосовых сообщений <1000 слов+ «зашумленные» данные)
-
Автоматизированное реферирование текста (Semantic Web)
-
СППР (финансы, банковская сфера)
-
Множественные ЭС
-
Системы-помощники (Help Desk Support Systems)
-
Интегрированные и динамические ЭС
Динамические ЭС:
С татическая ЭС Блок моделирования
-
Генерация исходной информации
-
Прогнозы при нескольких вариантах решения
-
Прогнозы последствий принимаемых решений



Интерфейс с внешним объектом
Датчики Контроллеры
Rethink
GDA
NeurOnline (моделирование нейронных сетей)
G
2
Основные преимущества ЭС:
-
Расширение сферы решаемых задач на трудно формализуемые и слабо структурированные
-
Тиражирование уникальных знаний экспертов
-
Устранение недостатков современного программирования
-
Объединение технологии ИИ и современного программирования
-
Широкая доступность ЭС
-
Робастность ЭС (по мере ухудшения исходных данных уменьшается качество ответа, но система не отказывается найти его)
-
Устойчивость работы
-
Быстрый отклик системы, возможность объяснения результата
-
Используются как интеллектуальный доступ к информации и в качестве учителя
Классификация ЭС как приложений
-
По типу приложения
-
взаимозависимость с внешними программыми средствами (ЭТ, СУБД, датчики, контроллеры)
-
изолированные \ интегрированные
-
возможность модификации
закрытая \ открытая
-
переносимость&масштабируемость
непереносимые \ переносимые
немасштабируемые \ масштабируемые
-
по архитектуре
ориентированные на централизованную архитектуру (или отдельные копии ОС на компьютерах, или на одну ОС по всем компьютерам) \ ЭС
-
По типу проблемной области
Тип проблемной области = f (тип предметной области, тип решаемой задачи)
-
Тип предметной области
-
Характеристика предметной области
-
Статическая \ динамическая
-
Способ описания элементов БД
Фиксированный состав \ изменяемый состав
-
Способ организации БЗ
Неструктурированная \ структурированная
продукционные правила и тп. сети, фреймы, антологии
-
Тип решаемых задач
-
Форма
-
Замкнутая \ открытая
-
Класс решаемых задач
-
Задачи анализа: интерпретация, диагностика, мониторинг
-
Задачи синтеза: планирование, проектирование
-
Комбинированные задачи: управление, обучение
-
Тип используемых утверждений
Частные(специальные) \ обобщенные
Конкретный случай возможно использование конструкции типа предикатов
-
Отношение к реальному времени
С РВ \ не СРВ
-
Псевдо РВ (время не критично, ограничено некоторыми рамками)
-
Мягкое РВ (> 1 cек) (подавляющее большинство систем)
-
Жесткое РВ (< 0.5-1 сек)
Статические проблемные области = статическая предметная область + фиксированный состав элементов в БД + неструктурированная БЗ + решаются статические задачи анализа в замкнутой форме + используются частные утверждения + нет РВ. → статическая ЭС
Динамические проблемные области = динамическая предметная область + структурированная БЗ + изменяющийся состав элементов в БД + открытая форма задачи + обобщенные утверждения + РВ → динамическая ЭС
-
По стадии существования
Концепция прототипирования (ЭС проходит ряд стадий):
-
Демонстрационная стадия (демонстрационный прототип) (~0,5-1 год) – несколько десятков правил
-
Рабочий прототип (действующая версия, решает все задачи + краевые) (~1-2 года) – сотни обобщающих правил
-
Промышленная система (доработали интерфейс, оптимизация продукции) (~2 года)
-
Коммерческая система (более дружественный интерфейс, обобщение системы, маркетинг) (~1-3 года)
-
По типу используемой вычислительной системы
-
ПК (в основном обучающие)
-
Рабочие станции (основные системы)
-
суперЭВМ
-
специальные компьютеры (LISP, Prolog машины)
-
Методы обработки плохоопределенной информации в ИС (ЭС)
Природа неопределенности:
-
Неопределенность в исходной информации (данных)
Фактор с некоторым коэффициентом уверенности
-
Неопределенность в имеющихся знаниях
pi : (fi → Ri, ki)
-
Неопределенность в задании цели
Например цель задана качественно, а не количественно
Задача оптимизации
F (x) → ext
x Xk
p i : (ci → Ri, ki)
условие результат
k(Ri) = f(ki, k(ci)) – если исходные данные недостоверны.
Наиболее часто используются
-
Модель maxmin (наиболее осторожная, но не гибкая)
-
Вероятностная модель (теория вероятности)
Теоретико-вероятностные методы оперирования с неопределенностью
-
Схема Байеса
pi = (ci → Ri, ki)
Ei – свидетельство Hi – гипотеза P(H|E) = P(E|H) =
Условная вероятность
Формула Байеса
P(H|E) = def
P(E) = P(E|H)P(H) + P(E|⌐H)P(⌐H)
Модифицированная схема Байеса:
Апостериорный шанс отношение правдоподобия априорный шанс
R(H|E) O(H)
Шанс справедливости гипотезы Н:
Отношение правдоподобия:
P(H)=
O(H|E)=R(H|E) O(H) – модифицированная схема Байеса
P(H|E)=
Если R(H|E) = 1, свидетельство нейтральное (P(E|H) = P(E| )
Если R(H|E) < 1, в качестве свидетельства используется контрсвидетельство, т.е. Е противоречит гипотезе.
Если R(H|E)>1, Е – свидетельство.
P(H|E)


R(H|E)
∆1 – отбросить Н
∆3 – принять Н как достоверную
∆2 – P(H|E) – степень правдоподобия
Ряд свидетельств {Ei}, i=1..n, используется для ряда гипотез {Hj}, j=1..n
P(H|E1..En) – случай зависимости от многих свидетельств
В случае независимости свидетельств Ei справедливо:
O(H|E1..En) = R(H|E1) …
R(H|En)
O(H)
P(H|E1..En) = , т.е. схема Байеса применима
Определение важности свидетельства Ei: