Классификационные признаки экспертных систем
3.1. Классификационные признаки экспертных систем
Экспертные системы как любой сложный объект можно определить только совокупностью характеристик. В основе классификации экспертных систем (будем называть их приложениями) лежат следующие характеристики: назначение, тип приложения, тип проблемной среды, глубина анализа проблемной области, тип используемых методов и знаний, стадия существования, инструментальные средства (ИС), масштаб. Перечисленный набор характеристик не претендует на полноту (в связи с отсутствием общепринятой классификации), а определяет ЭС как целое, не выделяя отдельных компонентов (способ представления знаний, решения задачи и т. п.).
Назначение определяется следующей совокупностью параметров: цель создания ЭС — для обучения специалистов, для решения задач, для автоматизации рутинных работ, для тиражирования знаний экспертов и т. п.; основной пользователь - не специалист в области экспертизы, специалист, учащийся.
Тип приложения. Характеризуется следующими признаками.
1. Возможность взаимодействия приложения с другими программными средствами:
• изолированное приложение — ЭС, не способная взаимодействовать с другими программными системами (например, с БД, электронными таблицами, пакетами прикладных программ, контроллерами, датчиками и т.п.);
• интегрированное приложение — ЭС и другие программные системы, с которыми она взаимодействует в ходе работы. Большинство современных ЭС, используемых для решения практически значимых задач, являются интегрированными.
2. Возможность исполнять приложение на разнородной аппаратуре и переносить его на различные платформы:
• закрытые приложения — исполняются только в программной среде данной фирмы и могут быть перенесены на другие платформы только путем перепрограммирования приложения;
Рекомендуемые материалы
• открытые приложения — ориентированы на исполнение в разнородном программно-аппаратном окружении и могут быть перенесены на другие платформы без перепрограммирования.
3. Архитектура приложения:
• централизованное приложение — реализуется на базе центральной ЭВМ, с которой связаны терминалы;
• распределенное приложение — обычно используется архитектура клиент-сервер.
Стадия существования характеризует степень проработанности и отлаженности ЭС. Обычно выделяют следующие стадии: демонстрационный прототип; исследовательский прототип; действующий прототип; промышленная система; коммерческая система.
Демонстрационным прототипом называют ЭС, которая решает часть требуемых задач, демонстрируя жизнеспособность метода инженерии знаний. При наличии развитых ИС для разработки демонстрационного прототипа требуется в среднем примерно 1—2 мес., а при отсутствии — 12—18 мес. Демонстрационный прототип работает, имея в БЗ 50—100 правил. Развитие демонстрационного прототипа приводит к исследовательскому прототипу.
Исследовательским прототипом называют систему, которая решает все требуемые задачи, но неустойчива в работе и не полностью проверена. На доведение системы до стадии исследовательского прототипа уходит 3—6 мес. Исследовательский прототип обычно имеет в БЗ 200—500 правил, описывающих проблемную область.
Действующий прототип надежно решает все задачи, но для решения сложных задач может потребоваться чрезмерно много времени и (или) памяти. Для доведения системы до стадии действующего прототипа требуется 6— 12 мес., при этом количество правил в БЗ увеличивается до 500—1000.
Экспертная система, достигшая промышленной стадии, обеспечивает высокое качество решений всех задач при минимуме времени и памяти. Обычно процесс преобразования действующего прототипа в промышленную систему состоит в расширении БЗ (до 1000 – 1500 правил) и переписывании программ с использованием более эффективных ИС, например в перепрограммировании на языках низкого уровня. Для доведения ЭС от начала разработки до стадии промышленной системы требуется 1 – 1,5 года.
Обобщение задач, решаемых ЭС на стадии промышленной системы, позволяет перейти к стадии коммерческой системы – к системе, пригодной не только для собственного использования, но и для продажи различным потребителям. Для доведения системы до коммерческой стадии требуется 1,5 – 3 года и 0,3 – 5 млн. дол. При этом в БЗ системы 1500 – 3000 правил.
Масштаб ЭС. Характеризует сложность решаемых задач и связан с типом используемой ЭВМ. По этому признаку различают:
• малые ЭС — предназначены для первичного обучения и исследования возможности применения технологии ЭС для рассматриваемого класса задач. Системы такого типа могут быть реализованы на персональных компьютерах;
• средние ЭС — охватывают весь спектр необходимых приложений и обычно интегрированы с БД, электронными таблицами и т.д. Системы такого масштаба чаще всего реализуются на рабочих станциях;
• большие ЭС— имеют доступ к высокомощным БД и реализуются на рабочих станциях или на специализированных компьютерах;
• символьные ЭС — создаются с исследовательскими целями и реализуются на специализированных компьютерах, ориентированных на обработку символьных данных.
Тип проблемной среды. Это понятие включает описание предметной области (множество сущностей, описывающих множество объектов, их характеристик и отношений между объектами) и решаемых в ней задач. Иначе говоря, проблемная среда включает структуры данных и решаемые с ними задачи, представленные в виде исполняемых утверждений (правил, процедур, формул и т. п.). В связи с этим проблемная среда определяется характеристиками соответствующей предметной области и характеристиками типов решаемых в ней задач, каждая из которых может рассматриваться с точки зрения как конечного пользователя, так и разработчика ЭС.
Характеристики предметной области.
1. Тип предметной области:
• статический — входные данные не изменяются за время сеанса работы приложения, значения других (не входных) данных изменяются только самой экспертной системой;
• динамический — входные данные, поступающие из внешних источников, изменяются во времени, значения других данных изменяются ЭС или подсистемой моделирования внешнего окружения.
2. Способ описания сущностей предметной области:
• совокупность атрибутов и их значений (фиксированный состав сущностей);
• совокупность классов (объектов) и их экземпляров (изменяемый состав сущностей).
3. Способ организации сущностей в БЗ:
• неструктурированная БЗ;
• структурирование сущностей в БЗ по различным иерархиям («частное — общее», «часть — целое», «род — вид»), что обеспечивает наследование свойств сущностей.
Структурирование БЗ способствует:
• ограничению круга сущностей, которые должны рассматриваться механизмом вывода, и сокращению количества перебираемых вариантов в процессе выбора решения;
• обеспечению наследования свойств сущностей, т.е. передачи свойств вышерасположенных в иерархии сущностей нижерасположенным, что значительно упрощает процесс приобретения и использования знаний.
Характеристики задач.
1. Тип решаемых задач:
• задачи анализа или синтеза. В задаче анализа задана модель сущности и требуется определить неизвестные характеристики модели. В задаче синтеза задаются условия, которым должны удовлетворять характеристики «неизвестной» модели сущности, и требуется построить модель этой сущности. Решение задачи синтеза обычно включает задачу анализа как составную часть;
• статические или динамические задачи. Если задачи, решаемые ЭС, явно не учитывают фактор времени и/или не изменяют в процессе своего решения знания об окружающем мире, то говорят, что ЭС решает статические задачи, в противном случае говорят о решении динамических задач. Учитывая значимость времени в динамических проблемных средах, многие специалисты называют их приложениями, работающими в реальном времени. Обычно выделяют следующие системы реального времени: псевдореального времени, «мягкого» реального времени и «жесткого» реального времени. Системы псевдореального времени, как следует из названия, не являются системами реального времени, однако они, в отличие от статических систем, получают и обрабатывают данные, поступающие из внешних источников. Системы псевдореального времени решают задачу быстрее, чем происходят значимые изменения информации об окружающем мире.
2. Общность исполняемых утверждений:
• частные исполняемые утверждения, содержащие ссылки на конкретные сущности (объекты);
• общие исполняемые утверждения, относящиеся к любым сущностям заданного типа (вне зависимости от их числа и имени). Использование общих утверждений позволяет значительно лаконичнее представлять знания. Однако поскольку общие утверждения не содержат явных ссылок на конкретные сущности, для их использования каждый раз требуется определять те сущности, к которым они должны применяться.
Не все сочетания перечисленных выше параметров, характеризующих проблемную среду, встречаются на практике. Наиболее распространены следующие типы проблемных сред:
• статическая предметная область:
представление сущностей в виде совокупности атрибутов и их значений, неизменяемый состав сущностей, БЗ не структурирована, решаются статические задачи анализа, используются только частные исполняемые утверждения; представление сущностей объектами, изменяемый состав сущностей, БЗ структурирована, решаются статические задачи анализа и синтеза, используются общие и частные исполняемые утверждения;
• динамическая предметная область:
представление сущностей совокупностью атрибутов и их значений, неизменяемый состав сущностей, БЗ не структурирована, решаются динамические задачи анализа, используются частные исполняемые утверждения; представление сущностей в виде объектов, изменяемый состав сущностей, БЗ структурирована, решаются динамические задачи анализа и синтеза, используются общие и частные исполняемые утверждения.
С точки зрения пользователя, предметную область можно характеризовать описанием области в терминах пользователя, включающим наименование области, перечень и взаимоотношение подобластей и т. п., а задачи, решаемые существующими ЭС, — их типом. Обычно выделяют следующие типы задач:
По этому признаку различают следующие задачи:
• интерпретация данных — процесс определения смысла данных, результаты которого должны быть согласованными и корректными. Экспертные системы, как правило, проводят многовариантный анализ данных;
• диагностика — процесс соотнесения объекта с некоторым классом объектов и/или обнаружение неисправностей в системе (отклонений параметров системы от нормативных значений);
• мониторинг — непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы;
• проектирование — создание ранее не существовавшего объекта и подготовка спецификаций на создание объектов с заранее определенными свойствами. Степень новизны может быть разной и определяется видом знаний, заложенных в ЭС, и методами их обработки. Для организации эффективного проектирования и реинжиниринга требуется формировать не только сами проектные решения, но и мотивы их принятия. ЭС, решающие задачи проектирования, реализуют процедуры вывода решения и объяснения полученных результатов;
• прогнозирование — предсказание последствий некоторых событий или явлений на основе анализа имеющихся данных. Прогнозирующие ЭС логически выводят вероятные следствия из заданных ситуаций. В прогнозирующих ЭС в большинстве случаев используются динамические модели, в которых значения параметров «подгоняются» под заданную ситуацию. Выводимые из этих моделей следствия составляют основу для прогнозов с вероятностными оценками;
• планирование — построение планов действий объектов, способных выполнять некоторые функции. Работа ЭС по планированию основана на моделях поведения реальных объектов, которые позволяют проводить логический вывод последствий планируемой деятельности;
• обучение — использование компьютера для обучения каким-либо дисциплине или предмету. Экспертные системы обучения выполняют такие функции, как диагностика ошибок, подсказывание правильных решений; аккумулирование знаний о гипотетическом «ученике» и его характерных ошибках; диагностирование слабости в познаниях обучаемых и нахождение соответствующих средств для их ликвидации. Системы обучения способны планировать акт общения с учеником в зависимости от успехов ученика для передачи необходимых знаний;
• управление — функция организованной системы, поддерживающая определенный режим ее деятельности. Экспертные системы данного типа предназначены для управления поведением сложных систем в соответствии с заданными спецификациями;
• поддержка принятия решений — совокупность процедур, обеспечивающая лицо, принимающее решения, необходимой информацией и рекомендациями, облегчающими процесс принятия решения. Такого рода ЭС оказывают помощь специалистам в выборе и/или генерации наиболее рациональной альтернативы из множества возможных при принятии ответственных решений.
Задачи интерпретации данных, диагностики, поддержки принятия решений относятся к задачам анализа, задачи проектирования, планирования и управления — к задачам синтеза. К комбинированному типу задач относятся обучение, мониторинг и прогнозирование. Примеры ЭС, решающих различные прикладные задачи, можно найти в [4].
Вам также может быть полезна лекция "39. Метод электронного парамагнитного резонанса".
Решаемые задачи, с точки зрения разработчика ЭС, также можно разделить на статические и динамические. Будем говорить, что ЭС решает динамическую или статическую задачу, если процесс решения задачи изменяет или не изменяет исходные данные о текущем, состоянии предметной области.
Решаемые задачи, кроме того, можно характеризовать следующими аспектами: числом и сложностью правил, используемых в задаче; связностью правил; пространством поиска.
По степени сложности выделяют простые и сложные правила. К сложным относят правила, текст записи которых на естественном языке занимает 1/3 страницы и больше. Правила, текст которых занимает менее 1/3 страницы, относят к простым.
По степени связности правил задачи делят на связные и малосвязные. К связным относятся задачи (подзадачи), которые не удается разбить на независимые задачи. Малосвязные задачи удается разбить на некоторое количество независимых подзадач.
Можно сказать, что степень сложности задачи определяется не просто общим количеством правил данной задачи, а количеством правил в ее наиболее связной независимой подзадаче.
Пространство поиска может быть определено по крайней мере тремя подаспектами: размером, глубиной и шириной. Размер пространства поиска дает обобщенную характеристику сложности задачи. Выделяют малые (до 10! состояний) и большие (свыше 10! состояний) пространства поиска. Глубина пространства поиска характеризуется средним числом последовательно применяемых правил, преобразующих исходные данные в конечный результат, ширина пространства – средним числом правил, пригодных к выполнению в текущем состоянии.