48710 (588604), страница 3
Текст из файла (страница 3)
Имя второго слота, значение второго слота
Имя К-го слота, значение К-го слота
Незаполненный фрейм называется протофреймом, а заполненный — экзофреймом. Роль протофрейма как оболочки в экзофрейме весьма важна. Эта оболочка позволяет осуществлять процедуру внутренней интерпретации, благодаря которой данные в памяти системы не безлики, а имеют вполне определенный, известный системе смысл.
Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одну или несколько продукций (эвристик), с помощью которых это значение определяется. В слот может входить не одно, а несколько значений. Иногда этот слот включает компонент, называемый фасетом, который задает диапазон или перечень его возможных значений. Фасет указывает также граничные значения заполнителя слота.
Как уже отмечалось, помимо конкретного значения в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления этого значения. Среди них выделяют процедуры-демоны и процедуры-слуги. Первые запускаются автоматически при выполнении некоторого условия, а вторые активизируются только по специальному запросу. Если, например, фрейм, описывающий человека, включает слоты ДАТА РОЖДЕНИЯ и ВОЗРАСТ и в первом из них находится некоторое значение, то во втором слоте может стоять имя процедуры-демона, вычисляющей возраст по дате рождения и текущей дате и активизирующейся при каждом изменении текущей даты.
Совокупность фреймов, моделирующая какую-либо предметную область, представляет собой иерархическую структуру, в которую фреймы собираются с помощью родовидовых связей. На верхнем уровне иерархии находится фрейм, содержащий наиболее общую информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Эти значения могут передаваться по умолчанию фреймам, находящимся ниже них в иерархии, но если последние содержат собственные значения данных характеристик, то в качестве истинных принимаются именно они. Это обстоятельство позволяет без затруднений учитывать во фреймовых системах различного рода исключения.
Различают статические и динамические системы фреймов. В системах первого типа фреймы не могут быть изменены в процессе решения задачи, а в системах второго типа это допустимо.
О системах программирования, основанных на фреймах, говорят, что они являются объектно-ориентированными. Каждый фрейм соответствует некоторому объекту предметной области, а слоты содержат описывающие этот объект данные, то есть в слотах находятся значения признаков объектов. Фрейм может быть представлен в виде списка свойств, а если использовать средства базы данных, то в виде записи.
Наиболее ярко достоинства фреймовых систем представления знаний проявляются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений. Во фреймовых системах данные о родовидовых связях хранятся явно, как и знания других типов. Значения слотов представляются в системе в единственном экземпляре, поскольку включаются только в один фрейм, описывающий наиболее общие понятия из всех тех, которые содержит слот с данным именем. Такое свойство систем фреймов обеспечивает экономное размещение базы знаний в памяти компьютера. Еще одно достоинство фреймов состоит в том, что значение любого слота может быть вычислено с помощью соответствующих процедур или найдено эвристическими методами. То есть фреймы позволяют манипулировать как декларативными, так и процедурными знаниями.
К недостаткам фреймовых систем относят их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и увеличении трудоемкости внесения изменений в родовидовую иерархию. Поэтому большое внимание при разработке фреймовых систем уделяют наглядным способам отображения и эффективным средствам редактирования фреймовых структур.
Семантические сети
Семантическая сеть описывает знания в виде сетевых структур. В качестве вершин сети выступают понятия, факты, объекты, события и т. п., а в качестве дуг сети — отношения, которыми вершины связаны между собой. Так, семантическая сеть, представляющая знания об автомобиле гр. Васильева, показана на рис. П. 17.
Семантические сети часто рассматривают как общий формализм для представления знаний. Частным случаем таких сетей являются сценарии, в которых в качестве отношений выступают каузальные отношения или отношения типа «цель — средство».
Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Самыми распространенными являются следующие типы отношений:
БЫТЬ ЭЛЕМЕНТОМ КЛАССА (ЯВЛЯТЬСЯ) - означает, что объект входит в состав данного класса, например: ВАЗ 2106 является автомобилем;
ИМЕТЬ — позволяет задавать свойства объектов, например: жираф имеет длинную шею;
ЯВЛЯТЬСЯ СЛЕДСТВИЕМ — отражает причинно-следственные связи, например: астеническое состояние является следствием перенесенного простудного заболевания;
ИМЕТЬ ЗНАЧЕНИЕ — задает значение свойств объектов, например: пациент может иметь двух братьев.
Как и в системе, основанной на фреймах, в семантической сети могут быть представлены родовидовые отношения, которые позволяют реализовывать наследование свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают все недостатки и достоинства представления знаний в виде фреймов. Преимущества заключаются в простоте и наглядности описания предметной области. Однако последнее свойство с усложнением семантической сети теряется и, кроме того, существенно увеличивается время вывода. Также к недостаткам семантических сетей относят сложность обработки различного рода исключений.
Другие методы представления знаний
Из других методов представления знаний популярностью пользуется представление знаний по примерам. Работая с системой такого типа, пользователь задает ей несколько примеров решения задач из актуальной предметной области. На основе этих примеров система самостоятельно строит базу знаний, которая затем применяется для решения других задач. При создании базы знаний пользователь имеет возможность в любой момент вызвать на экран дисплея матрицу, состоящую из примеров задач и их решений, с тем чтобы установить в ней наличие пустых мест, которые необходимо заполнить недостающими примерами «задача—решение».
Знания в такой системе могут храниться в различной форме. Это может быть, например, интенсиональная форма, когда пользователь вводит в систему правила операций с атрибутами объектов предметной области, приводящие к требуемому решению. Также это может быть экстенсиональная форма, при которой каждый пример детально описывается пользователем и представляется в памяти компьютера в виде совокупности значений выделенных атрибутов. Возможно сочетание и той, и другой форм. В результате получается матрица примеров, которая может быть расширена или изменена лишь путем корректировки примеров, содержащихся в матрице, или их добавлением.
Основным достоинством представления знаний по примерам является простота данного способа, поскольку пользователь может не иметь ни малейшего представления о продукционных правилах, исчислении предикатов, фреймах и семантических сетях. Вместе с тем, в качестве недостатков метода представления знаний по примерам отмечают отсутствие гибкости процесса построения интеллектуальной системы. Пользователь оказывается отстраненным от собственно создания базы знаний и поэтому не может контролировать связи между содержащимися в ней понятиями.
Выбор способа представления знаний осуществляется инженером по знаниям после того, как им достигнуто понимание природы данных моделируемой области. При решении сложных задач возможны ситуации, когда источники знаний различаются по типам, и, соответственно, представление таких знаний требует использования разных способов (смешанное представление). Тогда для продуктивного функционирования интеллектуальной системы нередко применяют принцип доски объявлений, с помощью которого реализуется взаимодействие различных независимых источников знаний.
1.3. Приобретение знаний
Извлечение знаний – процесс взаимодействия инженера по знаниям с источником знаний (экспертом), в результате которого становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. Занимается извлечением знаний инженер по знаниям. Инженер по знаниям – это специалист по искусственному интеллекту, проектирующий и создающий экспертную систему. Обычно инженер по знаниям выступает в роли посредника между экспертом и базой знаний.
Для получения знаний инженером по знаниям ему необходим эксперт. Эксперт – это специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области. Эксперт – это специалист, который может делать экспертные оценки. Экспертные оценки – это основанные на суждениях специалистов количественные или бальные оценки процессов или явлений, не поддающихся непосредственному измерению.
Понятие «управление знаниями» (Knowledge Management, КМ) родилось в середине 90-х годов в крупных корпорациях, где проблемы обработки информации приобрели особую остроту, став критическими. Выяснилось, что основное узкое место - это обработка знаний, накопленных специалистами компании (именно такие знания обеспечивают ей преимущество перед конкурентами). Знание, которое не используется и не возрастает, и в конечном счете устаревает и становится бесполезным, точно так же, как деньги, которые хранятся, не превращаясь в оборотный капитал, в конечном счете обесцениваются. Знание же, которое распространяется, приобретается и обменивается, наоборот, генерирует новое знание. Существуют десятки определений знания, но в системах KM знания - это фундаментальный ресурс, базирующийся на практическом опыте специалистов и на данных, используемых на конкретном предприятии.
Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, в них входят методики, технологии, процедуры обработки информации, накопившиеся в процессе функционирования предприятия; руководства, письма, новости, сведения о заказчиках и конкурентах, схемы, чертежи и другие данные. Традиционно проектировщики систем КМ ориентируются в основном на менеджеров, хотя есть и тенденция принимать в расчет более широкий круг работников организации.
Для интеграции в единый комплекс системы KM используют ряд технологий:
-
традиционные системы автоматизации и информационно-поисковые системы;
-
электронную почту, корпоративные сети и Интернет-сервисы;
-
базы и хранилища данных (data warehouse);
-
системы электронного документооборота;
-
специализированные программы обработки данных (например, статистического анализа);
-
экспертные системы и базы знаний.
При разработке систем КМ можно выделить следующие этапы.
Накопление. Стихийное и бессистемное накопление информации в организации.
Извлечение. Процесс переноса компетентности специалистов на аналитика. Это один из наиболее сложных и трудоемких этапов, от его успешности зависит дальнейшая жизнеспособность системы.
Структурирование и формализация. На этом этапе должны быть выделены основные понятия, выработана структура представления информации. Она должна быть максимально наглядной и такой, чтобы ее было легко изменять и дополнять. Именно на этом этапе создаются описания и модели бизнес процессов и структуры потоков информации.
Проектирование системы. Предметная постановка задачи, разработка архитектуры и спецификаций для программирования.
Программная реализация. Разработка собственно программного комплекса системы.
Обслуживание. Под ним понимается корректировка формализованных данных и знаний (добавление, обновление); «чистка» - удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.
Это не единственно возможное описание процесса разработки, но оно позволяет понять, что происходит при создании реальных систем управления знаниями. В литературе достаточно подробно описаны лишь этапы проектирования и реализации, при том, что основную сложность представляют этапы извлечения и структурирования. Мало кто из разработчиков знает, что существует наука под названием «инженерия знаний» (knowledge engineering), возникшая в русле разработки интеллектуальных систем, или систем, основанных на знаниях, примерно 15-20 лет назад.
Поскольку основная проблема инженерии знаний - это процесс извлечения знаний, разработчикам систем KM и в первую очередь аналитику необходимо четко понимать природу и особенности этих процессов. Можно выделить три основных аспекта процесса извлечения знаний:
A = {A1, А2, А3} = {психологический, лингвистический, гносеологический}.
Следует отметить, что даже если речь идет о разработке традиционной информационной системы, а не системы KM, проблемы инженерии знаний не теряют своей актуальности.
Из трех аспектов извлечения знаний наиболее важен психологический (А1), поскольку он определяет успешность и эффективность взаимодействия (общения) аналитика с основным источником знаний - специалистами предприятия.
1.3.1. Приобретение и извлечение знаний
Существует определение термина приобретение знаний: "Передача и преобразование опыта решения проблем, полученного от некоторого источника знаний, в программу".
Термин приобретение знаний носит обобщенный характер и совершенно нейтрален к способу передачи знаний. Например, передача может осуществляться с помощью специальной программы, которая в процессе обработки большого массива историй болезни устанавливает связь между симптомами и заболеваниями. А вот термин извлечение знаний относится именно к одному из способов передачи знаний — опросу экспертов в определенной проблемной области, который выполняется аналитиком или инженером по знаниям. Последний затем создает компьютерную программу, представляющую такие знания (или поручает это кому-нибудь другому, обеспечивая его всей необходимой информацией).
Этот же термин применяется и для обозначения процесса взаимодействия эксперта со специальной программой, целью которого является:
-
извлечь каким-либо систематическим способом знания, которыми обладает эксперт, например, предлагая эксперту репрезентативные задачи и фиксируя предлагаемые способы их решения;
-
сохранить полученные таким образом знания в некотором промежуточном виде;
-
преобразовать знания из промежуточного представления в вид, пригодный для практического использования в программе, например в набор порождающих правил.
Преимущество использования такой программы — снижение трудоемкости процесса, поскольку перенос знаний от эксперта к системе осуществляется в один прием.
1.3.2. Теоретический анализ процесса приобретения знаний
Стадии приобретения знаний















