Автореферат (1137151), страница 3
Текст из файла (страница 3)
Это позволяет совместить онтологию задач, задаваемую инфологическоймоделью, с онтологией предметной области.Для отображения в онтологии структуры инфологической модели выделим: из множества А подмножество AK ⊂ A — наименований классов; из множества W подмножество WR ⊂ W — наименований связей между классами.
Дополнив модель (1) множеством параметров атрибутов классов, В, и множествомпараметров атрибутов связей между классами T, выделим из множества B подмножество B A ⊂ B — наименований атрибутов классов и из множества T подмножество TR ⊂ T — наименований атрибутов связей между классами.Тогда подмножество понятий онтологической модели, D1 ⊂ D , описывающее структуру инфологической модели, D1 = AK U WR U BA UT R .Подмножество связей между понятиями онтологической модели, C1 ⊂ C ,описывающее структуру связей инфологической модели, включает E1К — множество связей между понятиями-наименованиями классов и понятиями-атрибутамиклассов, множество связей между понятиями-наименованиями связей и понятиями-наименованиями классов. В инфологической модели объекты сообществапредставлены как экземпляры классов.
В тоже время инфологическая модель, какправило, наряду с классами, описывающими реальные объекты сообщества, содержит классы вспомогательных объектов, необходимых для описания процессоввнутри сообщества, которые не несут информации о предметной области. Выделим в модели (1) множество информационных объектов, обладающих знаниями опредметной области («контейнеры знаний»), в явном виде:— O = {oi | iO = 1,..., N O } — множество информационных объектов сообOщества, где oi - iO -ый объект,O— K I = {ki | iO = 1,..., N O } - множество классов информационных объектовOсообщества, где ki - класс, к которому принадлежит iO - ый объект; K I ⊂ K .Для множества К1 введем множество механизмов классов:X I = {xi | io = 1,..., N o } , где xi — механизм io -го класса, задающий функциюOoo13f i : o →< D, C > отображения объекта o, принадлежащего к классу k i на множества онтологической модели предметной области сообщества D и С,X o ⊂ X , где X — множество всех механизмов классов модели М1 .
Механизмпреобразует инфологическое представление объекта в онтологическую модельобъекта M o = Do , Co , где Do ⊂ D , Сo ⊂ С .Для создания программного обеспечения, поддерживающего функциониoOрование сообщества, важно, чтобы представление сообщества на разных уровнях абстрагирования и иерархии было методологически единым. Учитывая, чтоформирование понятийного пространства сообщества, так же, как и модерирование объектов сообщества предполагает ручные операции, связанные с отбором объектов и уточнением связей между ними, целесообразно понятийноепространство модели представить также, как и информационное, в формате, который может быть программно реализован в реляционной базе данных.Дополним множество классов К модели M1 множеством понятий D онтологии M 2 , рассматривая их как отдельные классы, для которых введем множество AD, расширяющее выразительные возможности онтологии.
ПустьK ′ = K U D . Аналогично дополним множество связей между классами R, множеством связей между понятиями онтологии, С, для которых введем множествоWC. Пусть R′ = R U C ; расширенное множество атрибутов классов A′ = A U AD ;расширенное множество атрибутов связей W ′ = W U WC .
Введем новые отображения: Z K ′A′ : A′ → K ′ — отображение множества атрибутов классов на множество классов; Z R′W ′ : W ′ → R′ — отображение множества атрибутов связей намножество связей.Тогда модель сообщества практики примет видM 3 =< K ′, A′, R′,W ′, Z K ′A′ , Z R W ′ , O, K I , X I >(3)На каждом из уровней иерархии объекты сообщества представляютсяаналогичной моделью, компоненты которой являются подмножествами множеств модели М3. Это позволяет развивать модель сообщества «снизу-вверх»,проводя мониторинг изменений информационных объектов и доменов объектов, что позволяет избежать разрыва между доменом сообщества и совокупно14стью доменов его объектов, что является одной из проблем сетевых сообществ.В третьей главе описываются задачи функционирования сетевого сооб-щества практики и предлагаются методы их решения.
В частности, решаютсятакие задачи, как: определение сходства онтологий, определение кластеровобъектов сети, включение нового объекта в состав сообщества, модернизациядомена сети.При решении этих задач используется тот факт, что объекты сетевого сообщества практики описаны в нашей работе с использованием онтологическихмоделей. Приводится подробное описание разработанных методов вычисленияблизости онтологий объектов, позволяющую количественно определить схожесть двух объектов сетевого сообщества. Предлагается использовать разработанные методы при проектировании программно-сервисной компоненты – сервера отношений.
На основании экспериментальных данных предлагается использовать меру сходства Жаккарда (экспериментальные данные приведены нарис. 1.) как наиболее точно определяющую сходство объектов. Она располагается ближе всех мер сходства к прямой, зависящей от процента одинаковых понятий в сравниваемых объектах, полученной при помощи экспертов.Рис. 1. Результаты эксперимента по выбору меры сходства15Методика установления отношений между объектами сетевого сообщества. Задача установления отношений между объектами сетевого сообщест-ва решается как задача установления степени сходства между локальными онтологиями объектов.
Исходными данными являются заранее построенные онтологии объектов сетевого сообщества. Методика установления отношений выглядит следующим образом:Для всех пар объектов, представленных онтологиями Ω i и Ω i +1 , подлежащих сравнению, выполняются следующие действия:1. Определяются множества общих элементов, при этом учитываются какпонятия, так и связи между понятиями:aп = DΩ I DΩii +1и ac = C Ω I CΩ .ii +12. Вычисляются степени общности двух множеств по формуле:S Jac =a.p1 + p 2 − aОбщая онтология сетевого сообщества практики строится на основаниидоступной информации о пользователях включая их профили и отражает результаты их деятельности, выраженные в научных работах, проектах, всевозможных публикациях и др.
Общая онтология Ω может быть сформирована сприменение двух подходов: автоматическом, когда происходит анализ всей информации о пользователях сообщества без вмешательства эксперта, и полуавтоматический, когда эксперт в режиме диалога с ЭВМ принимает решения овариантах построения онтологии.
Отметим, что второй подход реализуется какавтоматизированный и зачастую эксперту необходимо выбирать из предложенных вариантов. Предполагается, что при построении общей онтологии происходит анализ множества документов, в которых заключается информация опользователях и связанная с их деятельностью. При анализе документов следует обеспечить минимальную дублируемость информационных элементов и минимизировать связи между информационными элементами. Анализ документовпредполагает разбор каждого предложения, с выделением значимых информа-16ционных элементов и связей между ними. В результате документ разбиваетсяна n групп, где n – количество предложений в документе.Метод формирования групп объектов.
Задача разбиения объектов сете-вого сообщества практики, которые представлены в виде документов, на группы объектов схожих по тематике, представляет собой задачу кластеризации документов в пространстве весовых коэффициентов терминов. Кластеризация документов – процесс выявления семантически похожих групп документов, приэтом, в отличие от классификации, никакие характеристики групп не задаютсязаранее.Учитывая специфику представления данных в модели предметной областисетевого сообщества, становится возможным получать более точную кластеризацию. Для этого предлагается использовать дополнительную кластеризацию посвязям между понятиями объектов.
Результаты кластеризации наборов объектовпо понятиям и дополнительной кластеризации по связям приведены на рис. 2.Кластеризация объектов сетевого сообществаКоличество кластеров16141210Кластеризация по понятиямКластеризация по связям8642072450115120270290300350Количество объектовРис.
2. Кластеризация объектов сетевого сообщества по понятиям и связямЭксперименты показывают, что использование в качестве параметров кластеризации связей между понятиями, позволяет получить кластеры, в которыхсреднее значение сходства объектов выше по сравнению с кластеризациейтолько с использованием понятий, при этом границы кластеров хорошо разли-17чимы. Это происходит в тех случаях, когда при дополнительной кластеризацииобразуются дополнительные кластеры.Методика классификации объектов сетевого сообщества практики.Исходными данными являются заранее построенные онтологии объектов сетевого сообщества практики.
Как правило, при классификации используются онтологии кластеров Ω k сетевого сообщества и онтологии внешних Ω' и внутренних объектов Ω о . Компоненты онтологий Ω k , Ω о принадлежат общей онтологии сетевого сообщества Ω . Методика представима в виде последовательности следующих шагов:1. Ввод объектов, представленных отологиями Ω k или Ω о , подлежащихклассификации и указание порогового значения Rп.2. Задание групп, существующих в сообществе, к которым необходимоотнести объекты. Каждая группа представлена онтологией Ω k .3. Выбор пары двух множеств из пунктов 1 и 2.4.
Определение множества общих элементов, учитываются понятия и связи между понятиями:aп = DΩk I DΩо и ac = DΩk I DΩо .5. Вычисление степени общности двух множеств по формулеS Jac =a.p1 + p 2 − a6 Сравнение полученного значения S Jak с Rп.7. Если полученное значение S Jak больше Rп, то отнесение объекта к текущему кластеру, в противном случае выбирается следующий кластер и переход к шагу 4.8.
Проверка просмотрены ли все пары, если нет, то на шаг 3.Модернизация домена сети. В процессе функционирования сетевого со-общества практики неизменно происходит его развитие за счет творческогопроцесса его участников. В сообществе появляются новые результаты научнойи практической деятельности его участников, какие то результаты устаревают итеряют свою актуальность. Подобный процесс развития сетевого сообщества18неизбежно приводит к изменению его предметной области. Домен сетевого сообщества всегда должен находится в актуальном состоянии, и отражать процессы, происходящие в сетевом коллективе. Обязательной является возможность учитывать вектор развитие сетевого сообщества.
Это позволит отслеживать развитие тематической направленности работы сообщества со временем и,возможно, будет способствовать правильному выбору направлений научныхтематик.Возможны два направления модернизации домена сетевого сообществапрактики:1. Без изменения структуры. Суть подобной модернизации заключается визменении весов понятий и связей общей онтологии домена сети. Подобныйподход может быть применим, когда происходят дискуссии, рецензии, комментарии материалов внутри сообщества без добавления новых работ.2.
С изменением структуры. Стоит отметить, что при подобном подходеможет в общей онтологии домена сети происходить два вида изменений, связанных как с добавлением или удалением понятий, так и добавлением или удалением связей между понятиями. Ситуация, когда необходимо изменять онтологию сетевого сообщества, чаще всего происходит при добавлении новогочлена сети или новых материалов.Добавление новых объектов в сетевое сообщество практики и связанное сэтим изменение общей онтологии домена сети происходит с учетом анализановых объектов на предмет соответствия области деятельности сообщества.Предварительно происходит оценивание нового объекта с использованием меры близости.Первым этапом является построение онтологии нового объекта на основеимеющейся информации о нем.На втором этапе происходит сравнение онтологии домена сети с онтологией нового объекта.