Диссертация (1136162), страница 20
Текст из файла (страница 20)
В отличие от интенсионала, подстановки и конкретизации,экстенсионал является инвариантом по отношению к интерпретации фрейма.В настоящей модели в диаграммах для концептов и простых фреймовразличаются ролевые (role) и степенные (range) дуги. Первые подразделяются надуги ролей (“c”), характеристик (“ch”) и значений (“v”), а вторые – на дугиконкретизаций (“i”), типов (“t”) и кардинальности, и их семантика определяетсяхарактером и процедурными расширениями фрейма (аналогичными с языкомманипулирования гетерогенными ОД Oracle PL\SQL).Дуга типа от переменной x к домену D означает, что переменной x вкачестве значений могут быть присвоены только элементы из D.
Дугаконкретизации от константы c к домену D означает, что константа c имеет типD. Аналогично, дуга от фрейма F1 к фрейму F2 означает, что фрейм F1 являетсяконкретизацией фрейма F2 в допустимых интерпретациях семантической сети.110Рисунок 2.9. Пример фрейма конъюнкцииСогласновведеннымобозначениям,графическаяинтерпретацияконкретизации фрейма F (см. рисунок 2.5) может быть представлена другимфреймом F' (см. рисунок 2.8), дуги которого маркируются аналогично дугамфрейма F, а переменные замещены на константы соответствующих типов(конкретизация фрейма обозначается дугой типа “i”).
Данная конкретизацияописывается высказыванием: "(Контент)-менеджер Сергей Зыков ('sergey.zykov')публикует('publish')наинтернет-сайтеГруппыкомпаний"ИТЕРА"('www.iteragroup.com') финансовый отчет ('fin.report')".Изложенныедостаточнуюдляэлементывизуальногосоставляютосновумоделированиямодели,интеграциипрактическиданныхвгетерогенных КПК на основе теории семантических сетей.Разработаем обобщенный алгоритм интеграции и управления контентомв гетерогенных О(М)Д в КПК, основанный на теории семантических сетей для111ряда элементарных операций (вставка, удаление и обновление контента),включающий механизмы с учетом контроля допустимости (validation)гетерогенных О(М)Д и трансляции КМ объединенного КПК в нормализованнуюинтегрированную РБД.Совокупность перечисленных алгоритмов и процедур является важнойсоставляющей разработанной технологии интеграции данных и управленияконтентомКПКприинструментальныхпомощисредстввизуальныхинтеграциипредметно-ориентированныхданных,основанныхнаКМ(ConceptModeller), а также сопряженных с ними RAD-инструментов.Рассмотрим расширенный понятийный аппарат, применяемый длявизуальной интеграции данных в гетерогенных КПК, в основе которогоположены теории семантических сетей и РБД.Длякомбинированияфреймовбудемиспользоватьлогические(конъюнкция, дизъюнкция и отрицание), причинные (предпосылка 'prereq',следствие 'effect') и временные («до того, как» – 'before') связки.Пример конъюнкции двух простых фреймов (рисунок 2.9) может бытьситуативноописаннаестественномязыкеследующимобразом:"Контентменеджеры ('MANAGER') публикуют ('publish') контент ('CONTENT')на интернет-сайтах ('WEBSITE') в соответствии с квотами ('quota')".Приконструированииагрегированныхфреймовинтенсионалыконъюнкции (дизъюнкции) F двух простых фреймов F1 и F2 определяютсясоответственно из соотношений IF = IF & IF12и IF = I F | IF .12Фреймы с причинно-следственными связками или фреймы сценариев(scenario, script) положены в основу модели персонифицированного доступа кконтенту КПК и обработки О(М)Д.
На сходных принципах построены языкисценариев или скрипты (JavaScript и др.).На рисунке 2.10 представлен пример сценария с причинно-следственнымисвязями событий ("заявка" ('request'), "публикация" ('publish') и "появление"('appear')).Примериллюстрируетвзаимодействиеразличныхклассов112пользователей ИС: редактора ('EDITOR') и контент-менеджера ('MANAGER')при публикации контента ('CONTENT') в среде интернет-вычислений.ISA-иерархияВ целях сохранения адекватности фреймовой модели для (групп)гетерогенных ОД произвольного уровня абстракции произведем интерпретациюклассификации концептов, согласно которой объекты, выделенные экспертом впредметной области, разделяются на классы или категории на основе сходныхчерт или общих свойств. Этот подход естественным образом переносится наструктуру предметной области корпоративных порталов: как пользователей, таки HTML-страницы можно объединять в многоуровневые группы по тематике иуровню доступа к контенту.
При этом интерпретация первичного концептапредставляет собой класс с конкретизациями в форме объектов.Для формализации такой классификации адекватно рефлексивное итранзитивное отношение частичного порядка ISA ("является одним из") свозникающей ISA-иерархией концептов, графически представимой дугой, сметкой 'ISA' от концепта C1 к концепту C2, если при любых интерпретациях C1 иC2 каждая конкретизация C1 является одной из конкретизаций C2 (транзитивныеISA-дуги опускаются). Одним из наиболее существенных свойств ISA-иерархииявляется наследование свойств более абстрактных первичных концептов ихконкретизациями ("сверху вниз" по иерархии в графическом представлении).113Рисунок 2.10. Пример причинно-следственного фрейма114Рисунок 2.11. Пример ISA-иерархииНапример, "ресурсная квота" ('quota') как свойство пользователя портала(USER)наследуетсяредактором(EDITOR),главнымредактором(EDITOR.IN.CHIEF) и т.д.Важность свойства наследования (inheritance) для моделей объектовданныхвгетерогенныхКПК,проявленногосемантическимисетями,аргументирует адекватность предложенного математического аппарата длямоделирования свойств предметных областей высокой сложности.Построенная на основе отношения частичного порядка ISA-иерархияперсоналаможетслужитьважнымоснованиемдлясемантическогоразграничения прав доступа к гетерогенным данным пользователей КПК (пример115распределения прав доступа к данным на основе иерархии метаданных дан нарисунке 2.11).Для достижения необходимой функциональности и иллюстративностинеобходимо дополнить развитые выше конструктивные элементы и способыкомбинирования следующими механизмами:•фреймы определений для гетерогенных данных и метаданных в КПК;•процедурные расширения (функции распознавания, логические ипричинно-следственные функции);•расширения для контроля структуры гетерогенных данных в КПК (вчастности, кардинальности), т.е.
для управления данными на основе метаданных;•операторы(логические,причинно-следственные,выбора,квантификации, а также аналоги реляционных операторов).При этом возникает алгебра концептов с набором операций, близких к РМДКодда и строится алгоритм отображения гетерогенных О(М)Д из семантическихсетей в схемы РБД.Отношение концепта соответствует первичному концепту (домену).Строки данного унарного отношения заполняются конкретизациями концепта,причем первая строка обозначает класс отношения (Concept), вторая – название(WEBSITE), а третья – имя атрибута R1(x):ConceptR1WEBSITEXКонцепт WEBSITE, связанный с построенным отношением R1, называетсяреализованным, если его конкретизация хранится в соответствующем отношениисхемы данных гетерогенной БД, а выборка происходит в соответствии сзапросами пользователей КПК (по необходимости).Отношение события соответствует фрейму события с конкретизациями вгетерогенной БД и определено на концептах, "заполняющих" роли фрейма116(например, событие "публикация" – см.
рисунок 2.5 – отображается в отношениеPUBLISH):AgentMANAGERobjectdestinationCONTENTWEBSITEyzXВ схеме описания метаданных отношения первая строка (кортеж) содержитназвания ролей, вторая – названия отношения и доменов атрибутов, третья –имена атрибутов, причем константные роли не отображаются в атрибутыотношения. При этом только роли первой строки отношения являютсясемантически информативными. В рассматриваемом отношении отсутствуютограничения на атрибуты (в частности, не выделен ключевой атрибут), в связи счем при совместном использовании отношения и фрейма события информация вдвух первых строках является избыточной.Отношение характеристики (см. рисунок 2.6) соответствует фреймухарактеристики и определено на характеризуемом концепте и концептезначений:ConceptRCharUSERQUOTA.VALUExyПредположения для обобщения модели интеграции данных в КПКДля фреймов с множественными событиями или характеристикамивозникают дополнительные отношения, учитывающие, например, логическиеили причинные связки.
При этом предполагается, что ограничения накомпонентыфреймаCFiдостаточныдля обеспечениясвязикаждойконкретизации отношения фрейма CF с соответствующей конкретизацией другихjотношенийфреймовCF1 ,CF2 , ... .Невыполнениеэтогопредположениясвидетельствует, что рассматриваемые отношения не должны быть частямиодного и того же фрейма, а выполнение гарантирует, что обновление одного117отношения предоставляет достаточную информацию для обновления другихотношений в модели, порожденных тем же фреймом, что и первое.Другое предположение состоит в нормализованности формы вершинсемантической сети, представляющих степенные множества (power set) илиотношения типа «сорт-степень» [260].