МПЗиО_6_17_Онтологии (Лекции)
Описание файла
Файл "МПЗиО_6_17_Онтологии" внутри архива находится в папке "Лекции". PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "(мпзио) модели представления знаний и онтологии" из 11 семестр (3 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
ПРЕДСТАВЛЕНИЕЗНАНИЙ:ОНТОЛОГИИСОДЕРЖАНИЕ1. Понятие онтологии Компоненты онтологии2. Классификация онтологий3. Примеры онтологий Однородные легкие онтологии Онтологии высокого уровня4. Онтология CYC Особенности базы знаний и вывода5. Применение и разработка онтологий6.
Заключение и Домашнее задание2РАЗВИТИЕ ПЗ И ОНТОЛОГИИТермин онтология: появление в ИИ – 90-е гг.распространение: с начала 2000-х гг.К этому времени: развитые модели для представленияпонятийных, декларативных знаний(логическая, сетевая и фреймовая модели)Возможность представлять обширные фрагментызнания разнообразного видаПотребность обрабатывать большие объемы данныхв сети Интернет: концепция Semantic Web«Онтологии – ведущая парадигма структурированияинформационного контента»Близкие термины: концептуальная модель ПО,тезаурус3ПОНЯТИЕ ОНТОЛОГИИТермин онтология возник на стыке наук:Философия: учение о бытии – онтологияКогнитивная психология:лексикография , лексическая семантикасловарная категоризация, категоризация в лексиконеТеория информационного поиска:модели человеческих знанийкатегоризация с т. зрения обработки информации человекомЛингвистика:(учение о познании – гносеология)категоризация логических видов/типов бытующих сущностейкатегоризация тем документов: классификация/рубрикация;информационно-поисковый тезаурус (семантический словарь)Искусственный интеллект:категоризация для представления и обработки знаний,логического вывода на их основе4ОПРЕДЕЛЕНИЕ ОНТОЛОГИИРазные определения по степени точности: Неформально: Онтология – описание взгляда намир применительно к конкретной области интересов Онтология – инвентарь сущностей ПО, их описанийи описаний их связей Онтология – описание ПО, охватывающее: понятия (концепты) и их определения связи понятий (возможна иерархическая организация) правила их использования, ограничивающие ихзначения в рамках данной ПО«Онтология – формальная спецификациясогласованной концептуализации» (Т.
Грубер)(согласованной с сообществом: shared)5ОНТОЛОГИЯ: ВАЖНЫЕ АСПЕКТЫКонцептуализация (категоризация): выделениепонятий/сущностей ПОАбстракция: определенная точка зрения на мирСтруктуризация (систематизация) – выделениесвязей между понятиями/сущностямиФормализация: точность, однозначностьИнтерпретируемость компьютером(машиночитаемость)Разделяемость, согласованность (shared): отражаетне частное мнение, а определ. степень консенсуса ознаниях ПО для некоторой группы людейНезависимость от использования: для повторнойиспользуемости (в ряде задач)6КОМПОНЕНТЫ ОНТОЛОГИИВ общем случае онтология состоит изиерархии понятий, связей между ними изаконов, которые действуют в рамках этой моделиO = {C, R, A}O – онтологияС – совокупность понятий/концептов ПОи их внутренняя структураR – совокупность отношений/связей концептовA – набор аксиом (законов и правил), описывающихсвойства концептов, ограничения на их связиПо глубине проработки все онтологии делятся на Heavy-weighted: «весомые, тяжелые» онтологии,содержащие аксиомы Light-weighted: «легкие, легковесные» онтологиибез аксиом7КВАЗИОНТОЛОГИИОколо 80% разработанных онтологий относятсяк «легким» (без аксиом)Ресурсы онтологического характера (квазионтологии): Словник, Список терминов, Глоссарий (A = Ø, R = Ø ) Каталог, Оглавление, Иерархия (систематизация понятий) Традиционная таксономия (например, биология)– дизъюнктивные подклассы– транзитивность отношения Род-Вид (IS-A) Формальная таксономия– экземпляр класса-потомка является экземпляромкласса-предка Тезаурус (словарь понятий с семантическими связями:Выше-Ниже, Асоциация и др.)Реляционная таблица ?Структура гипертекста ?8СПЕКТР ТИПОВ ОНТОЛОГИЙ(Obrst, 2006)strong semanticsModal LogicFirst Order LogicLogical TheoryIs Disjoint Subclass ofwith transitivitypropertyDescription LogicDAML+OIL, OWLUMLConceptual ModelRDF/SXTMExtended ERThesaurusERRelationalModel, XMLweak semanticsSemantic InteroperabilityHas Narrower Meaning ThanDB Schemas, XML SchemaTaxonomyIs Subclass ofStructural InteroperabilityIs Sub-Classification ofSyntactic InteroperabilityКЛАССИФИКАЦИЯ ОНТОЛОГИЙОснования – разные характеристики онтологий: Наличие/отсутствие аксиом: весомые/легкие Содержимое, степень охвата областейОнтологии верхнего уровня (Upper Model), или General– знания Commonsence: например, онтология CYC– общие знания для нескольких ПООнтологии предметных областей (Domain-oriented):например, АвиаОнтология (авиация)Онтологии прикладных задач: TOVE (Toronto VirtualEnterprise Project) – представление модели корпорацииСтепень формализации, язык описанияНеформальныеФормализованныеФормальные: на спец.
языках (часто: языки логики)10КЛАССИФИКАЦИЯ: ПРОДОЛЖЕНИЕВладелец/пользователь онтологииОбщая методология построенияИндивидуальнаяГрупповая (сообщество, компания)ВсеобщаяОт слов к понятиям – лингвистическая онтологияОт понятий – понятийная онтологияТип отношений между понятиями Неоднородные Однородные– Таксономии: иерархия по связи IS-A– Партономии: иерархия по связи PART-OF– Генеалогии: отношение «Предок-Потомок»– Атрибутивные онтологии– Причинно-следственные11Partonomy (“Has-part”) ontology12Attributive ontologyTreeBuildingfeaturesGeobotanicalfeaturesPhysicalfeaturesAppearanceHeightDensityHumidityproofnessLeaffeaturesColourForm13Derivative ontology(Genealogy)808680888018680286803868048680586 intel Pentium IPentium MXPentium II68000 motorolaPentium XEON6801068030Pentium III14GenealogyMichelangeloRafaelPerujinoSignorelliFra AngelicoBoticelliTitianVeroccioMantegnaJac.BelliniGiorgioneP.VenetianoCarpaccioDonatelloMasaccioGirlandaioTintorettoVeroneseJiov.BelliniGiottoLeonardoPinturiccioCimabueCimabueXIIIGiottoP.
VenetianoMasaccioJac.BelliniXIVDonatelloFra AngelicoMantegnaVeroccioCarpaccioXVGirlandaioLorenzoSignorelliBoticelliGiov.BelliniPinturiccioPerujinoLeonardoTitianGiorgioneMichelangeloRafaelPERUGIATintorettoFLORENCEVeroneseVENICEXVIДРУГИЕ ПРИМЕРЫ ОНТОЛОГИЙWordNet – тезаурус, лексический ресурс дляанглийского языка (Принстонский унив-т) общая (верхнего уровня), легкая онтология лингвистическая, неоднородная формализованнаяПрикладные лингвистические онтологии:рубрикаторы, тезаурусы нет внутренней структуры понятий непосредственная связь с терминами языкаСУС (Encyclopedia) – представление общечеловеч.знаний и знаний здравого смысла (пример:наполненный стакан стоит держать донышком вниз) онтология верхнего уровня, весомая понятийная, неоднородная формальная (язык CYCL )17ОНТОЛОГИИ ВЕРХНЕГО УРОВНЯ Построены путем логического анализа, сверху-вниз Много общего в абстрактных концептах и базовых связях(Сущность, Связь, Явление, Процесс, Объект и т.п.)CYC – самая масштабная и детализированная онтологияSowa’s ontology – основана не на фиксированной иерархииклассов (базовых онтологических категорий), а наборе ихразличий: независимый/относительный/опосредованный ,физический/абстрактный, континуальный/происходящийНапр., Процесс: физический, происходящий, независимыйDOLCE (Descriptive Ontology for Linguistic and CognitiveEngineering) – применение в SemanticWebдля согласования между интеллектуальными агентами,использующими разную терминологиюSUMO (Standartized Upper Merged Ontology)18ОНТОЛОГИЯ SUMOКаноническая онтология верхнего уровня,итог объединения идей других онтологий в.
уровняСодержит наиболее общие и абстрактные концептыИмеет ясную, легко расширяемую иерархиюфундаментальных понятий (~ 1 тыс. понятий)Включает набор аксиом (~ 4 тыс.), определяющих понятияна логическом языке SUO-KIFПример аксиом о различии двух концептов:А1.(=>(and(subclass-of ?OBJECTTYPE НепрерывныйОбъект)(instance-of ?OBJECT ?OBJECTTYPE)(part-of ?PART ?OBJECT))(instance-of ?PART ?OBJECTTYPE))А2.
(equal ДискретныйОбъект (ComplementFnНепрерывныйОбъект))19SUMO: ПОНЯТИЯ ВЕРХНЕГО УРОВНЯ20ОНТОЛОГИЯ CYCПроект создания системы формализованныхзнаний для проведения логических рассужденийи решения задач в широком круге ПО: EncyclopediaРазработка ведется с 1986 гг., Д. Ленат (Стенфорд)В 1989 гг. создан прототип –≈ 50 тыс. понятий, более сотни тысяч аксиом (1% знаний):За 1984-94 гг.
– более 10 млн.$ в рамках концорциума MCCВ 1994 г. создана CYCorp, и к 2000 г. в БЗ –≈ 300 тыс. понятий, ≈ 2,2 млн. утвержденийС 2002 – несколько версий:– OpenCyc , открытый доступ: усеченная БЗ,минимальный набор инструментов: www.opencyc.org– ResearchCyc , для исследований (по подписке)Онтологией является верхний уровень БЗ21КОМПОНЕНТЫ СИСТЕМЫ CYCОсновные компоненты: База знаний – утверждения и факты (аксиомы);смысл любого понятия задается утверждениями CycL – язык записи формализованных знаний,в основном выразительно эквивалентен языкупредикатов первого порядкаCycML – трансляция CycL в синтаксис XMLИнтерпретатор (Inference Еngine) – доказательствоновых утверждений на основе БЗ (логическийвывод), ответы на запросы пользователейИнтерфейс пользователя – для просмотра имодификации БЗ, запросов к БЗИнтерфейсы прикладных программ (API) дляязыков SubL (диалект Common Lisp) и Java22БАЗА ЗНАНИЙ CYC: ПОНЯТИЯ Каждое понятие представлено константой, которойсоответствует отдельная структура данных:сама константа + набор утвержденийОсобенности именования понятий: Константы не должны быть словами во множественном числе,например: следует писать #$Dog , а не #$Dogs Константа должна состоять из нескольких осмысленных слов,например: #$SportCar Похожие по смыслу понятия следует именовать лексическиблизко : например, #$Horse-Domesticated и #$Horse-Wildа не #$DomesticatedHorse и #$WildHorseСледует избегать неоднозначных имен и стараться уточнятьсмысл понятия, например, писать #$Bow-BoatPart (нос корабля)вместо #$Bow , и #$BowTheWeapon – лук (оружие)Важно: имя константы имеет смысл только для человека,поэтому не стоит слишком полагаться на имена, следуетучитывать утверждения об этих константах23CYCL: ЯЗЫК ПЗЛисповский синтаксис языкаНа начальных этапах был фреймовым языкомВ настоящий момент CYCL близок по семантике к языкампредикатов первого и второго порядков(предикаты рассматриваются как понятия-константы)Элементы: термы, предикаты, логические связки, кванторыУчитывается тип аргументов предиката (тип коллекции)Пример запроса:Пример утверждения:(#$implies (#$owns #$Fred ?Х)(#$objectFoundInLocation ?X #$FredsHouse))Все, чем владеет Фред, находится в доме Фреда(#$isa ?Х #$Person) –Кто является человеком?24CYCL: КВАНТОРЫЯзык включает квантор общности #$forAllи несколько кванторов существования:#$thereExists, #$thereExistsAtLeast,#$thereExistsAtMost, #$thereExistsExactlyПример 1(#$forAll ?X(#$implies(#$owns #$Fred ?X)(#$objectFoundInLocation ?X #$FredsHouse)))Пример 2(#$implies(#$isa ?A #$Animal)(#$thereExists ?M(#$mother ?A ?M)))Часто громоздкие, неестественные имена констант25CYC: ОСОБЕННОСТИ БЗСтруктура БЗ – Микротеории, например:HumanActivitiesMt , WorldMythologyMtМикротеории выстроены в иерархию общий/частный: Утверждение, верное в общей – верно и в частной У любой микротеории может быть несколько общихДля любого утверждения БЗ сохраняется: Внутреннее представление (КНФ) Список его микротеорий (возможно несколько) Степень истинности утверждения monotonic true – верно в любой микротеории default true – м.