Разработка языка запросов в бинарной модели знаний и транслятора этого языка в язык SQL (бакалаврская работа) (544460), страница 2
Текст из файла (страница 2)
Несмотря на сложность ментальной природы понятия «концептуализация», Дженесерет и Нильссон выбирают для его объяснения очень простое математическое представление – экстенсиональную реляционную структуру.
Экстенисинальная реляционная структура (концептуализация по Дженесерету и Нильссону) – это пара (U,R), где
• U – множество, называемое универсумом;
• R – множество отношений, заданных на U.
Заметим, что по этому определению элементами множества R являются обычными математическими отношениями, т.е. некоторыми множествами кортежей, составленными из элементов D. Таким образом, элемент R – это экстенсиональное отношение, отражающее конкретное состояние мира.
Пример 1.1. Рассмотрим предметную область «Компания», связанную с хранением сведений о работниках некоторой компании. Предположим, что в компании работает 300 человек, каждый из которых идентифицируется номером ИНН (индивидуальный номер налогоплательщика). Пусть универсум U содержит всех этих работников. Мы интересуемся отношениями между ними. Таким образом, R содержит некоторые унарные отношения (т.е. подмножества) такие, как Работник, Менеджер и Исследователь, а также бинарные отношения подчинен и сотрудничает_с. Соответствующая экстенсиональная реляционная структура (U,R) такова:
• U = ИНН всех работников компании;
• R = {Работник, Менеджер, Исследователь, подчинен, сотрудничает_с}.
Экстенсионалы отношений отражают конкретный мир. Здесь мы предполпгаем, что множество Работник совпадает с универсумом U, а множества Работник, Менеджер, Исследователь являются собственными подмножествами универсума. Бинарные отношения подчинен, сотрудничает_с являются множествами пар, которые указывают иерархию подчинения и совместную работу работников. На Рис.1.1 некоторые из этих пар изображены в виде ориентированного графа. Здесь исследователь 110104675801 подчинен менеджеру 11010382002 и сотрудничает с другим исследователем 110104444303, который также подченен менеджеру 11010382002.
Менеджер(110103482002)
подчинен
Исследователь(110104675801) подчинен
Работает_вместе_с
Исследователь(110104444303)
Работник(110105000027)
Рис.1.1
• Работник = U;
• Менеджер = {…, 110103482002,…};
• Исследователь = {…, 110104444303,…, 110104675601,…};
• подчинен = {…, (110104675801,1103482002),…,
(110104444303,110103482002),…};
• сотрудничает_с = {…, (110104675601,110104444303),…};
Несмотря на простоту понятия «экстенсиональная концептуализация», это понятие на самом деле плохо соответствует нашим нуждам и отвечает нашей интуиции, главным образом, потому, что оно слишком зависит от конкретного состояния предметной области. Концептуализация должна зависеть только от понятий, а не от состояний (примеров понятий). Следует ли понятию «подчинен» изменяться тогда, когда иерархическая стуруктура компании меняется? В работе [Guarino et al.,1995] обсуждается, следует ли изменять концептуализации предметной области при изменении сосотяний это предментной области. Если в соответствии с взглядами Дженесерета и Нильссона считать, что это так, то каждый новый конкретный граф отношения «подчинен» такой, как в примере 1.1., давал бы новую концептуализацию.
Пример 1.2. Рассмотрим следующую модификацию примера 1.1.:
R* = { Работник, Менеджер, Исследователь, подчинен*, сотрудничает_с },
где подчинен*= подчинен U {(110103482001,110105000005)}.
Поскольку (U,R) ≠ (U,R*), то в соответствии с Дженесеретом и Нильссоном мы имеем две различные экстенсиональные концептуализации. Проблема в том, что принадлежащие R экстенсиональные отношения отражают конкретные состоянии предметеной области. Однако, мы должны сосредоточиться на смысле (значении) понятий, которые не зависимы от кокретного состояния. Например, смысл отношения сотрудничает_с лежит в конкретном способе как два работника действуют в компании.
В примере 1.1 предметная область состоит из элементов универсума U и имен Работник, Менеджер, Исследователь, подчинен и сотрудничает_с. Приведенную в этом примере экстенсиональную концептуализацию можно представить себе как назначение именам Работник, Менеджер и Исследователь конкретных подмножеств множества U, а именам подчинен , сотрудничает_с назначение конкретных отношений, т.е. подмножеств множества U x U.
С каждой парой (Менеджер, х), где х
U, свяжем булеву переменную ξ«Менеджер,х» , которая равна 1 в том и только том случае, если х является примером понятия Менеджер (т.е. х есть ИНН некоторого менеджера). Точно так же, введем булевы переменные ξРаботник,х и ξИсследователь,х . Таким образом, в примерах 1.1 и 1.2 имеем, что ξРаботник,х = 1 для всех х
U (поскольку универсум U состоит из ИНН всех работников), а ξ«Менеджер,110103482002» = 1 и ξ«Менеджер,110104444303» = 0 (так как работник с ИНН 110103482002 является менеджером, а работник с ИНН 110104444303 менеджером не является).
С каждой тройкой (подчинен,х,у), где х,у
U, свяжем булеву переменную ξ«подчинен,х,у », которая равна 1 в том и только том случае, если работник с ИНН х подчинен работнику с ИНН у. Точно так же, введем булеву переменную ξ«сотрудничает_с,х,у » .
Итак, с предметной облстью из примеров 1.1 и 1.2 связано следующее множество булевых переменных:
{ξ«Работник,х », ξ«Менеджер,х », ξ«Исследователь,х »,
ξ«подчинен,х,у », ξ «сотрудничает_с » | х, у
U}.
Состоянием этой предметной области назовем присваивание этим переменным конкретных значений 0 или 1.
Рассмотрим общий случай задачи моделирования некоторой системы (или приложения) S. Пусть PS – предметная область для этой задачи. Пусть Var = Var(PS) – множество всех переменных, связанных с предметной областью PS. (Заметим, что в основном Var состоит из булевых переменных; но в Var могут входить и не булевы пременные.) Состоянием σ предметной области PS назовем присваивание булевых значений переменным из Var. Другими словами, состояние σ можно отождествить с функцией, заданной на множестве Var и принимающая значения в {0,1}, т.е. σ: Var → {0,1}. Однако, вообще говоря, не любую функцию σ: Var → {0,1} следует считать допустимым состоянием. Обозначим А(PS) множество всех допустимых состояний предметной области PS. Это множество выражает смысл понятий, входящих в эту предметную область.
Пусть r – имя какого-либо отношение предметной области PS. Предположим, что r имеет арность (местность) n. Тогда для заданных (х1,х2,…,хn)
Un имеем булеву переменную ξ«r,х1,х2,…,хn ». Каждое состояние σ предметной области PS задает n-местное отношение rσ = {(х1,х2,…,хn) | σ(ξ«r,х1,х2,…,хn ») = 1}. Определим семейство n-местных отношений r• = {rσ | σ
А(PS)}, состоящее из всех отношений rσ , когда σ пробегает все допустимые состояния предметной области PS. Семейство r• отношений rσ называется интенсиональным отношением.
Замечание. Сказанное является общим способом выражения интенсиональных свойств, восходящим к Рудольфу Карнапу, [Карнап, 1959]. Данное нами определение интенсионального отношения является модификацией определения, данного в [Guarino et al., 2004]. Гуарино называет интенсиональные отношения также концептуальными.
Интуитивное понимание смысла отношения сотрудничает_с связано с некоторым правилом, определяющим кооперацию работников. Предположим, в нашем случае, два работника сотрудничают друг с другом, если: (1) оба они заявляют, что имеют одну и ту же цель; (2) оба делают что-то для достижения этой цели. Тогда смысл отношения сотрудничает_с можно определить как функцию, которая для каждого допустимого состояния дает множества всех пар работников, которые удовлетворяют условиям (1) и (2).
Обобщая этот подход и абстагируясь (ради простоты) от времени, мы можем сказать, что интенсиональное отношение (в противоположность экстенсиональному) есть функция из множества допустимых состояний предметной области в множество экстенсиональных отношений. Предположим, что имеется множество Г точек соотнесения – некоторых абстрактных объектов, взаимно однозначно соответствующих допустимым состояниям предметной области. Тогда интенсиональное отношение – это семейство экстенсиональных отношений, индексированное точками соотнесения.
Пусть U - универсум и Г – множество точек соотнесения, взаимно однозначно соответствующих допустимым состояниям предметной области. Концептуализация (или интенсиональная реляционная структура) – это тройка (U,Г,R), где R – множество концептуальных (интенсиональных) отношений.
Пример 1.3. Возьмем опять предметную область, рассмотренную в примерах 1.1 и 1.2. Положим:
• Г = {…, γ1,…, δ2,…};
• R – следующее множество концептуальных отношений:
Работник (γ) = U для всех γ
Г;
Менеджер(γ) = {…, 110103482002,…} для всех γ
Г;
Исследователь(γ) = {…, 110104444303,…, 110104675801,…, 1101001243005}
подчинен
={…,(110104675801,110103482002),…,(110104444303,110103482002),…};
подчинен(γ2) = {…, (110104675801,110103482002),…, (110104444303,110103482002),
…, (1101001243005,110103482002) };
…………………………….
Сотрудничает_с(γ1) = {…};
Сотрудничает_с(γ2) = {…};
……………………………. .















