Диссертация (1137159), страница 11
Текст из файла (страница 11)
B является тройкой вида (S, Ct, Ql ), где S, Ct –формальные объекты, называемые соответственно сортовой системой и58концептуально-объектной системой, а Ql – формальный объект, называемыйсистемой кванторов и логических связок.Сортовой системой в [29, 63] называется произвольная упорядоченная четверка S вида (St, Р, Gen, Tol), где St - конечное множество символов; Р – элемент множества St; Gen - непустое бинарное отношение на St, являющеесячастичным порядком на St (т. е. рефлексивным, транзитивным и антисимметричным); Tol - бинарное отношение на St, являющееся антирефлексивным исимметричным, и выполняется несколько дополнительных условий. Элементымножества St называются сортами; Р - сортом «смысл сообщения»; Gen ⊂ St × St- отношением общности; Tol ⊂ St × St - отношением совместимости.Элементы множества St интерпретируются как обозначения наиболее общихпонятий, относящихся к рассматриваемой группе областей. Отношение Genотражает существование иерархии сортов (по степени общности).
Например,для некоторого к.б. B отношение Gen может включать пары (физич.объект,динамич.физич.объект),Отношениефизич.объект).(физич.объект,совместимости Tol отражает существование различных, несопоставимых(«ортогональных») семантических характеристик некоторых сущностей израссматриваемойодновременногруппыявляетсяпредметныхобластей.интеллектуальнойНапример,системойичеловекдинамическимфизическим объектом. Поэтому для некоторого к.б. B отношение Tol можетвключатьпару(интел.система,динамич.физич.объект)и,всилурефлексивности отношения, пару (динамич.физич.объект, интел.система).Пусть S - сортовая система вида (St, Р, Gen, Tol).
Тогда произвольнаяупорядоченная четверка Ct вида (X, V, tp, F) в [29, 63] называетсяконцептуально-объектной системой, согласованной с сортовой системой S ⇔когда выполняются следующие условия: (1) X, V - счетные непересекающиесямножества символов; tp – отображение X ∪ V → Tp(S ) , где Tp(S) — множествотипов, порождаемых сортовой системой S; (2) F – непустое подмножествомножества X, для каждого r из F цепочка tp(r) начинается с подцепочки «{(« изаканчивается подцепочкой «)}»; (3) St - непустое конечное подмножество59множества X, и для любого s ∈ St выполняется соотношение tp(s) = ↑ s; (4){v ∈V | tp (v ) = [сущн]} - счетное множество, где [сущн] — базовый тип «сущность».Множество X называется первичным информационным универсумом,элементы множеств V и F называются соответственно переменными ифункциональными символами.
Если элементd ∈ X ∪ V,tp (d ) = t ,то будемговорить, что t - тип элемента d.Элементы множеств X и V интерпретируются как элементарные блоки, изкоторых (и из нескольких служебных символов) будут строиться СПпредложений и дискурсов. Например, X может включать элементы город,отгрузка1, 125, 3/тонна, зелен, контейнер1, Столица, Вес, Цена, Часть,Элемент-множества, V может содержать символы x1, y3, z12, F можетвключать элементы Столица, Вес, Цена. Элементы множества Tp(S)называютсятипамисортовойсистемыSиинтерпретируютсякакхарактеристики сущностей, рассматриваемых в рассуждениях о заданнойпредметной области. Например, Tp(S) может включать элементы [сущн],↑ {интс*дин.физ.об}, интс*дин.физ.об. Тип [сущн]является наиболее общейхарактеристикой рассматриваемых сущностей.
Пусть интс — обозначениепонятия(т. е.сорт)«интеллектуальнаясистема»,дин.физ.об.-сорт«динамический физический объект». Тогда тип ↑ {интс*дин.физ.об} соответствует понятиям, характеризующим множества людей (студенческая группа,команда разработчиков и др.), поскольку каждый человек характеризуетсяпонятием «интеллектуальная система» и понятием «динамический физическийобъект». Тип интс*дин.физ.об может быть связан с произвольным человеком.Определение 2.1.
Пусть S – произвольная сортовая система вида (St, P, Gen,Tol), где St – множество сортов, P – выделенный сорт «смысл сообщения», Gen– отношение общности на St, Tol – отношение совместимости на St (см. [29,63]). Тогда систему S будем называть аспектно-ориентированной сортовойсистемой ⇔ когда(1) St включает выделенные, попарно различные сорта техн.устр, физ.об;(2) (физ.об, техн. устр ) ∈ Gen ; (3) {u ∈ St | (P,u ) ∈ Gen} ∩ {физ.об, техн. устр} = ∅ .60Сорта техн.устр и физ.обинтерпретируются как обозначения понятий«техническое устройство» и «физический объект».Определение 2.2.
Пусть S – произвольная аспектно-ориентированнаясортовая система, Ct – концептуально-объектная система вида (X, V, tp, F),согласованная с сортовой системой S, где X – множество символов, называемоепервичным информационным универсумом, V и F – множества переменных ифункциональных символов соответственно. Тогда упорядоченная пятерка видаCtmw = (X, V, tp, F, Qf) называется слабо размеченной концептуальнообъектной системой, согласованной с сортовой системой S ⇔когдавыполняются следующие условия: (1) X \ F включает подмножество Qf = {r1 ,…, r11}, гдеr1 = ОП_СТР, r2 = ОП_ХАР, r3 = ОП_РАБ, r4 =ОП_ФУН, r5=ОП_НАЗ, r6 = ОП_ПРИМ, r7 = ОП_ПРИН, r8 =ОП_РАЗ, r9 = ОП_ОБЩ, r10 =ОП_ОСОБ, r11 = ОП_ВОЗМ; (2) для k = 1, 2, 3, 4, 5 tp(rk ) = {(техн.устр, P)}, дляm = 6, 7, 8, 9 tp( rm) = {(физ.об, P)}.Обозначения бинарных отношений r1 , …, r11 пояснены в параграфе 2.1.Определение 2.3.
Пусть S – произвольная аспектно-ориентированнаясортовая система, Ctmw – слабо размеченная концептуально-объектная системавида (X, V, tp, F, Qf), согласованная с S. Тогда набор Cobs вида(X, V, tp, F, Qf, Chr, Fgn)(2.1)называется размеченной концептуально-объектной системой, согласованной ссортовой системой S ⇔ когда выполняются следующие условия:1. Набор (X, V, tp, F, Qf) является слабо размеченной концептуальнообъектной системой, согласованной с сортовой системой S;2. Chr-выделенноефункциональныхконечноесимволовF[1]подмножествомножества(интерпретируетсякакунарныхмножествохарактеристик (аспектов) объектов заданной предметной области), где F[1]- под множество множества функциональных символов F;3.
Пусть Concepts - множество всех таких d из X, что тип tp(d) начинается ссимвола ↑(т.е. d – обозначение понятия).Тогда Fgn – это функция, ставящаяв соответствие произвольному cpt из Concepts упорядоченную тройку Gn =61(Ge, Concr, Syn), где Ge - множество обобщающих понятий для элементаcpt, Concr - множество конкретизирующих понятий для элемента cpt, Syn множество синонимов (на концептуальном уровне) элемента cpt, причемGe, Concr, Syn – это подмножества множества Concepts. Функцию Fgnбудем называть детерминантом концептуального окружения; если cpt –элемент множества Concepts, то упорядоченная тройка Gn(cpt) = (Ge,Concr, Syn) будет называться концептуальным окружением термина cpt.Определение 2.4. Расширенным концептуальным базисом (р.к.б.) называетсяпроизвольная упорядоченная четверка Extbs вида(S, Cobs, Ql),(2.2)где S — произвольная аспектно-ориентированная сортовая система, Cobs —размеченная концептуально-объектная система вида (X, V, tp, F, Qf, Chr, Fgn),согласованная с S, и Ql — система кванторов и логических связок длясортовой системы S и концептуально-объектной системы Ct=(X, V, tp, F).Определение 2.5.
Пусть Extbs — произвольный р.к.б. вида (S, Cobs, Ql), где S— произвольная аспектно-ориентированная сортовая система, Cobs —размеченная концептуально-объектная система вида (X, V, tp, F, Qf, Chr, Fgn),согласованная с S, и Ql — система кванторов и логических связок. Тогдаконцептуальный базис B = (S, Ct, Ql), гдеCt=(X, V, tp, F), называетсясемантическим ядром расширенного концептуального базиса Extbs иобозначается через Sem-Core(Extbs).Система введенных выше определений, завершающаяся определениемклассарасширенныхконцептуальныхбазисов,интерпретируетсякакматематическая модель проблемно-ориентированной системы первичныхединицконцептуальногопреобразователем запросов.уровня,используемойсемантическим622.6Разработкапланаалгоритмапостроениясемантическогорасширения аспектно-ориентированного поискового запросаРазработаем план алгоритма построения семантическогорасширенияпоступившего поискового запроса на основе предлагаемой математическоймодели.
Постулируем существование некоторого языка входных запросовLinput,длякоторогопостроенонекоеформальноеописание.Тогдапредположим, что существует алгоритм «Определение типа запроса» соследующей внешней спецификацией:Назначение: Алгоритм последовательно анализирует поступивший навход поисковый запрос и определяет его тип и характеристическое слово.Вход: Цепочка W ∈ Linput - входной запрос.Выход: r ∈ Qf - тип запроса; w1 - это характеристическое слово запроса W.Пример 1. Пусть на вход подана цепочка W = «Каковы особенностиоперационной системы System X?». Тогда будут получены следующиерезультаты работы алгоритма: тип запроса = «ОП_ОСОБ», w1 = особенности.Пример 2. Пусть на вход подана цепочка W = «Для чего нужен языкпрограммирования Scala?».
Тогда будут получены следующие результатыработы алгоритма: тип запроса = «ОП_НАЗ», w1 = nil. Данный примериллюстрирует отсутствие характеристического слова в запросе, однако типзапроса определяется благодаря его специфической структуре (начинается сослов «Для чего нужен ...»).После того, как тип запроса определен, необходимо выделить объектыинтересаданного«Определениезапроса.объектовПостулируеминтересазапроса»существованиесоследующейалгоритмавнешнейспецификацией:Назначение: Алгоритм последовательно анализирует поступивший навход поисковый запрос и определяет его объекты интереса.Вход: Цепочка W ∈ Linput - входной запрос; r ∈ Qf - тип запроса;63Выход: w2 , w3 , где w2 и w3 — объекты интереса запроса. Для всех типоваспектно-ориентированных запросов, кроме «Описания различий» и «Описанияобщих характеристик», w3 не устанавливается.Пример 1. Пусть на вход подана цепочка W = «Каковы функциикомпьютера?».
Тогда получаются следующие результаты работы алгоритма:тип запроса = «ОП_ФУН»,w1= функции,w2= компьютер,w3= nil.Пример 2. Пусть на вход подана цепочка W = «Чем отличается ноутбук отсервера?». Тогда будут получены следующие результаты работы алгоритма:тип запроса = «ОП_РАЗ», w1 = отличается, w2 = ноутбук, w3 = сервер.После определения основных характеристик запроса можно переходить ксозданиюмножествасемантическипреобразованныхзапросовExtSet,порождаемых запросом W, т.е.
к построению семантического расширениявходного запроса. Построение данного множества происходит на основанииразмеченной концептуально-объектной системы Cobs вида (X, V, tp, F, Qf, Chr,Fgn) и состоит из трех основных шагов. На первом шаге необходимо построитьдетерминант концептуального окружения для характеристического словазапроса.Такимобразом,необходимопостроитьнаборGnω =1(Geω ,Concrω , Synω ) .111Постулируем существование алгоритма «Построение концептуальногоокружения» со следующей внешней спецификацией:АлгоритмНазначение:ориентированнойбазыпредназначен длязнанийаспектовизвлечения издляподанногоаспектнонавходхарактеристического слова запроса в зависимости от его типа. По сути,алгоритм являет реализацией функции Fgn.Вход: r ∈ Qf - тип запроса; ω1 - характеристическое слово запроса.Выход: Gnω1- концептуальное окружение характеристического словазапроса.Пример 3.