Диссертация (1137159), страница 15
Текст из файла (страница 15)
В общем случае разбор входногозапроса осуществляется при помощи алгоритма «Разбор_Общего_Случая», вчастных случаях разбор происходит при помощи специализированныхалгоритмов.Такимиисключениямиявляютсязапросыописанияпринадлежности, описания особенностей, а также запросы с двумя объектами82интереса (описание различий и общих характеристик). Полное описание всехиспользуемых подалгоритмов доступно в приложении 4.Рассмотрим внешнюю спецификацию основного алгоритма определенияобъектовинтересазапроса,использующегоописанныевприложенииподалгоритмы.
Полное описание алгоритма доступно в приложении 4.Внешняя спецификация алгоритма «Опр_ОИ»Назначение: Алгоритм предназначен для определения объектов интересапоисковых запросов в зависимости от их типа. Перед стандартной обработкойзапроса происходит проверка некоторых уникальных структур запроса,характерных для каждого типа. В случае, если требуется специализированныйразбор запроса, используется соответствующий подалгоритм.Вход: Запрос — массив элементов типа Расш_Слово, представляющийвходной запрос; Тип_Запр — тип запроса.Выход: Отличит_Слово — слово-индикатор, по которому был определентип запроса. Имеет тип Расш_Слово; ОИ — массив элементов типаРасш_Слово, представляющий объект интереса.
Объект интереса можетсостоять из нескольких слов, поэтому все они должны быть возвращены какзначимые; ОИ2 — массив элементов типа Расш_Слово, представляющийвторой объект интереса. Возвращается только для запросов типа «ОП_ОБЩ» и«ОП_РАЗ»; Доп_ОИ — дополнительный значимый объект интереса, влияющийна смысл запроса. Например, в запросе «Как в металлургии применяют газ?»,такимобъектомбудетявлятьсяслово«металлургия»,потомучтозапрашивается информация о применении газа именно в данной отрасли.Возвращается не для всех типов запросов.Внутренние переменные: СловарьN — N соответствует натуральномучислу.
Словарь, используемый для промежуточного хранения выборки измножества словарей.832.11 Разработкаалгоритмапостроениясемантическогорасширения аспектно-ориентированного поискового запросаРассмотрим алгоритм построения семантически расширенного множествазапросов ExtSet «Расширение_АО_Запр». Алгоритм состоит из описанныхвышеподалгоритмовииспользуетновыйподалгоритм«Расширение_АО_Запр».
Рассмотрим данный подалгоритм.Внешняя спецификация алгоритма «Расширение_АО_Запр»Назначение:Алгоритмпредназначендляпостроениямножествасемантически преобразованных запросов ExtSet.Вход: Тип_Запр — тип запроса; Отличит_Слово - слово-индикатор, покоторому был определен тип запроса; Отличит_Слово — слово-индикатор, покоторому был определен тип запроса; ОИ — массив элементов типаРасш_Слово, представляющий объект интереса; ОИ2 — массив элементов типаРасш_Слово,представляющийвторойобъектинтереса;Доп_ОИ—дополнительный значимый объект интереса, влияющий на смысл запроса.Выход: ExtSet — множество семантически преобразованных запросов.Внутренние переменные: Син - массив слов, являющихся синонимамихарактеристического слова; Гип - массив слов, являющихся гипонимамихарактеристического слова; Гипер - массив слов, являющихся гиперонимамихарактеристического слова; Объекты — строка, представляющая собойконкатенацию строк, представляющих объекты интереса; Асп — массиваспектов; Рез_запр — строка, представляющая собой один из преобразованныхзапросов, элементов множества Ext_Set.Алгоритм «Расширение_АО_Запр»начСин := Гип := Гипер := nilПостроение_Концептуального_Окружения(Тип_Запр,Отличит_Слово, Син, Гип, Гипер)Асп := Извлечение_Аспектов(Тип_Запр, ОИ)i := j := k := n := 084Ext_Set := пустой_массив; Объекты := пустая_строкапока ОИ(n) <> nil циклОбъекты := Объекты +' '+ОИ(n)::Баз_Формы(0)n := n+1кциклесли ОИ2 <> nilm := 0пока ОИ2(m) <> nil циклОбъекты := Объекты +' '+ ОИ2(m)::Баз_Формы(0)m := m+1кциклкеслипока Асп(j) <> nil циклРез_Запр := Отличит_Слово+' '+Объекты+' '+Асп(j)+' '+Доп_ОИExt_Set(k) := Рез_Запрk := k+1; j := j+1кциклj := 0пока Син(i) <> nil циклпока Асп(j) <> nil циклРез_Запр := Син(i)+' '+Объекты+' '+Асп(j)+' '+Доп_ОИExt_Set(k) := Рез_Запрk := k+1; j := j+1кцикл; i := i+1кцикл; i := j := 0пока Гип(i) <> nil циклпока Асп(j) <> nil циклРез_Запр := Гип(i)+' '+Объекты+' '+Асп(j)+' '+Доп_ОИExt_Set(k) := Рез_Запрk := k+1; j := j+185кцикл; i := i+1кцикл; i := j := 0пока Гипер(i) <> nil циклпока Асп(j) <> nil циклРез_Запр := Гипер(i)+' '+Объекты+' '+Асп(j)+' '+Доп_ОИExt_Set(k) := Рез_Запрk := k+1; j := j+1кцикл; i := i+1кциклконДанный алгоритм выделен в отдельный подалгоритм с целью егоиспользования в итоговом алгоритме, рассматриваемом в параграфе 4.2.2.12 Обсуждение разработанных алгоритмовСледуетотметитьследующиеважныеособенностиразработанныхалгоритмов определения типа и объектов интереса поискового запроса:•алгоритмыбазируютсянаматематическоймоделипроблемно-ориентированной системы первичных единиц концептуального уровня,описанной при помощи формальных средств, что делает их независимыми отпредметной области и платформы реализации;•применяемыйподходнаосновеиспользованиясловарейслов-индикаторов позволяет более гибко манипулировать алгоритмом без егоизменения, т.
е., внося изменения в словарь, можно влиять на результатыработы алгоритма без вмешательства в его логику;•алгоритм определения типа запроса на первом шаге используетспециальный подалгоритм, позволяющий сузить спектр рассматриваемыхтипов запросов, что значительно сказывается на результатах работы(уменьшается количество проверяемых вариантов). Также в алгоритмеспециальнымобразомобрабатываютсясмешанныеситуации,когдаприсутствуют несколько характеристических слов-индикаторов разного типа;86•алгоритм определения объектов интереса запроса использует несколькоподалгоритмов, специфических для тех или иных ситуаций, возникающих прианализе запросов. Специальным образом обрабатываются: запросы с двумяобъектами интереса; запросы, в которых объект интереса расположен передхарактеристическимсловом;запросыописанияпринадлежностииособенностей (в таких запросах присутствует дополнительный объектинтереса).Следует отметить следующую особенность алгоритма определения типазапроса: тип запроса, определенный данным алгоритмом, в общем случаеявляется приблизительным, потому что в данной работе не рассматриваетсясемантическаямногозначностьраспознавание различий междувведенныхзапросов,запросами видат.
е.отсутствует«Когда прибегают киспользованию шифрования», «Когда инвесторы прибегают к помощикредитов», «Когда спортсмены прибегают к финишу» и т. д.Алгоритм построения концептуального окружения характеристическогослова и алгоритм получения аспектов для объекта интереса, по сути, лишьизвлекают информацию из аспектно-ориентированной базы знаний (АОБЗ), вкоторой она хранится.
За целостностью и полнотой информации в АОБЗдолжен следить инженер по знаниям, являющийся специалистом тойпредметной области, для которой она используется.2.13 Выводы по главе 2В данной главе были рассмотрены важные для приложений, но недостаточноизученные (в смысле компьютерной обработки) естественно-языковые вопросыи разработан новый подход к семантическому поиску, основанный насемантическом преобразовании данных типов запросов в форму, позволяющуюсистемепоискапоключевымсловамнаходитьболеерелевантныесемантически) документы, содержащие информацию об объектах интересапоисковых запросов.87Былипроанализированыитипизированыаспектно-ориентированныезапросы (АО-запросы), а также определены первичные информационныеединицы для разработки алгоритма анализа АО-запросов.Введено формальное понятие расширенного концептуального базиса,позволяющее, по сравнению с введенным В.А.
Фомичевым в теории Кпредставлений понятием концептуального базиса:− учитывать множество аспектов, принадлежащих тому или иномупонятию;− строить концептуальное окружение того или иного понятия при помощифункции «детерминант концептуального окружения»На основе математической модели проблемно-ориентированной системыпервичных единиц концептуального уровня (задающей класс расширенныхконцептуальных базисов) был разработан оригинальный метод анализа исемантического расширения аспектно-ориентированных запросов.Предложен новый метод формального описания структуры входных текстованализатора аспектно-ориентированных естественно-языковых вопросов наоснове аппарата контекстно-свободных грамматик.Разработаны алгоритмы определения типа и объектов интереса аспектноориентированныхпоисковыхзапросов,использующиеподалгоритмыобработки специфических типов данных запросов.
Были описаны назначение иобщая методика работы алгоритма построения концептуального окруженияхарактеристических слов запроса и алгоритма получения аспектов длязаданных понятий, представляющих объекты интереса поисковых запросов.Описано назначение и общие принципы работы алгоритма построениямножества семантически преобразованных поисковых запросов.88Глава 3. Разработка алгоритмов семантического преобразованияобобщенныхзапросовнаосновематематическихмоделейкомпонентов базы знанийВ данной главе анализируются запросы о достижении целей, строитсяматематическаямодельнеобходимогодлякомпонентабазысемантическогознанийпоисковойпреобразованиясистемы,вопросоводостижении/недостижении целей.Предлагаетсясемантическойматематическоетрансформации,описаниемногообразияпорожденныхшаблоноврассматриваемойконцептуальной базой целей и множеством символов, интерпретируемых какзначения морфологических признаков словоформ.