Диссертация (1137159), страница 24
Текст из файла (страница 24)
Разработан итоговый алгоритм, позволяющий определять тип и объектыинтереса для любого из рассмотренных типов запросов, а также генерироватьмножество семантически преобразованных запросов всоответствии спредложенным методом.3. На основании требований к компонентам системы в качестве платформыреализации была выбрана Java, обладающая всем необходимым наборомбиблиотек, соответствующих предъявляемым требованиям, и являющаясяплатформенно-независимой.4. Программно реализованы, протестированы и введены в эксплуатацию всепредставленные подсистемы, а также веб-сервисы, предоставляющие доступ кхранящейся в базах знаний информации.5.
Проведенное тестирование и анализ результатов поиска позволяютсделать вывод об оправданности и практической значимости предложенногометода, поскольку наглядно демонстрируют работоспособность алгоритмовопределения типа и объектов интереса запросов и действительное наличиедетализаций запросов в электронных документах, содержащих информацию попервоначальному запросу.6. Сделан вывод о необходимости адаптации содержащейся в базах знанийинформации для повышения точности поиска в зависимости от ожиданийпользователей.
Таким образом, спроектированная и разработанная на основепредложенного метода поисковая система (ПС) является инструментом,адаптируемым как к информационной потребности пользователей, так и клюбой ПС, используемой в качестве источника результатов поиска поключевым словам. Разработанная архитектура и используемый алгоритмранжирования результатов позволяют использовать в качестве источникапотенциально любое количество поисковых систем, тем самым позволяя ещеболее улучшить результаты поиска.144ЗаключениеЗадачи исследования, обусловленные целью работы и поставленные вовведении, были успешно решены.
В итоге проведенного исследования личноавтором были получены следующие основные результаты:1. Исследованы три класса важных для приложений, но недостаточноизученных в научных публикациях естественно-языковых запросов: (а)аспектно-ориентированные запросы, (в) запросы, касающиеся достижения илинедостижения целей интеллектуальных систем (в том числе организаций), (в)запросы о возможных изменениях состава определенных множеств объектов(например, совета директоров конкретной фирмы).2.
На основе анализа и типизации аспектно-ориентированных запросовпредложеннаборпервичныхинформационныхединиц(реляционныхсимволов) для разработки алгоритма анализа аспектно-ориентированныхзапросов.3. Построена математическая модель проблемно-ориентированной системыпервичных единиц концептуального уровня, используемых преобразователемзапросов.Сэтойцельювведеныформальныепонятияаспектно-ориентированной сортовой системы, размеченной концептуально-объектнойсистемы и расширенного концептуального базиса.По сравнению спредложенным В.А. Фомичевым в теории К-представлений понятиемконцептуального базиса введенное понятие расширенного концептуальногобазиса позволяет (а) учитывать множество аспектов, связанных с тем илииным понятием, т.е. учитывать набор основных характеристик объектов,квалифицируемых определенным понятием; (б) строить концептуальноеокружение того или иного понятия при помощи функции «детерминантконцептуального окружения».4.
На основе математической модели проблемно-ориентированной системыпервичных единиц концептуального уровня (задающей класс расширенныхконцептуальных базисов) был разработан оригинальный метод анализа исемантического расширения аспектно-ориентированных запросов.1455. Предложен новый метод формального описания структуры входных текстованализатора аспектно-ориентированных естественно-языковых вопросов наоснове аппарата контекстно-свободных грамматик.6. Разработаны алгоритмы определения типа и объектов интереса аспектноориентированных поисковых запросов, использующие рядподалгоритмовобработки специфических типов данных запросов.7.
Разработаны общие принципы функционирования целевого алгоритмапостроения множества семантически преобразованных поисковых запросов.8. Построена математическая модель компонента базы знаний поисковойсистемы, необходимого для семантического преобразования вопросов одостижении/недостижении цели. Для этого определен класс формальныхобъектов, названных концептуальными базами целей (к.б.ц.). В отличие отпонятия концептуального базиса, введенного в теории К-представлений,концептуальные базы целей включают формальные представления целейинтеллектуальныхсистем(втомчислеорганизаций),являющиесявыражениями СК-языков (стандартных концептуальных языков).9. Предложеносемантическойматематическоетрансформации,описаниемногообразияпорожденныхшаблоноврассматриваемымиконцептуальной базой целей и множеством символов, интерпретируемых какзначения морфологических признаков словоформ.
В доступной научнойлитературеотсутствуетпрототиппонятия“шаблонсемантическойтрансформации”.10. Разработан метод преобразования вопросов достижения целей в множествопроизводных запросов на основе концептуальной базы целей и наборашаблонов семантической трансформации. Преимуществом этого методаявляется компактность представления данных, позволяющих построитьсемантическое расширение запроса о достижении/ недостижении целей.11.
Построена математическая модель компонента базы знаний поисковойсистемы, необходимого для семантического преобразования вопросов обизменениях в составе множеств. Для этого определен класс формальных146объектов, названных базами знаний об изменениях множеств. В отличие отпонятия концептуального базиса, введенного в теории К-представлений, базызнаний об изменениях множеств включают формальные представлениясоставляющих элементов множеств и индикаторов изменения составамножеств.12. Разработан метод преобразования вопросов об изменениях составамножеств в множество производных запросов на основе базы знаний обизменениях множеств. Преимуществом этого метода является компактностьпредставления данных, позволяющих построить семантическое расширениезапросов такого типа, и независимость формы представления от предметнойобласти.13. СпроектированреализующийиразработанпредложенныйпрограммныйметодкомплекссемантическогоAOSEngine,преобразованияпоисковых запросов.
Проведенное тестирование и анализ результатов поискадемонстрируют, во-первых, работоспособность алгоритмов определения типа иобъектов интереса запросов, а во-вторых, действительное наличие детализацийзапросоввэлектронныхдокументах,содержащихинформациюпопервоначальному запросу.В ходе исследования была решена научная задача создания методасемантического преобразования естественно-языковых запросов в форму (множество преобразованных запросов), позволяющую традиционным поисковымсистемам получать более релевантные результаты, который предусматриваетприменение формальных средств для описания (а) системы первичных единицконцептуального уровня, (б) логической структуры базы знаний для поддержкисемантическогопреобразованиязапросовипоиска,(в)шаблоновсемантических трансформаций, необходимых для преобразования поисковыхзапросов.147СПИСОК ЛИТЕРАТУРЫ1 Башмаков И.А., Рабинович П.Д.
Анализ моделей семантических сетей какматематического аппарата представления знаний об учебном материале //Справочник. Инженерный журнал. – 2002.– №7.– С.55-60.2 Ермаков А.Е., Плешко В.В. Обработка естественно-языковых запросов кпоисковой машине на основе их лингвистического анализа // Компьютернаялингвистика и интеллектуальные технологии: Труды Международнойконференции Диалог’2009. – Москва, Наука, 2009.3 Золотова Г.А. Синтаксический словарь: Репертуар элементарных единицрусского синтаксиса.
– М.: Наука, 1988 – 440 с.4 Золотова Г.А., Онипенко Н. К., Сидорова М. Ю. Коммуникативнаяграмматика русского языка. Институт русского языка РАН им. В. В.Виноградова, М. 2004 - 544 с.5 Кириллов А.В. Метод семантического преобразования обобщенных запросовна основе базы целей // Бизнес-информатика, 2011. № 3. С.
16-246 Кириллов А.В. О новом подходе к концептуальному поиску информации винтернете // Сборник трудов Международной молодежной научнойконференции «XXXVII Гагаринские чтения», МАТИ, 2011. С. 11-13.7 Кириллов А.В. Преодоление разрыва между семантическим и традиционнымпоиском информации // Сборник трудов IX Международной научнотехническойконференции«Новыеинформационныетехнологииисистемы» (НИТиС-2010). 2010.