Диссертация (1137159)
Текст из файла
Национальный исследовательский университет “Высшая школа экономики”На правах рукописиКириллов Антон ВладимировичМАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ПРОГРАММНАЯРЕАЛИЗАЦИЯ СЕМАНТИЧЕСКОГО ПРЕОБРАЗОВАНИЯПОИСКОВЫХ ЗАПРОСОВСпециальность 05.13.18 – Математическое моделирование, численные методыи комплексы программДиссертация на соискание ученой степени кандидата технических наукНаучный руководитель: д.т.н В.А.ФомичевМосква – 20122СОДЕРЖАНИЕСОДЕРЖАНИЕ ..................................................................................................... 2ВВЕДЕНИЕ ............................................................................................................ 6Глава 1. Основные подходы к поиску информации в электронных документах...................................................................................................................................
141.1.Традиционные поисковые системы....................................................... 141.1.1Формальные компоненты поисковой системы ............................... 151.1.2Логический метод определения множества претендентов............ 171.1.3Проблема ранжирования: переход от ~τ к τ ................................... 191.1.3.1Логический метод ранжирования ................................................ 201.1.3.2Ранжирование на основе вектора документа .............................. 211.1.3.3Реалистичные модели ранжирования ..........................................
24Оценка качества документа на основе цитирования: алгоритм1.1.4PageRank.......................................................................................................... 251.1.4.1Вычисление рейтинга страницы по алгоритму PageRank .........
271.1.4.2Наглядное обоснование ................................................................. 281.2.Семантический поиск ............................................................................. 291.3.Естественно-языковые поисковые системы ......................................... 331.3.1Обзор зарубежных естественно-языковых поисковых систем ..... 351.3.2Обзор отечественных естественно-языковых поисковых систем 361.4.Постановка задачи диссертационного исследования ..........................
391.5.Выводы по главе 1 ................................................................................... 41Глава2.Формализацияиалгоритмизацияобработкиаспектно-ориентированных запросов ................................................................................ 422.1Состояние исследований по семантической обработке вопросов наестественном языке ............................................................................................. 422.2Базовые принципы нового подхода к семантически-ориентированномупоиску информации в Интернете ......................................................................
462.3Разработкапринциповсемантическогорасширенияаспектно-ориентированных запросов ................................................................................ 5132.3.1Центральные идеи предлагаемого подхода .................................... 512.3.2Первичные информационные единицы для разработки алгоритмаанализа аспектно-ориентированных запросов ............................................ 532.4Краткая характеристика теории К-представлений ..............................
542.5Разработкаматематическоймоделипроблемно-ориентированнойсистемы первичных единиц концептуального уровня .................................... 572.6Разработка плана алгоритма построения семантического расширенияаспектно-ориентированного поискового запроса ............................................ 622.7Анализ структуры входных запросов аспектно-ориентированноготипа………………………………………………………………………………672.8Формализацияпредположенийовходномязыкеаспектно-ориентированных поисковых запросов............................................................. 702.9Основные идеи разработки алгоритмов определения типа и объектовинтереса входных запросов ................................................................................ 752.10Алгоритмы определения типа аспектно-ориентированного вопроса иего объектов интереса .........................................................................................
802.10.1Алгоритм определения типа запроса ........................................... 802.10.2Алгоритм определения объектов интереса запроса ................... 812.11Разработкаалгоритмапостроениясемантическогорасширенияаспектно-ориентированного поискового запроса ............................................ 832.12Обсуждение разработанных алгоритмов ..............................................
852.13Выводы по главе 2 .................................................................................. 86Глава 3. Разработка алгоритмов семантического преобразования обобщенныхзапросов на основе математических моделей компонентов базы знаний. ... 883.1.Разработка принципов семантического расширения обобщенныхзапросов достижения целей ............................................................................... 883.2.Формальная модель базы знаний для представления целей ..............
923.3.Анализ структуры запросов достижения целей................................... 943.4.Разработка алгоритма определения типа вопросов достижения целей иих объектов интереса .......................................................................................... 9543.5.Метод преобразования вопросов достижения целей к расширенномувиду…………………………………………………………………………….983.6.Разработка принципов семантического расширения обобщенныхзапросов об изменениях состава множеств ...................................................... 983.7.Разработка формальной модели базы знаний для описания измененийсостава множеств ..............................................................................................
1033.8.Анализ структуры запросов об изменениях составов множеств ..... 1053.9.Разработка алгоритма определения типа запросов об измененияхсоставов множеств и их объектов интереса ................................................... 1073.10.Методпостроениясемантическогорасширениявопросовобизменениях в составе множеств ...................................................................... 1123.11.Разработка итоговой модели базы знаний для поддержки поиска ..
1143.12.Выводы по главе 3 ................................................................................ 115Глава 4. Программная реализация системы семантически-ориентированногопоиска на основе предложенного метода и исследование полученныхрезультатов......................................................................................................... 1174.1 Разработка и реализация архитектуры программного комплекса AOSEngine..................................................................................................................
1174.1.1Разработка концептуальной архитектуры программного комплекса... 1174.1.2Разработка компонентной архитектуры программного комплекса. 1214.1.2.1Общаяархитектурапрограммногокомплексаивыборплатформы реализации........................................................................ 1214.24.1.2.2Лингвистическая база знаний ............................................. 1224.1.2.3Аспектно-ориентированная база знаний ...........................
1274.1.2.4Подсистема AOS Engine...................................................... 1294.1.2.5Выбор платформы реализации ........................................... 131Разработка итогового алгоритма построения расширенного множествазапросов и ранжирования результатов ............................................................ 1334.3Исследование полученных результатов ..............................................
1374.4Выводы по главе 4 ................................................................................. 1425Заключение ........................................................................................................ 144СПИСОК ЛИТЕРАТУРЫ ................................................................................ 147ПРИЛОЖЕНИЯ ................................................................................................. 157Приложение 1. Структура и примеры входных аспектно-ориентированныхзапросов.
............................................................................................................. 158Приложение 2. Система продукций разработанной КС-грамматики .......... 168Приложение 3. Полная таблица записей словарей, используемых для анализаструктуры входных запросов ........................................................................... 174Приложение 4.
Алгоритмы. ............................................................................ 180Приложение 5. Анализ структуры понятий, являющихся множествами.... 216Приложение6.Примерыпостроениямножествасемантическипреобразованных запросов...............................................................................
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.