Автореферат (Математическое моделирование и программная реализация семантического преобразования поисковых запросов), страница 2

PDF-файл Автореферат (Математическое моделирование и программная реализация семантического преобразования поисковых запросов), страница 2 Технические науки (40665): Диссертация - Аспирантура и докторантураАвтореферат (Математическое моделирование и программная реализация семантического преобразования поисковых запросов) - PDF, страница 2 (40665) - СтудИ2019-05-20СтудИзба

Описание файла

Файл "Автореферат" внутри архива находится в папке "Математическое моделирование и программная реализация семантического преобразования поисковых запросов". PDF-файл из архива "Математическое моделирование и программная реализация семантического преобразования поисковых запросов", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ ВШЭ. Не смотря на прямую связь этого архива с НИУ ВШЭ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.

Просмотр PDF-файла онлайн

Текст 2 страницы из PDF

Итоговая математическая модель базы знаний для поддержкисемантического преобразования запросов и поиска.2. Разработан комплекс из двух алгоритмов, обеспечивающих анализпоисковых запросов на соответствие рассматриваемым типам и подтипампоисковых запросов, а также позволяющий определить значимые объектыинтереса поисковых запросов.3.Разработаныметодиалгоритмпостроениямножествапреобразованных запросов.4.

Разработан программный комплекс, реализующий предлагаемыйметод семантического преобразования поисковых запросов и использующийразработанные алгоритмы. Разработанный программный комплекс былуспешно развернут по адресу http://www.aosengine.ru.5. Разработана КС-грамматика в форме Бэкуса-Наура для описаниявходного языка поисковых запросов пользователей.Апробация и внедрение результатов исследования. Основныерезультаты работы представлялись и получили одобрение на научнопрактической конференции студентов и аспирантов «Информационныетехнологии в экономике, бизнесе, управлении» (ГУ-ВШЭ, 2010), на IXМеждународной научно-технической конференции «Новые информационныетехнологии и системы» (НИТиС-2010), на молодежной научнойконференции «Гагаринские чтения» в МАТИ (2011) и на научном семинаре«Математические модели информационных технологий» Отделенияприкладной математики и информатики факультета бизнес-информатикиНИУ ВШЭ в 2012 году.

По теме диссертационной работы опубликовано 7научных работ, включая две статьи в изданиях из списка изданий,рекомендованных ВАК РФ. Разработанный в диссертации программныйкомплекс был развернут по адресу http://www.aosengine.ru/.Структура диссертации: основной текст диссертации изложен на 156страницах, состоит из введения, четырёх глав, заключения, спискалитературы из 100 наименований и девяти приложений.II.ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫВо введении обоснована актуальность темы диссертационной работы,сформулированы цели и задачи работы, определены ее теоретическая ипрактическая значимость, приведены сведения об апробации и внедрении7работы, о структуре диссертации и о публикациях по теме диссертации.В первой главе анализируется современное состояние исследований поразработке систем синтаксического и семантического поиска информации воВсемирной Паутине (Вебе) и корпоративных внутренних сетях.

Детальнорассматриваются принципы поиска по ключевым словам и логика,применяемая в системах такого класса, а также наиболее распространенныеметоды ранжирования результатов поиска. Проводится обзор иклассификация систем, реализующих принципы семантического поиска.Значительное внимание уделяется описанию принципов разработкиестественно-языковых поисковых систем и анализу характеристик основныхпредставителей систем данного класса. Рассматриваются отечественныеразработки в области семантического поиска, методы и модели, применяемыев данных системах. Формулируется цель диссертационного исследования.Во второй главе в параграфе 2.1 выделяются для исследования три классаважных для приложений, но недостаточно исследованных в научныхпубликациях естественно-языковых запросов: (1) аспектно-ориентированныезапросы(касающиеся характеристик объекта интереса либо егоособенностей).

Примеры: «Каковы особенности компьютера iMac?», «Какустроен мейнфрейм?»; (2) запросы о достижении целей (связанные суспехами и неудачами тех или иных интеллектуальных систем). Примеры:«Каковы успехи компании Oracle?», «Какие неудачи были у компанииMicrosoft два года назад?»; (3) запросы, касающиеся сохранения илиизменения состава того или иного множества. Примеры: «Какие изменениябыли в прошлом году в руководстве компании Google?», «Какие изменениябыли в компании Яндекс в департаменте эксплуатации?».В параграфах 2.2 - 2.3 предлагаются принципы нового подхода ксемантически-ориентированному поиску информации в Интернете,основанного на семантическом преобразовании входного запроса в форму(множество производных запросов), позволяющую традиционной поисковойсистеме найти более релевантные (семантически) документы.

Для каждого извыделенных классов запросов предлагаются принципы семантическогопреобразования.Характеристическим объектом, или характеристическим словом, будемназывать слово запроса, позволяющее охарактеризовать его принадлежностьтому или иному типу. Объектами интереса запроса будем называть те словазапроса, которые составляют непосредственную информационнуюпотребность пользователя. Дополнительными объектами интереса будемназывать дополнительные элементы запроса, важные для пользователя.Например, характеристическим объектом запроса «Каковы характеристикипроцессора Cray?» является слово «характеристики», а объектом интереса «процессор Cray».

Для запроса «Какие успехи были у компании Cloudera в2010 году» характеристическим объектом является слово «успехи», объектом8интереса - «компания Cloudera», а дополнительным объектом интереса «2010 год».Значительнуюценностьдляпрактикипредставляютметодысемантического поиска, инвариантные по отношению к предметной областилибо способные работать в широком диапазоне предметных областей. Всвязи с этим в параграфе 2.4 сделан вывод о целесообразности разработкиновых методов семантического поиска информации в Сети на основе широкоприменимой математической модели, описывающей (а) систему первичныхинформационных единиц, используемых поисковой системой (что означаетперечисление таких единиц и описание их взаимосвязей); (б) цели людей иорганизаций; (в) динамику изменений различных множеств (советадиректоров фирмы и т.д.).

Проведенный анализ научной литературы показал,что в настоящее время в доступной литературе опубликована только однатеория, предоставляющая возможности построения математических моделей,удовлетворяющих требованиям (а) - (в), это теория К-представлений(концептуальных представлений). Данная теория изложена в большой сериипубликаций В.А. Фомичева на русском и английском языках.Основной предлагаемый принцип расширения аспектно-ориентированныхзапросов(АО-запросов)заключается,во-первых,впостроениисемантических производных первоначального запроса.

Для преобразованиятакогороданеобходимоучитыватьконцептуальноеокружениехарактеристического слова, специфическое для определенного типа запроса,т. е. его синонимы, гипонимы и гиперонимы. Использование синонимичныхзапросов позволит расширить спектр релевантных по ключевым словамдокументов и обнаружить необходимую информацию. Гипонимы игиперонимы характеристических слов используются с той же целью, ноимеют несколько другой смысл: в некотором документе можетприсутствовать информация, касающаяся объекта интереса запроса вконтексте рассмотрения его либо как составляющего элемента (гипонима)более общей сущности, либо, наоборот, можетрассматриватьсясоставляющая часть понятия (в данном случае характеристическое словобудет выступать в качестве гиперонима).

Например, для понятия«компьютер» гипонимами являются понятия «сервер» и «ноутбук»; дляпонятия «сервер» гиперонимом является понятие «компьютер».Концептуальное окружение позволит строить семантически близкие запросы,а также анализировать возвращаемые документы на соответствие запросу.В параграфе 2.5 построена математическая модель проблемноориентированной системы первичных единиц концептуального уровня сцелью создания основы для разработки алгоритмов семантическогопреобразования АО-запросов.

Модель описывает новые классы формальныхобъектов, названных размеченными концептуально-объектными системами(р.к.о.с.) и расширенными концептуальными базисами (р.к.б.).9Для построения произвольной р.к.о.с. нужно выбрать сортовую систему S,удовлетворяющую нескольким дополнительным требованиям (аспектноорентированную сортовую систему). В теории К-представлений сортовойсистемой называется произвольная упорядоченная четверка S = (St, P, Gen,Tol), где St – конечное множество символов, называемых сортами иинтерпретируемыхкакобозначениянаиболееобщихпонятий,рассматриваемых в выбранной группе предметных областей, P – выделенныйсорт «смысл сообщения», интерпретируемый как характеристикасемантических представлений высказываний и связных повествовательныхтекстов; Gen - бинарное отношение (частичный порядок) на St, отражающеефакт существования иерархии понятий по степени общности; Tol - бинарноеотношение на St, отражающее возможность наличия несколькихнесопоставимых семантических характеристик объектов из рассматриваемойобласти (см.

«Информационные технологии», 2002, № 10, С. 16-25).Пример. Множество St может включать такие элементы физ,об,дин.физ.об, интс, интерпретируемые как обозначения понятий «физическийобъект»,«динамическийфизическийобъект»,«интеллектуальнаясистема»,что Gen включает пары (физ.об, дин.физ.об), (физ.об, физ.об), и Tolвключает пары (физ.об, интс), (интс, физ.об).В этом случае размеченной концептуально-объектной системой,согласованной с сортовой системой S, называется упорядоченный набор Cobsвида (X, V, tp, F, Qf, Chr, Fgn), где X, V – счетные непересекающиесямножества символов (первичный информационный универсум и множествопеременных), tp – отображение из объединения множеств X и V в множествотипов Tp(S), F – подмножество, состоящее из обозначений функций, Qf –множество, состоящее из 11 выделенных бинарных реляционных символовдля отображения содержания АО-запросов, Chr - выделенное конечноеподмножество множества унарных функциональных символов F[1](интерпретируется как множество характеристик (аспектов) объектовзаданной предметной области).Пусть Concepts - множество всех таких d из X, что тип tp(d) начинается ссимвола ↑ (т.е.

d – обозначение понятия). Тогда Fgn – это функция, ставящаяв соответствие произвольному cpt из Concepts упорядоченную тройку Gn =(Ge, Concr, Syn), где Ge - множество обобщающих понятий для концепта cpt,Concr - множество конкретизирующих понятий для концепта cpt, Syn множество синонимов (на концептуальном уровне) концепта cpt, причем Ge,Concr, Syn – это подмножества множества Concepts. Функцию Fgn будемназывать детерминантом концептуального окружения; если cpt – элементмножества Concepts, то упорядоченная тройка Gn(cpt) = (Ge, Concr, Syn)будет называться концептуальным окружением термина cpt.Пример.

Пустьcpt = «характеристики», тогда детерминантконцептуального окружения Gn(cpt) = (Ge, Concr, Syn), где Ge ={отзыв,10рекомендация}, Concr = {описание}, Syn = {описание}.Расширенным концептуальным базисом (р.к.б.) называется произвольнаяупорядоченная четверка Extbs вида (S, Cobs, Ql), где S — произвольнаяаспектно-ориентированная сортовая система, Cobs — размеченнаяконцептуально-объектная система (к.о.с.) вида (X, V, tp, F, Qf, Chr, Fgn),согласованная с S, и Ql — система кванторов и логических связок длясортовой системы S и концептуально-объектной системы Ct=(X, V, tp, F).Пусть Extbs — произвольный р.к.б. вида (S, Cobs, Ql), где S —произвольная аспектно-ориентированная сортовая система, Cobs —размеченная концептуально-объектная система вида (X, V, tp, F, Qf, Chr, Fgn)согласованная с S, и Ql — система кванторов и логических связок.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5259
Авторов
на СтудИзбе
421
Средний доход
с одного платного файла
Обучение Подробнее