Диссертация (Методы и программные средства поиска информации на основе прецедентов в интеллектуальных поисковых системах), страница 3

PDF-файл Диссертация (Методы и программные средства поиска информации на основе прецедентов в интеллектуальных поисковых системах), страница 3 Технические науки (27498): Диссертация - Аспирантура и докторантураДиссертация (Методы и программные средства поиска информации на основе прецедентов в интеллектуальных поисковых системах) - PDF, страница 3 (27498) - 2019-03-12СтудИзба

Описание файла

Файл "Диссертация" внутри архива находится в папке "Методы и программные средства поиска информации на основе прецедентов в интеллектуальных поисковых системах". PDF-файл из архива "Методы и программные средства поиска информации на основе прецедентов в интеллектуальных поисковых системах", который расположен в категории "". Всё это находится в предмете "технические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата технических наук.

Просмотр PDF-файла онлайн

Текст 3 страницы из PDF

Программная реализация прототипа ИПС на основе прецедентов«STRAY SEARCH» выполнена с использованием технологии .NET дляпостроения распределенных информационных систем ASP.NET, ADO.NETEntity Framework и Windows Communication Foundation (WCF). В конце главывыполнен анализ эффективности работы прототипа ИПС на основе прецедентов«STRAY SEARCH» для различных схем взаимодействия агентов.14ГЛАВА 1ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫИнформационно-поисковаясистема(ИПС)–этосистема,обеспечивающая поиск и отбор необходимых данных в специальной базе сописаниями источников информации (индексе) на основе информационнопоискового языка и соответствующих правил поиска [1, 2].

Главной задачейлюбой ИПС является поиск информации в соответствии с информационнымипотребностями пользователя, формируемыми в виде запроса. Очень важно врезультате проведенного поиска ничего не потерять, то есть найти в индексе вседокументы, относящиеся к запросу (полнота поиска), и не выдать ничеголишнего (точность поиска).1.1.Процесс информационного поискаИнформационный поиск (ИП) – процесс отыскания в некотором множестветекстов (документов) таких, которые посвящены указанной в запросе теме(предмету) или содержат нужные пользователю факты, сведения (рис.

1) [2]. ИПможет осуществляется вручную либо посредством ИПС с использованиемсредств автоматизации. Непременным участником ИП является человек. Взависимости от характера информации, которая содержится в выдаваемых ИПСдокументах, ИП может быть документальным, в том числе библиографическими фактографическим. ИП нужно отличать от логической переработкиинформации, без которой невозможна непосредственная выдача человекуответов на задаваемые им вопросы.15Коррекция запросаФормированиезапросаОкончание поискаПоискПросмотр результатовпоискаРис. 1. Процесс информационного поискаПри ИП отыскиваются – и могут быть найдены – такие и только такиефакты или сведения, которые были введены в ИПС. Перед вводом в ИПСдокумента определяется его основное смысловое содержание (тема или предмет),которое затем переводится и записывается на одном из информационнопоисковых языков. Эта запись называется поисковым образом документа.Поступивший запрос также переводится на информационно-поисковый язык,образуя поисковое предписание.

Поскольку поисковые образы текстов ипоисковые предписания записаны на одном и том же языке, выражения накотором допускают только одно истолкование, возможно сравнивать ихформально, не вникая в смысл. Для этого задаются определённые правила(критерии соответствия), устанавливающие, при какой степени формальногосовпадения поискового образа с поисковым предписанием документ следуетсчитать отвечающим на информационный запрос и подлежащим выдаче.Эффективность ИП характеризуется двумя относительными показателями– коэффициентом точности (отношением числа документов, отвечающих наинформационный запрос, к общему числу документов, выданных в результатеИП) и коэффициентом полноты (отношением числа документов, отвечающих наинформационный запрос, к общему числу таких документов, содержащихся в16данной ИПС).

Необходимые значения этих показателей зависят от спецификиинформационных потребностей. Например, при поиске патентных описаний сцелью проведения экспертизы патентной заявки на новизну необходима 100%полнота результата ИП, а при поиске, ориентированном на обычногоисследователя, приемлемой считается точность (релевантность) результата около80%, а полнота – около 50%.ИПможетбытьдвухтипов–избирательное(илиадресное)распространение информации и ретроспективный поиск. При избирательномраспространении информации ИП производится по постоянным запросамнекоторого числа пользователей (абонентов), осуществляется периодически(обычно один раз в неделю или в две недели) и выполняется лишь в массиведокументов, поступивших в ИПС за этот период времени. Между ИПС иабонентами устанавливается эффективно действующая обратная связь (абонентсообщает, в какой степени этот документ соответствует запросу и нужна ли емукопияполноготекста,остепенисоответствияэтогодокументаегоинформационной потребности), которая позволяет уточнять потребностиабонентов, своевременно реагировать на изменения этих потребностей иоптимизировать работу системы.

При ретроспективном поиске ИПС отыскиваетсодержащие требуемую информацию документы во всём накопленном массиведокументов по разовым запросам.ИПС, решая задачи сбора, хранения, обработки и выдачи информации,выполняют следующие операции [2]: поиск документов; анализ содержимого документов; построениедокументово документе);поисковыхинформации,образовдокументовиспользуемой(извлечениесистемойкакиззнания17 хранениепоисковыхобразовдокументов (сведенийодокументах); анализ запросов пользователей (потребителей информации); поиск релевантных (соответствующих) запросу документов; выдача ссылок на документы пользователям.1.2.Информационно-поисковый языкЯзык запросов – это искусственный язык, на котором записываютсязапросы к базам данных (БД) и другим информационным системам, а также кИПС [6].Язык, на котором формулируются запросы к поисковым системамназывается языком поисковых запросов или информационно-поисковым языком.В разных поисковых системах языки запросов могут различаться, однакообычно они являются некоторым подобием языка регулярных выражений сдополнениями, связанными со спецификой работы той или иной поисковойсистемы.

Знание и правильное применение языка запросов конкретнойпоисковой машины улучшает и упрощает пользователю процесс поискаинформации.Язык поисковых запросов состоит из логических операторов, префиксовобязательности, возможности учета расстояния между словами, морфологииязыка, регистра слов, расширенных операторов, возможностей расширенногопоиска, уточнения поиска.Информационно-поисковыйязык(ИПЯ)–знаковаясистема,предназначенная для описания (путём индексирования) основного смысловогосодержания текстов (документов) или их частей, а также для выражениясмыслового содержания информационных запросов с целью реализации ИП [7].18Любой абстрактный ИПЯ состоит из алфавита (списка элементарных символов),правилобразованияиправилинтерпретации.Правилаобразованияустанавливают какие комбинации элементарных символов допускаются припостроении слов и выражений, а правила интерпретации – как надлежитпонимать эти слова и выражения.ИПЯдолженрасполагатьлексико-грамматическимисредствами,необходимыми для выражения основного смыслового содержания любого текстаи смысла любого информационного запроса по данной отрасли или предмету,быть недвусмысленным (допускать одно истолкование каждой записи), удобнымдляалгоритмическогосопоставленияиотождествления(полногоиличастичного) записей основного смыслового содержания текстов и смысловогосодержания информационных запросов.

При разработке конкретного ИПЯучитываются специфика отрасли или предмета, для которой этот язык создаётся,особенноститекстов,образующихпоисковыймассив,характеринформационных потребностей, для удовлетворения которых создается даннаяИПС.В большинстве ИПЯ основной словарный состав (лексика) задаётся егоперечислением и представляет собой фрагмент лексики того или иногоестественногоязыка.Отобранныеизестественногоязыкасловаисловосочетания, в совокупности образующие основной словарный состав,служат как бы алфавитом данного ИПЯ.

Правила образования в таких ИПЯвыполняют функцию синтаксиса. В некоторых ИПЯ основной словарный составзадаётся (полностью или частично) методом порождения, который заключаетсяв том, что для таких ИПЯ правила образования устанавливают, как из данногоалфавита строить слова ИПЯ, а из этих слов – выражения (фразы) и какие из нихбудут правильно построенными. В середине 20 века в качестве ИПЯ широко19применялиськлассификациибиблиотечно-библиографическиеиязыкидескрипторного типа [8].1.3.ИндексированиеИндексирование – процесс выражения главного предмета или темы текстакакого-либо документа в терминах ИПЯ.

Применяется для облегчения поисканеобходимого документа среди множества других. Проводится индексированиекак целого документа, так и его частей [6, 7]. Для индексирования нередкоиспользуются заглавия текстов. При индексации опускаются сопутствующиепредметы или темы. Это служит причиной того, что при поиске не найденнымиостаются документы, для которых предмет или тема информационного запросаявляется не главной, а сопутствующей.Различают два основных типа индексирования: классификационное икоординатное.Приклассификационноминдексированиидокументывзависимости от их содержания включаются в соответствующий класс (один илинесколько), в котором собираются все документы, имеющие в основномодинаковое смысловое содержание.

Каждому такому документу присваиваетсяиндекс этого класса, служащий далее его поисковым образом.При координатном индексировании основное смысловое содержаниетекста выражается перечнем полнозначных слов, выбираемых либо из самоготекста или его заглавия, либо из специального нормативного словаря. В первомслучае такие лексические единицы называются ключевыми словами, а во втором– дескрипторами. Каждое ключевое слово или дескриптор обозначает класс, вкоторый потенциально входят все тексты, где в выражения основногосмыслового содержания входит это слово. Логическое произведение классов,которые обозначены всеми словами, выражающими в совокупности основноесмысловое содержание текста, как бы образует некоторый сложный класс.20Построенный таким способом сложный класс обозначается перечнем ключевыхслов или дескрипторов, и этот перечень служит поисковым образом данногодокумента или выражением на ИПЯ смыслового содержания запроса.

Такимобразом, при координатном индексировании смысловое содержание текставыражается как бы указанием его координат в некотором n-мерном смысловомпространстве.Разновидностью координатного индексировании является циклическоеиндексирование, которое основано на использовании ключевых слов заглавиятекста и заключается в том, что все ключевые слова заглавия вместе с контекстомпоочерёдно выводятся в поисковую колонку. В этой колонке ключевые словадаются в алфавитном порядке. На основе координатного индексированиясозданы и более сложные ИПЯ.

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5224
Авторов
на СтудИзбе
426
Средний доход
с одного платного файла
Обучение Подробнее