Главная » Просмотр файлов » LAB1 Логинов А. А.

LAB1 Логинов А. А. (544684), страница 2

Файл №544684 LAB1 Логинов А. А. (Лабораторная работа 1) 2 страницаLAB1 Логинов А. А. (544684) страница 22015-08-20СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 2)

Если страницы B, C, D ссылаются на страницу А, каждая из них вносит по 0.25 в PageRank страницы А.

Предположим, что на странице B имеются ссылки на страницы A и C, а страница D содержит ссылки на все три страницы. Значение PageRank распределяются между всеми исходящими ссылками на странице. Таким образом, страница B «даёт» по 0.125 страницам A и C. Только треть PageRank страницы D учитывается в PageRank А.

LexRank – лексический аналог функции ранжирования PageRank, используемой в поисковике Google. Представляя набор предложений как граф, LexRank он специальным образом обрабатывается, и на конечном этапе используется PageRank, чтобы получить веса предложений.

Расширенный режим подачи запросов к поисковой машине.

Расширенный поиск Яндекса позволяет указывать регион поиска, расположение слов на странице, их употребление в тексте, а также язык страниц, дату последнего обновления и формат страниц.

Поиск Google не ограничивается поиском введенных слов. С помощью расширенного поиска можно искать только те страницы, которые:

  • содержат ВСЕ введенные условия поиска;

  • содержат точное словосочетание;

  • содержат хотя бы одного из введенных слов;

  • НЕ содержат ни одно из введенных слов;

  • написаны на определенном языке;

  • созданы в определенном формате;

  • были изменены в определенный период времени;

  • содержат числа из определенного диапазона;

  • находятся на определенном домене или веб-сайте;

  • не содержат материалов, предназначенных только для взрослых.

Также улучшить результаты поиска можно, добавив "операторы" к условиям поиска.

Операторы расширенного поиска включают:

  • поиск с включением;

  • поиск синонимов;

  • поиск "OR" (или);

  • поиск в домене;

  • поиск по диапазону чисел;

  • другие функции расширенного поиска.

Поиск "+"

Google игнорирует общие слова и символы на некоторых языках, такие как где, как, 1, а также отдельные цифры и буквы, так как они замедляют поиск и не влияют на качество результатов.

Если общее слово должно быть включено в поисковый запрос, поставьте перед ним знак "+" (перед знаком "+" обязательно должен быть пробел).

Например, чтобы Google включил "1" в поиск по запросу ("Звездные войны, эпизод 1"), введите:

звездные войны эпизод +1

Поиск синонимов

Если нужно найти не только сами слова из запроса, но и их синонимы, поставьте тильду ("~") непосредственно перед словом (пока только в поисках на английском языке).

Например, если Вы ищете информацию о еде, питании и готовке, введите такой запрос:

~food ~facts

Поиск "OR" (или)

Чтобы найти страницы, которые содержат одно из двух условий поиска, введите между ними "OR", написанное заглавными буквами.

Например, если Вы хотите провести отпуск в Лондоне или Париже, введите следующее:

отпуск лондон OR париж

Поиск в домене

Поиск Google может использоваться в пределах одного веб-сайта. Для этого введите условия поиска, а после них введите слово "site", двоеточие и название домена.

Например, чтобы найти информацию о поступлении в НИУ МЭИ на сайте университета, введите:

правила приема site:www.mpei.ru

Поиск по диапазону чисел

Любите числа? Поиск по диапазону чисел ищет результаты, содержащие числа в указанном диапазоне. Просто введите два числа, разделенные двумя точками без пробелов, в строку поиска вместе с остальными условиями запроса. С помощью диапазона чисел можно задавать любые диапазоны - от дат (Вилли Мэйз 1950..1960) до веса (5000..10000 кг грузовик). Не забудьте указать единицу измерения или другой индикатор того, что представляет собой данный диапазон.

Например, вот как можно найти DVD-проигрыватель по цене от 50 до 100 долларов США:

DVD проигрыватель $50..$100







Достоинства и недостатки функций оценки релевантности.

Функция оценки релевантности TF/IDF.

Достоинства:

  • Учитывает не только конкретный документ, в котором встречается слово, но и другие документы коллекции.

  • Скорость вычисления. Для формирования оценки достаточно просканировать все документы в пределах одной коллекции.

Недостатки:

  • Оценка является статической. Может измениться только при изменении одного из документов коллекции.

  • Частота встречаемости слова далеко не самый надёжный показатель релевантности, особенно для русского языка. Можно составить документ, в котором релевантное слово не будет повторяться (с использованием синонимов), или же, наоборот, текст будет перегружен омонимами нерелевантного слова.

  • Совершенно бесполезный текст, буквально перегруженный ключевыми словами, позволит обхитрить данную оценку.

  • Не учитывается уровень вложенности документа.



Функция оценки релевантности PageRank.

Достоинства:

  • Учитывается своего рода «мнение» других страниц.

  • Оценка является динамической. PageRank в результате каких-либо событий может и упасть, и возрасти.

Недостатки:

  • Порождает множество путей искусственного увеличения PageRank и, как результат, опадание в поисковую выдачу нерелевантных страниц.

  • Относительно медленная скорость получения актуального значения оценки, так как перед вычислением PageRank конкретной страницы требуется вычислить PageRank страниц, ссылающихся на данную.

Методы борьбы с нерелевантным содержимым.

Часто сильно снизить релевантность содержимого могут:

  1. Сайты, копирующие или переписывающие информацию с других ресурсов и не создающие оригинального контента.

  2. Сайты с автоматически сгенерированным (бессмысленным) текстом.

  3. Сайты, отдающие разный контент пользователям и роботам поисковых систем (клоакинг).

  4. Сайты, использующие обманные техники, перенаправляющие пользователей на сторонние ресурсы или меняющие окно результатов поиска на страницы других ресурсов при переходе из поисковых систем.

  5. Сайты, содержащие списки поисковых запросов (многократное повторение и перечисление ключевых слов), предназначенные исключительно для обмана поисковой системы.

Для повышения релевантности помимо исключения из индекса сайтов, снижающих её (описано выше), используются:

    1. Системы распознания

Поисковые машины научились понимать, что ищут пользователи. Существуют системы распознавания текстового содержимого, системы синонимов и очень мощные системы анализирования.

Например: на запрос «посик боваров» Google выдаст результаты по «поиск товаров»

    1. Понимание идеи запроса

Алгоритмы Google понимают, что в запросе “new york times square church” пользователь ищет известную церковь на Times Square, а не статьи из New York Times.

    1. Выдача результатов по региону

Один и тот же запрос, написанный в различных странах, даст абсолютно разные результаты. Пользователь, ищущий “bank” в США, должен получить Американские банки, а пользователь в Великобритании получит соответствующие банки.

    1. Полная персонализация

Для идентифицированных пользователей система Google будет выдавать результаты на основе его истории запросов. Если у пользователя множество запросов по футболу, то на запрос “club Barcelona” он получит результаты по футбольному клубу, а не по баскетбольному.

    1. Результаты на другом языке

Google может предложить показать результаты на другом языке, переведённые фирменным переводчиком.





























Список используемых источников.

    1. http://yandex.ru/search/advanced

    2. http://support.google.com

    3. http://www.google.ru/advanced_search

    4. http://ru.wikipedia.org/wiki/Релевантность

    5. http://ru.wikipedia.org/wiki/TF-IDF

    6. http://en.wikipedia.org/wiki/PageRank

Характеристики

Тип файла
Документ
Размер
131,86 Kb
Тип материала
Высшее учебное заведение

Список файлов лабораторной работы

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6274
Авторов
на СтудИзбе
316
Средний доход
с одного платного файла
Обучение Подробнее