LAB1 Степная Е.В. (544690), страница 3
Текст из файла (страница 3)
Итак. Заявленные формулы успеха (релевантности), находящиеся в открытом доступе для оптимизаторов веб-ресурсов, на самом деле недостаточно полны, чтобы уповать на них в реальной «борьбе» за популярность своего сайта. В то же время, как мы уже говорили, усложнение исходных алгоритмов поисковых машин отчасти провоцируют сами оптимизаторы. Разработчики поисковых машин вынуждены балансировать между попыткой найти факторы, которые трудно «накрутить», но при этом достаточные и оптимальные, чтобы справляться с основной задачей – адекватно оценивать релевантность сайтов.
Еще более загадочен алгоритм Rambler. Предполагают, что Rambler большой вес придает собственному рейтингу, а также, возможно, использует некий фильтр ссылок для оценки их количества и даты появления. Помимо этого, данный поисковик «не любит», когда количество ссылок на сайт вдруг резко увеличивается, правомерно подозревая, что имеет дело с «незаконной» накруткой.
Обзор методов борьбы с нерелевантным содержимым.
-
Разработка классификатора. Разделы классификатора называются рубриками. Систематизаторы, зная классификатор, читают документы и приписывают им классификационные индексы, указывающие, каким разделам классификатора эти документы соответствуют. Недостатком данного метода является то, что оценка является социальным действием, и зависит от того, к какому обществу и культуре относится человек, выносящий оценку.
-
«информационные брокеры» владеют когнитологическими метоиками, знают, как устроены классификаторы и как их интерпретируют систематизаторы. В беседе с вами информационный брокер изучает вашу информационную потребность и превращает ее в запрос.
-
ИПС словарного типа. Идея – создать словарь из слов, встречающихся в документах Интернет, в котором для каждого слова хранится список документов, из которых оно взято. Словарь самой крупной ИПС – Alta Vista – имеет объем всего лишь в несколько Гбайт. Слова в словаре упорядочены.
-
Слова далекие и близкие. В ИПС словарного типа в документах, связанных со данным словом указывают номер этого слова в конкретном документе. Для таких ИПС существует оператор «РЯДОМ»
-
Ранжирование результатов поиска. Возможность уточнения запроса, в некоторых ИПС можно указать вес каждого слова в запросе.
-
WEB-кольца – предметная ИПС. С названием нужного предмета связаны списпи соответствующих ресурсов ИНТЕРНЕТ.
-
Поиск специализированной ИПС из ИПС общего назначения.