48073 (Поиск информации в Интернет)

2016-07-30СтудИзба

Описание файла

Документ из архива "Поиск информации в Интернет", который расположен в категории "". Всё это находится в предмете "информатика" из 1 семестр, которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "курсовые/домашние работы", в предмете "информатика, программирование" в общих файлах.

Онлайн просмотр документа "48073"

Текст из документа "48073"

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

  1. ОБЩИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Поиск информации в Интернет: стратегия и методика

1.2 Поиск с помощью каталогов

1.2.1 Принцип работы, преимущества и недостатки каталогов

1.2.2 Электронные каталоги глобального масштаба

1.2.3 Российские каталоги ресурсов Интернет

1.3 Поиск с помощью поисковых машин

1.3.1 Принцип работы, преимущества и недостатки поисковых машин

1.3.2 Глобальные поисковые машины

1.3.3 Российские поисковые машины

2 ПОИСК ИНФОРМАЦИИ. АНАЛИТИЧЕСКИЙ ОБЗОР НАЙДЕННЫХ ДОКУМЕНТОВ

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИНТЕРЕНТ-РЕСУРСОВ

ВВЕДЕНИЕ

Интернет — глобальная компьютерная сеть, охватывающая весь мир. Она составлена из разнообразных компьютерных сетей, объединенных стандартными соглашениями о способах обмена информацией и единой системой адресации. Интернет образует ядро, обеспечивающее связь различных информационных сетей, принадлежащих различным учреждениям во всем мире.

Для того, чтобы различные компьютеры в Интернете могли сообщаться друг с другом, используются протоколы, т.е. правила или условия коммуникации. Язык Интернета называется TCP/IP, что означает протокол Управления передачей/Интернет-протокол. Любой компьютер для того, чтобы общаться в Интернете, должен уметь "говорить" на языке TCP/IP. Этот стандарт является "открытым", что означает, что он не является фирменным продуктом какой-либо одной компании. Основная операционная система называется UNIX, но стандарт Интернета приспособлен для использования на всех наиболее распространенных системах, таких как UNIX, PC и Macintosh.

Интернет состоит из взаимосвязанных сетей, эксплуатируемых университетами, государственными учреждениями, военными, корпорациями и другими организациями. Эти сети связаны друг с другом различными видами оборудования такими, как маршрутизаторы, мосты и коммутаторы. Маршрутизаторы решают, в каком направлении отослать сетевые данные, предварительно посылая пакеты по нужному адресу и затем "маршрутизируя" данные в направлении соответствующего компьютера, где эти пакеты собираются вновь. Мосты предназначены для соединения двух каких-либо сегментов кабельной проводки внутри сети; коммутаторы – это приспособления для замыкания и размыкания цепей.

Одной из наиболее популярных служб, возникших на базе сети Интернет, стала «Вceмирнaя пaутинa» WWW (Wоrld Widе Wеb). Tипичнaя «Wеb-страница» представляет собой полный экран текстовой и графической информации, связанной с некоторым конкретным предметом или вопросом. Ключевые слова и (или) изображения на такой странице выделены. Если пользователь выбирает один из таких выделенных элементов, то на экране воспроизводится новая страница, посвященная выбранному слову или изображению. Пользователь может, следуя таким ссылкам, продолжить вывод на экран новых страниц. Программа, которая осуществляет поиск, выборку и воспроизведение Web-страниц, называется браузером, а компьютеры, хранящие информацию, – Web-серверами.

Концепцию «паутины» разработал в 1990 Т.Бернерс-Ли в Европейском центре ядерных исследований ЦЕРН в Женеве (Швейцария). Он хотел создать систему, которая помогала бы ученым сотрудничать, применяя упрощенные способы создания и использования мультимедиа-информации. Систему связей (ссылок) между документами называют гипертекстом. Для создания системы гипермедиа «паутина» сочетает гипертекст с мультимедиа (текст, изображения, звук и видео). Совместное пользование информацией, содержащейся в «паутине», стало возможным благодаря применению для создания Web-стpaниц oбщeгo языкa, пoлучившeгo нaзвaниe гипepтeкcтoвoгo языкa oписaния дoкумeнтoв НТML, общего протокола для обмена информацией, названного гипертекстовым транспортным протоколом HTTP, и стандартного формата адресов (унифицированного указателя ресурсов) URL. Важным достоинством URL является то, что он может работать с любым протоколом, а не только с HTTP; отсюда следует, что «Всемирная паутина» спроектирована так, чтобы ее можно было использовать со всеми существующими и будущими сетевыми службами.

«Паутина» приобрела в ЦЕРНе исключительно высокую популярность и вскоре появилась в других научно-исследовательских центрах, включая национальный центр США по применениям суперкомпьютерных вычислений NCSA. В 1993 группа сотрудников NCSA, возглавляемая М.Эндрессеном, начала разработку улучшенного Web-браузера, получившего название «Мозаик». «Мозаик» мог работать на большинстве типов рабочих станций и персональных компьютеров. Бесплатный доступ к этой программе просмотра сделал «паутину» исключительно популярной, и число обращений к сети начало расти с феноменальной скоростью. За несколько месяцев количество используемых экземпляров «Мозаик» превысило миллион, а трафик WWW вырос в 10 тыс. раз. Эндрессен и его группа ушли из NCSA, чтобы работать над коммерческой версией «Мозаик». Затем появились и другие коммерческие браузеры, способствовавшие быстрому росту и развитию «Всемирной паутины».

Спектр пользователей WWW довольно широк. Ее мультимедиа-возможности удобны для астрономов, заинтересованных в совместных наблюдениях за кометами, для математиков привлекательны воспроизводимые на экране геометрические фигуры, а для биологов – доступ к обширным базам данных по белкам. Благодаря тем же средствам стали возможными «виртуальные туры», посвященные осмотру коллекций произведений искусств в разных музеях. Такие государственные организации, как НАСА, Смитсоновский институт и Библиотека Конгресса используют WWW для публикации текстовой информации и изображений. Корпорации размещают в узлах WWW рекламу, информацию о продаже аппаратных или программных продуктов и принимают заказы. Для индивидуальных пользователей, располагающих собственными компьютерными идентификаторами, наиболее увлекательным представляется создание своих «базовых Web-страниц», открывающих новые возможности для самовыражения и совместного пользования информацией.

Цели выполнения курсовой работы:

1. ознакомиться с всемирной компьютерной сетью Интернет и используемыми в ней технологиями;

2. освоить приемы эффективного поиска необходимой информации в сетевых ресурсах;

3. получить практический опыт поиска информации по заданной теме;

4. освоить основы языка HTML и методы создания Web- документов;

5. получить практический опыт создания Web- страниц на основе найденных в сети документов;

6. получить более глубокую теоретическую и практическую подготовку по специальности на основе самостоятельного изучения и обобщения научной, учебной литературы и нормативных документов, а также формирования умений и навыков по работе в сети.

Задачами курсовой работы являются:

  • рассмотрение общих принципов построения и функционирования Всемирной компьютерной сети Интернет;

  • рассмотрение общих принципов организации поиска информации в сети Интернет;

  • поиск информации по заданной теме в сети Интернет;

  • аналитический обзор найденных документов;

  • создание Web- страницы на основе найденных в сети документов.

  1. ОБЩИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ПОИСКА ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

1.1 Поиск информации в Интернет: стратегия и методика

Поиск информации является одной из наиболее распространенных и одновременно наиболее сложных задач, с которыми приходится сталкиваться в Сети любому пользователю. Причина сложностей, возникающих при информационном поиске в Интернет, определяется двумя главными факторами. Во-первых, число источников в Сети чрезвычайно велико. Во-вторых, массив информации в Сети не только колоссален по объему, но еще и крайне динамичен. За те полминуты, что мы потратим на чтение первых строк этого раздела, в виртуальной вселенной появится порядка сотни новых или измененных документов, десятки будут перемещены на новые адреса, а единицы - навсегда прекратят свое существование.

Необходимость и важность проблемы информационного поиска привела к образованию в самом Интернет целой отрасли, задача которой заключается именно в оказании помощи пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые службы или сервисы. Условно их можно разделить на кaтaлoги (dirесtоriеs) и пoиcкoвыe мaшины (sеаrсh еnginеs).

Эти разновидности внешне очень похожи, поскольку каждый каталог, как правило, обладает собственной поисковой машиной, а каждая поисковая машина - собственным каталогом. Однако принципы их работы базируются на абсолютно разных подходах и технологиях. Каждый из этих инструментов имеет определенные преимущества, а основная разница между ними заключается в участии/неучастии человека. Поисковые машины запускают в Web программных «пауков» (spiders), которые путешествуют со страницы на страницу и на каждой индексируют ее полный текст. Каталоги же формируются людьми-редакторами, которые прочитывают страницы, отсеивают неподходящие и классифицируют узлы по темам. При этом каждая разновидность поисковых сервисов применяется для решения определенного типа задач. Правильным выбором инструмента во многом определяется стратегия поисковой деятельности и, в конечном итоге, результат разысканий.

Приступая к информационному поиску в Интернет, следует всегда помнить несколько основных моментов. Прежде всего, никакие средства навигации - каталоги или поисковые машины - не охватывают всего текущего информационного массива Интернет. По некоторым оценкам, даже такие признанные лидеры сетевого поиска как Google, отражают не более трети совокупного содержания Сети. Причина этого - постоянный колоссальный прирост объемов информации в Интернет, который, несмотря на все усилия навигационных служб, содержит огромное число белых пятен.

Помимо быстрого роста и изменения местоположения документов, большинство поисковых систем имеют внутренние ограничения на отражение материалов одного сайта и на объем индексируемой части страницы. Программы-роботы зачастую не идут в глубь сервера дальше определенной директории, что также сокращает число отраженных материалов.

В тоже время многие крупные сайты имеют собственную систему поиска, которая отражает весь их информационный массив. Выявив такие сервера с помощью каталогов, можно провести более детальное их обследование, использовав локальный поисковый механизм. Таким образом, для достижения наиболее полных результатов следует применять каталоги и поисковые машины в сочетании друг с другом.

Существует также ряд общих требований к поисковой деятельности, соблюдение которых повышает эффективность и экономит время, затрачиваемое на разыскание данных.

  1. Для поиска материалов по крайне узкой специфической тематике стоит начинать с каталогов.

  2. Для получения более полных результатов по сложному запросу поиск рекомендуется проводить отдельно в каждой поисковой машине. Поисковые системы имеют сильный разнос в отражении документов и их последовательное использование в значительной степени расширяет охват материала.

  3. При разыскании документов об отдельной стране или на конкретном языке следует отдать предпочтение национальным/региональным поисковым средствам.

  4. Формировать запрос надо максимально точно, используя все возможности механизма составления запроса. Затраты времени на детальное составление поискового предписания окупаются при анализе результатов поиска. При точном формировании запроса процент информационного шума будет намного ниже.

При систематическом обращении к поисковым средствам, необходимо постоянно следить за новостями, относящимися к поисковому сервису. В окружающем нас мире вообще, а в цифровом мире тем более, нет ничего вечного. Каждая поисковая система переживает периоды зарождения, расцвета и упадка. Не бойтесь отказаться от использования любимой, но устаревающей поисковой системы и перейти на использование новых поисковых инструментов, обладающих большей эффективностью.

1.2 Поиск с помощью каталогов

1.2.1 Принцип работы, преимущества и недостатки каталогов

Каталоги – это пионеры навигации в Сети. Каталог представляет собой данные, структурированные по темам в виде иерархических структур. Пpи зaгpузкe кaтaлoгa нa экpaн вывoдитcя caмый oбщий пepечeнь oблacтeй чeлoвeчecкoй дeятeльнocти: ИCКУCCTВO, OБPAЗOВAHИE, БИЗHEC, HAУKA, ИГPЫ, CПOPT и т.д. Каталоги имеют иерархическую структуру, то есть пользователь, входя в любой раздел каталога, последовательно видит все более и более дробную его детализацию. Бoльшинcтвo кaтaлoгoв сoздaются путeм дoбaвлeния aвтopaми wеb-cтpaниц cвoeгo сaйтa к сущecтвующeму cпиcку ccылoк.

Поисковые кaтaлoги coздaются вpучную, т.e. инфopмaция в них зaнoсится людьми. Высококвалифицированные редакторы лично просматривают информационное пространство WWW, отбирают то, что по их мнению представляет общественный интерес, и заносят в каталог. Благодаря "человеческому" фактору, информация в каталогах организована достаточно четко, что позволяет в определенных случаях достичь требуемого результата быстрее, чем при помощи поисковых машин. Основной проблемой поисковых каталогов является чрезвычайно низкий коэффициент охвата ресурсов WWW. В каталоги попадают лишь лучшие страницы. Поэтому найти достаточно специфическую информацию в каталоге зачастую очень сложно.

Кроме основных разделов многие каталоги имеют дополнительные, в которых сайты классифицированы по другому основанию: региону, стране; алфавиту; популярности.

Особенность каталогов в том, что они более эффективны при поиске подборок информации на определенную общую тему, например, «профсоюзное движение», «редакции газет Урала», а не при поиске ответа на конкретный вопрос!

Каталоги могут быть:

  • специализированными и включать только ссылки на сайты определенной, узкой тематики. Подобные каталоги удобны для поиска информации по конкретной тематике. Пример специализированного каталога: «Русский медицинский сервер» dir.rusmedserv.com.

  • универсальными, которые позволяют производить поиск по различным темам. Информация сгруппирована по разделам. Каждый раздел имеет несколько подразделов. Например, www.ru, referal.ru, www.freeedom.ru.

1.2.2 Электронные каталоги глобального масштаба

Созданием и актуализацией каталогов глобального масштаба в большинстве случаев занимаются информационные компании, прежде всего американские. Практически все каталоги декларируют всемирный охват материала, однако, практика показывает, что основной упор делается все-таки на североамериканские сайты. Естественно, что обращение к глобальным каталогам ресурсов требует минимального владения английским языком.

Yahoo! (http://www.yahoo.com/)

Yahoo! является одним из самых первых, надежных и авторитетных каталогов Всемирной паутины. У каталога два основных достоинства: - внушительный объем (на сегодня отражено порядка 2 миллионов сайтов в более чем 25 тысячах категорий) и научность и логичность используемой схемы классификации. Основной ряд Yahoo! включает 14 категорий, в числе которых: БИЗНЕС И ЭКОНОМИКА, КОМПЬЮТЕРЫ И ИНТЕРНЕТ, НОВОСТИ И СМИ, РАЗВЛЕЧЕНИЯ, ИСКУССТВО И ГУМАНИТАРНЫЕ НАУКИ, ОБРАЗОВАНИЕ, ПОЛИТИКА, ЗДРАВООХРАНЕНИЕ, ЕСТЕСТВЕННЫЕ НАУКИ, ОБЩЕСТВЕННЫЕ НАУКИ и т.д. Использование Yahoo!, как и любых других каталогов, наиболее эффективно для ознакомления с наполнением Интернет по различным областям деятельности, при размытости критериев пoиcкa - кoгдa нeизвecтнo пo кaким ключeвым cлoвaм ocущecтвлять пoиcк. Yahoo! - огромный транснациональный проект. В основном каталоге учитываются, главным образом, англоязычные ресурсы, представленные по всему миру. Для разысканий по отдельным странам выделены Local Yahoos! - региональные каталоги, обладающие иерархической структурой, аналогичной главному справочнику, но отражающие ресурсы в основном отдельных стран, большинство которых представлено на национальных языках. Учитывая гигантскую популярность и, следовательно, посещаемость Yahoo!, в последние несколько лет его владельцы уделяют все большее внимание побочным сервисам, среди которых электронные магазины, аукционы, службы новостей, агентства путешествий и т.п. (Приложение 1)

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Нет! Мы не выполняем работы на заказ, однако Вы можете попросить что-то выложить в наших социальных сетях.
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
4098
Авторов
на СтудИзбе
667
Средний доход
с одного платного файла
Обучение Подробнее