tanenbaum_seti_all.pages (525408), страница 188
Текст из файла (страница 188)
7.11, а. Злесь как входящий запрос (1), так и исходящий ответ (2) проходят через входной модуль. Иногла для обхода этой проблемы применяется хитрость под названием передача ТСР. Суть се в том, что ТСР-соединение продлевается ло конечного (обрабатываюшего) узла, и он может самостоятельно отправить ответ напрямую клиенту (рис. 7.11, б).
Эта передача соединения для клиента незаметна. о поведении пользователей — цапример, о том, в каком порядке люди посещают страницы на сайте. Если приходит слишком много запросов в секунду, центральный пропессор может перестать справляться с их обработкой вне зависимости от того, сколько дисков параллслыю работают па сервере. Решается зта проблема установкой на сервере нескольких узлов (компьютсров). Их полезно укомплектовывать реплицированными (содержашими одинаковую информацию) дисками во избежание ситуации, когда узким местом становится дисковый накопитель. В результате возникает многомашинная система, организованпая в виде серверной фермы (рис.
7.10). Входной модуль по-прежнему принимает входящие запросы, однако распределяет их ца сей раз пе между потоками, а между центральными процессорами, снижая тем самым нагрузку па каждый компьютер. Отдельные машины сами по себе могут быть многопотоковыми с конвейеризацией, как и в рассматриваемом ранее случае. Всемирная паутина (()))т)ЛМ) 706 От клиента К кпнвнту От кпнвнта Рис. 7.11. Обычный запрос-ответный обмен (а); обман запросами н ответами прн передача ТОР (б) Цй~ — унифицированные указатели информационных ресурсов Мы несколько раз упоминали о том, что веб-страницы могут быть связаны между собой ссылками.
Пора познакомиться с тем, как эти ссылки реализованы. Уже при создании Паутины было очевидно, что для реализации ссылок с одних страниц на другие необходим механизм именования н указания расположения страниц, В частности, прежде чем выводить выбранную страницу на экран, нужно узнать ответы на три следующих вопроса. 1. Как называется эта страница? 2, Где она расположена? Э. Как получить к ней доступ? Если бы каждой странице можно было присвоить уникальное имя, то в идентификации страниц не было бы никакой неоднозначности. Тем не менее, проблему бы это не решило.
Для примера проведем параллель между страницами и людьми. В Соединенных Штатах почти у всех граждан есть номер карточки социального страхования, представляющий собой уникальный идентификатор, так как иет двух людей с одинаковым номером. Тем не менее, зная только номер карточки социального страхования, нет способа узнать адрес владельца и, конечно, нельзя определить, следует ли писать этому гражданину по-английски, по-испански или по-китайски.
Во Всемирной паутине проблемы, в принципе, те же самые. В результате было принято решение идентифицировать страницы способом, решающим сразу все три проблемы. Каждой странице назначается унифицированный указатель информационного ресурса (()Гкк., ()п(Еогщ Кезоцгсе Коса(от), который служит уникальным именем страницы. (Ж(. состоят из трех частей: протокола (также называемого схемой), Г)ХЗ-имени машины, на которой расположена страница, и локального имени, единственным образом идентифицирующего страницу в пределах этой машины (обычно это просто имя файла). Например, веб-сайт факультета, на котором работает автор, содержит несколько видеофрагментов об университете н городе Амстердаме.
Унифицированный указатель страницы с видео выглядит следующим образом: йцр://вика.са.чо.п)/чЫао/)пт)ах-ап.)твтт! 706 Глава 7. Прикладной уровень Таблица 7.9. Некоторые распространенные 0Й1.-указатели Имя Применение пример Гипертекст(НТМЦ РТР Локальный файл Телеконференция Статья новостей Оорлег Отправке электронной почты Уделеняыйтерминел Ьнр://илие.оз.тил1/-ае1/ Пр://Пр.ое.ти.М/рив/пзпзг/йЕАСМЕ 61е:////иег/ешеппе/ргод.о почте:оогпр.ое,пхп1х пеиге:АА0134223112мсе.и1аь.еои дорьеп//дорьег.1о.игпп,еои/11/0ьгаг!ея глазго:,/оппйзепвеогп.огд 1е1пе1://Ипиооигз.огд:80 поим петге дорьег тлело 1е1пе1 Кратко рассмотрим этот список. Протокол /гггр является родным языком Всемирной паутины, на нем разговаривают веб-серверы.
НТТР— это сокращение, которое расшифровывается как НурегТехт Тгапз(ег Ргососо) (протокол передачи гипертекста). Более подробно мы рассмотрим его далее в этой главе. Этот ()К1 состоит иэ трех частей: протокола (/гпр), ПХЗ-имени хоста (гввгтв,сз.ри.л!) и имени файла (оЫео/1пг/ех-ел./гггл1). Отдельные части ПКЕ-указателя разделяются специальными знаками пунктуации. Имя файла представляет собой относительный путь по отношению к веб-катологу свои.оял1, У сайтов могут быть сокращенные имена для ускоренного доступа к определенным файлам, Скажем, при отсутствии в ПК1.
имени файла может выводиться главная (домашняя) страница сайта. Если имя файла заканчивается именем каталога, то из него по умолчанию выбирается файл с именем 1лг1ех./гглт1. Наконец, имя -изет/ может соответствовать тт'Ъ'Тгу-каталогу пользователя, причем может быть также задано имя файла по умолчанию, например, 1логех/гпл/. Так, на домашнюю страницу автора можно попасть по адресу 'пнр://игипог.сэ.ии.п1/-азт/ несмотря на то, что действительное имя файла (1пг/ех./гпп1) отличается от указанного.
Теперь надо понять, как работает гипертекст. Чтобы на неком участке текста браузер мог реагировать на щелчок мыши, при написании веб-страннцы нужно обозначить два элемента: отображаемый на экране текст ссылки н ()К1 страницы, которая должна стать текущей при щелчке мышью. Синтаксис такой команды будет пояснен далее в этой главе. При выборе ссылки браузер с помощью службы 0ХЗ ищет имя хоста, Зная 1Р-адрес хоста, браузер устанавливает с ним ТСР-соединение. По этому соединению с помощью указанного протокола браузер посылает имя файла, содержащего страницу. Вот, собственно, и все. Назад по соединению передается страница. Такая схема является открытой в том смысле, что она позволяет использовать разные протоколы для доставки информационных единиц разного типа.
Определены ()К1-указатели для других распространенных протоколов, понимаемые многими браузерами. Слегка упрощенные формы наиболее употребительных ОКЕ-указателей приведены в табл. 7.9, Всемирная паутина (!ЗдаМI) 707 Протокол11р используется для доступа к файлам по РТР— протоколу передачи файлов по Интернету. За двадцать лет своего существования он достаточно хорошо укоренился в сети. Многочисленные РТР-серверы по всему миру позволяют пользователям в любых концах Интернета регистрироваться на сервере и скачивать разнообразные файлы, размещенные на сервере.
Всемирная паутина здесь не вносит особых изменений. Она просто упрощает доступ к РТР-серверам и работу с файлами, ибо само по себе РТР имеет несколько загадочный интерфейс (однако более мощный, чем НТТР: например, он позволяет пользователю машины А передать файл с машины В на машину С). К локальному файлу также можно обратиться как к веб-странице, либо используя протокол Я!е, либо просто указав имя файла.
Такой подход напоминает РТР, но не требует наличия сервера. Разумеется, он работает только с локальными файлами, а не с расположенными на удаленных терминалах. Задолго до появления Интернета появилась система групп новостей ПЗЕХЕТ. Она состоит примерно из 30 000 конференций, в которых миллионы людей обсуждают широкий круг вопросов, отправляя и читая сообщения, связанные с тематикой данной конференции. Протокол пемз позволяет пользователю вызывать на экран статью с новостями, как если бы она была обычной веб-страницей. Это означает, что веб-браузер легким движением руки превращается в элегантную программу чтения новостей.
На самом деле, благодаря кнопкам и пунктам меню многих браузеров чтение новостей ()БЕХЕТ становится даже удобнее, чем с помощью специальных программ чтения сетевых новостей. Для протокола пемз поддерживается два формата !)ВЬ-указателей. Первый формат указывает телеконференцию, и с его помощью можно получить список новых статей с указанного заранее сайта новостей. Второй формат позволяет получить конкретную статью по ее идентификатору, например, АА0134223112Рся игаЬ,еНи. Для получения этой статьи с заранее настроенного сайта браузер использует протокол ХХТР (Хегч огЬ Хек Тгапз(ег Ргососо! — сетевой протокол передачи новостей).
Мы изучим ХХТР в этой книге, однако надо понимать, что это нечто вроде ЗМТР, они весьма похожи даже по стилю. Протокол йорйег используется системой ОорЬег, разработанной в университете штата Миннесота и получившей свое название от университетской спортивной команды «Со)беп СорЬегз» («Золотые суслики»). (Гоферами называют уроженцев штатов Миннесота, Арканзас и Флорида. Кроме того, на американском сленге это слово означает «добывать», «копать», «искать».) Система СорЬег появилась в Интернете на несколько лет раньше Всемирной паутины.