tanenbaum_seti_all.pages (525408), страница 190
Текст из файла (страница 190)
По мере накопления выбранных товаров дополняется информация в сооЫе. В таблице показано, что в корзине клиента содержатся три вида товаров, причем заказано два экземпляра товара третьего вида. Наконец, когда пользователь щелкает 77ЕРЕЙТИ К РАСЧЕТАМ, соок1е, содержащий теперь уже полную информацию о покупках, отсылается вместе с запросом на сервер. Таким образом, серверу точно известно, какие товары заказал клиент. Третий сооЫе-маркер прибыл с веб-портала. Когда пользователь щелкает на ссылке на портал, браузер отсылает ему соок1е, в котором говорится о том, что надо показать страницу, содержащую котировки акций Яцп М1сгозузетз и Огас1е, а также результаты футбольного матча Хеч г'огк 1егз.
Так как максимальный размер соок1е-файла равен 4 Кбайт, то остается еше много места для более детальной настройки страницы. Например, в нее можно включить сводку погоды, специальные предложения„заголовки статей в крупных газетах и т. п. Всемирная паутина (УУУУУУ) 711 СооЫе могут использоваться и для нужд самого сервера. Например, с их помощью можно отслеживать число различных посетителей сайта, узнавать, сколько страниц просмотрел каждый из них, и составлять по этим данным статистику. Когда иа сервер приходит первый запрос от пользователя, вместе с ним, разумеется, не высылается никакой маркер. Поэтому сервер отсылает обратно сооЫе со значением счетчика, равным 1. Последующие переходы между страницами сайта уже будут сопровождаться отсылкой сооЫе.
Всякий раз счетчик будет инкрементироваться и отсылаться пользователю. Таким образом, по счетчикам можно узнать, сколько пользователей покинуло сайт, просмотрев только первую страницу, сколько посетителей просматривают по две страницы, и т. д. СооЫе-файлы могут использоваться и не по прямому назначению. Теоретически, они могут отсылаться только на тот сайт, которым они были порождены, однако они могут попадать и в руки хакеров, использующих многочисленные ошибки браузеров.
Поскольку некоторые сайты, посвященные электронной коммерции, указывают в сооЫе номера кредитных карт, нежелательное их использование может нанести серьезный ущерб. Бсть и противоположный вариант использования сооЫе — для незаметного сбора информации о сайтах, наиболее часто посещаемых данным клиентом. Это делается так. Рекламное агенство, скажем, «Черный Рекламщик», связывается с крупнейшими веб-сайтами и размещает иа иих рекламные бамперы своих корпоративных клиентов, за что сайту выплачиваются денежные взносы.
Вместо того, чтобы предоставлять сайту 61Р или ) РЕО с рекламой, ему дается 1)К1., который следует поместить на всех страницах. Каждый из этих ПК1. содержит уникальный идентификатор в виде имени файла, например: 'пцр://ааа. зп ваку.сош/382674902342.98 Когда пользователь впервые посещает страницу Р, содержащую такую рекламу, браузер, как водится, принимает НТМ(.-файл. Просматривая его, браузер находит ссылку на изображение на гвичелпеайу.сот. Разумеется, он отправляет запрос на получение изображения. Вместе с 01Р приходит сооЫе с уникальным идентификатором пользователя, 362723910 (см. табл.
7.9). «Черный Рекламщик» отмечает, таким образом, тот факт, что пользователь с таким идентификатором посетил страницу Р. Это делается очень просто, так как ссылка на запрошенный файл (382674902342.у/) существует, на самом деле, только на странице Р. Конечно, одна и та же реклама может располагаться иа тысячах разных страниц, но каждая из них имеет свое имя файла.
При этом за выпуск каждого экземпляра рекламная компания может взимать с заказчика небольшую сумму. Затем пользователь может оказаться на другой странице, содержащей баииер от «Черного Рекламщика». Скачав НТМ).-файл с сервера, браузер видит ссылку на изображение с именем, скажем, ойр://»у»»е.зпеаку.сот/493664919923.98 и запрашивает его.
Поскольку с домена глеаяу.согл уже был получен сооЫе, браузер отсылает его обратно с идентификатором пользователя. Так «Черный Рекламщик» (ЧР) узнает о том, что пользователь посетил вторую страницу с его рекламой, Со временем ЧР может составить подробное описание пристрастий пользователя, при этом вовсе не обязательно, чтобы тот щелкал на баинерах. Конечна, остается неизвестным имя пользователя (хотя имеется 1Р-адрес, и этого может 712 Глава 7. Прикладной уровень оказаться достаточно для вычисления имени с помощью баз данных). Однако стоит пользователю указать свое имя на одном из сайтов, сотрудничающих с ЧР, как появляется возможность составить и продать целое веб-досье на пользователя. Продажа таких досье оказывается делом настолько прибыльным, что ЧР выгодно сотрудничать с максимально возможным количеством сайтов и собирать как можно больше информации. Самое коварное во всем этом то, что большинство пользователей даже не подозревают о том, что за ними ведется слежка, и даже считают себя в полной безопасности, поскольку никогда не щелкают ни на каких баннерах.
И если «Черный Рекламщик» хочет стать «Суперчерным Мегзрекламшиком», его объявления не должны выглядеть как обычные классические баннериые ссылки, «Объявление» размером в 1 пиксел, сливающееся по цвету с задним фоном страницы (то есть невидимое), будет иметь ровно такой же эффект при слежении за пользователями: браузер будет запрашивать я11-изображение размером 1х1 пиксел и отправлять обратно соек(е. Для самоуспокоения некоторые пользователи настраивают свои браузеры так, чтобы они отвергали любые соек(е.
Однако это может породить проблемы при работе с «честными» сайтами, которым действительно необходимо обмениваться с пользователями соо1це-маркерами. Для решения этой проблемы иногда устанавливают программы, занимающиеся поеданием соок1е. Они анализируют все приходящие маркеры и принимают либо отвергают их в зависимости от выбора пользователя (например, задается список сайтов, которым можно доверять). Это дает пользователю возможность детального контроля принимаемых соо1г(е-файлов.
Современные браузеры, такие как Мох(11а (элла.люг11!а.огц), часто имеют встроенные средства пользовательского контроля соок!е. Статические веб-документы Основная идея Всемирной паутины состоит в перемещении веб-страниц от сервера клиенту. Простейшие веб-страницы являются статическими, то есть это просто файлы, размещенные на каком-либо сервере и ожидающие востребования. В этом контексте даже видео может быть статической страницей, поскольку это всего лишь файл. В этом разделе мы подробно рассмотрим статические вебстраннцы. В следующем разделе нам предстоит изучение динамического наполнения страниц.
НТМ1. — язык разметки веб-страниц Веб-страницы на сегодняшний день пишутся на языке НТМЕ (НурегТехг МагЬ цр 1-апйиайе). С помощью НТМ1, можно размещать на веб-страницах текст, графику, а также указатели на другие страницы. Он является языком разметки, то есть языком, описывающим способ форматирования документа. Термин «размет ка» (шаг)сир) восходит к тем дням, когда технический редактор с помощью специальной разметки указывал типографу (это такой человек когда-то был), какой шрифт использовать для печати документа. Таким образом, языки разметки содержат подробные команды форматирования. Например, в языке НТМ1., коман- Всемирная паутина (йГ««йт) 713 да <Ь> означает начало участка текста, печатаемого полужирным шрифтом, а </Ь> означает конец такого участка.
Преимушество языка разметки перед языком, не имеющим явных команд форматирования, заключается в том, что браузеры для отображения страниц, написанных на этом языке, программируются довольно просто: браузер должен понимать и выполнять содержащиеся в тексте команды разметки. Среди других популярных примеров языков разметки — языки ТеХ и гго(Е. С помощью встроенных стандартизированных команд разметки в НТМ1-файлах становится возможным читать и переформатировать любую веб-страницу веббраузером. Способность изменять форматирование важно, так как должна быть возможность просматривать веб-страницу, созданную на экране с установленным разрешением 1600х1200 точек при 24 битах на точку, на экране с разрешением, например, 840х320 точек при 8 битах на точку.
Далее мы приведем краткий обзор языка НТМ1., просто чтобы дать о нем представление. Хотя, в принципе, можно создавать НТМ(.-документы с помощью стандартных текстовых редакторов, и многие так и делают, также есть возможность использовать специальные НТМ1-редакторы, берущие на себя большую часть работы (за счет снижения возможностей пользователя детально контролировать получаемый результат). Веб-страница состоит пз заголовка и тела.
Вся страница размещается междукомандами форматирования, называемыми в языке НТМ1. тегами, <Пта)> и <йта1>. Впрочем, большинство браузеров правильно отобразят страницу и в отсутствие этих тегов. Как видно из рис. 7.12, а, заголовок веб-страницы заключен в скобки тегов <Ьеэо> и <Фезо>, а тело располагается между тегами <Ьосу> и </Ьосу>. Команды внутри тегов называют директивами. Большинство НТМ1-тегов имеют такой формат, то есть <зоаетп1п0> помечает начало чего-либо, а </зоаегЬ1по> — его конец.
Большинство браузеров предоставляют возможность просмотра исходного НТМ(.-кода веб-страннц (пункт меню тяат«Вошса или нечто подобное). Регистр символов в тегах не имеет значения. Например, <Ьезс> и <НьА0> означают одно и то же, однако новый стандарт требует использования исключительно строчных букв. Формат самого НТМ(.-текста, то есть расположение строк и т. д., не имеет значения. Программы обработки НТМБ-текстов игнорируют лишние пробелы и переносы строк, так как они все равно форматируют текст так, чтобы он помещался в заданной области отображения.
Соответственно для того чтобы исходные НТМ).-документы легче читались, в них можно добавлять произвольное количество знаков табуляции, пробелов и символов переноса строк. И наоборот, для разлелсния абзацев в тексте в исходный НТМ1-текст недостаточно вставить пустую строку, так как она просто игнорируется браузером. В этом случае необходимо явное использование специального тега. Некоторые тоги могут иметь (именованные) параметры, называемые атрибутами.
Например: «!ад згс-"аос" а1г-"тоозаг"> представляет собой тег <тко> с атрибутом згс, которому присвоено значение «аЬс», и атрибутом з)т, которому присвоено значение «1ооЪаг». Для каждого тета стан- 714 Глава 7. Прикладной уровень дарг НТМ). устанавливает список допустимых атрибутов и их значение. Поскольку все атрибуты являются именованными, их порядок не имеет значения, <нтнт,> <НКАО> «тттье> корпорапия соонзкстзо штучек. </тттье> </нкАО> <Воот> <н1> добро пожаловать на страницу компании СООВВВСТВО ШТУЧЕК.
</51> <тид НКС-"Вттр://нчн.ньодеа.сов/Ьвадез/1одо.д15" АЬт-"АИ1 Ьодо"> <ЗА> Ны рады приветствовать вас на домашней странипе корпорапии <В> СООВШЕСТВО ШТУЧЕК</В> иы надеемся, что <1> вы </1> найдете здесь всв неоокодимув вам ннформапив. <р>нике приведены ссылки на инферналию о нашей замечательной продуклни.