Методические указания1_2 (1084715), страница 3
Текст из файла (страница 3)
Если в документе есть указание на определенную кодовую страницу, выбор шрифта (в данном случае — некоторого подмножества символов, которые будут служить для отображения кодов 128-255) будет предопределен. Коды 32-127, то есть знаки препинания, цифры и буквы латинского алфавита, отображаются в подавляющем большинстве случаев правильно, а коды 128-255 могут отображаться по-разному. Обычно программы поддерживают большое число национальных алфавитов. Во время инсталляции программного обеспечения автоматически устанавливаются и необходимые для этого шрифты. Проблема чаще всего возникает, если кодовая страница указана неправильно. Например, при создании гипертекстовых документов в MS Word или MS Frontpage Express в текст страницы автоматически добавляется конструкция типа charset=xxxxx, которая не позволяет использовать кириллицу. В этом случае необходимо правильно указать значение атрибута: charset=windows-1251 (или другое, если вам нужна другая кодовая страница). Если вы посмотрите «фирменные» русские сайты в Интернете, то обнаружите, что большинство переключателей кодировки предлагают два варианта использования кириллицы: Windows и КОИ-8.
3. Основные элементы HTML версии 4
Главной проблемой при описании и изучении HTML является определение набора атрибутов и их значений, допустимых для каждого из элементов. Очень часто можно столкнуться с ситуацией, когда некий хорошо известный атрибут не использовался в каком-нибудь элементе, а потом вдруг его использование стало давать эффект при просмотре страницы в новом браузере. Поддержка дополнительных атрибутов — скорее дело совершенствования браузеров, а не языка. Например, фирмы Netscape и Microsoft постоянно развивают свои программы. Поэтому есть смысл вам экспериментировать. Если при разработке Web-страницы вам потребуется известный атрибут, которого нет в спецификации элемента, проверьте — а вдруг заработает?
3.1. Заголовок страницы
Заголовок Web-страницы представляет собой информацию, заключенную внутри элемента (секции) HEAD. В разделе 2.1. мы уже познакомились с элементами заголовка, и сейчас их надо обсудить более подробно.
<TITLE> </title>
Элемент TITLE определяет текст, который появляется в заголовке окна браузера во время просмотра страницы. Этот текст не только служит подсказкой, но может использоваться и поисковыми машинами для анализа страниц. Существует три способа для поиска страниц в Интернете на основе текстовых данных: по ключевым словам элемента МЕТА, по тексту, размещенному на странице, и по строке заголовка внутри элемента TITLE.
< STYLE > </style> и <LINK>
Элемент STYLE тоже должен располагаться внутри элемента HEAD. Если вы хотите разобраться, какие нестандартные форматы используются на странице, надо просмотреть содержимое этого элемента. В нем будут указаны необходимые форматы. Если таких форматов нет, значит стили страницы записаны в отдельном файле. Ссылка на такой файл должна находиться в элементе LINK. Подробнее о стилях рассказывается ниже в разделе «Таблицы стилей».
<МЕТА>
Секция заголовка может содержать несколько элементов МЕТА, каждый из которых отвечает за определенный набор параметров. Использование элементов МЕТА не является обязательным, но некоторые настройки могут быть весьма важны. Так, например, известно, что браузер в некоторых случаях способен автоматически определить вид кодировки страницы. Пользователь, работая с браузером, может выбрать в меню определенную кодировку. Чтобы исключить неопределенность при просмотре конкретной страницы, на ней целесообразно разместить указание на кодовую страницу. Для документов в кодировке Windows оно должно быть таким:
<МЕТА http-equiv="Content-Type" content="text/html; charset=windows-1251">
Информация, сосредоточенная в элементах МЕТА, определяет общие настройки Web-страницы и называется профилем. Профили можно хранить в отдельных файлах и присоединять к определенной странице при помощи специального атрибута элемента HEAD:
<HEAD profile="URL">
В секции HEAD могут располагаться элементы, которые имеют отношение ко всей странице целиком. Так, если для последней создано звуковое сопровождение, то его параметры определяет элемент BGSOUND.
3.2. Стандартные атрибуты
Существует ряд атрибутов, которые могут использоваться во многих элементах. Часть этих атрибутов очень важна для конструирования Web-страниц, а часть подходит только для решения определенных задач.
Атрибут id выполняет функции уникального имени элемента, В зависимости от типа элемента, этот атрибут выполняет различные функции (см. раздел «Таблицы стилей» текущей главы и раздел «Элементы форм» главы 4).
Атрибут classic задает программу или объект, которые могут использоваться в определенных элементах.
Атрибут style может использоваться со многими элементами. Он предназначен для определения формата конкретного элемента и может принимать самые разные значения. Подробно он рассмотрен ниже в разделе «Таблицы стилей».
Похожие функции выполняет атрибут class. Его можно указывать, если в секции HEAD расположен элемент STYLE или использована ссылка на каскадную таблицу стилей (см. ниже раздел «Таблицы стилей»).
Атрибут align используется для выравнивания текста, объектов или элементов целиком. Выравнивание может выполняться относительно границ окна, рамки
3.3. Форматирование текста
Текст — единственный объект Web-страницы, который не требует специального определения. Иными словами, произвольные символы интерпретируются по умолчанию как текстовые данные. Но для форматирования текста существует большое количество элементов. Большинство из них, кроме специальных, поддерживает стандартные атрибуты: id, class, lang, dir, title, style и атрибуты событий. Изначально в HTML было введено меньше возможностей для форматирования текста, чем в обычные текстовые редакторы. В результате авторам гипертекстовых документов приходилось прибегать к различным ухищрениям, чтобы придать тексту заданный вид. Сейчас положение изменилось, но все дополнительные возможности осуществляются за счет применения таблиц стилей. Например, только с помощью свойства text-indent можно задать величину отступа первой строки абзаца.
Форматировать текст можно и с помощью традиционных элементов: выделять фрагменты курсивом, полужирным, выбирать шрифт и т. д. Рассмотрим эти элементы. Для них могут быть использованы стандартные атрибуты id, class, lang, dir, title, style, атрибуты событий, а также атрибуты, определяющие уникальные свойтва определенных элементов.
<P></р>
Элемент абзаца (paragraph) — один из самых полезных. Он позволяет использовать только начальный тег, так как следующий элемент Р обозначает не только начало следующего абзаца, но и конец предыдущего. В тех случаях, когда по смыслу необходимо обозначить завершение абзаца, можно использовать и конечный тег. В некоторых случаях начальный тег удобно ставить в конце строки: он не только обозначит конец абзаца, но и выполнит функцию тега <BR> (разрыв строки). Например:
<P>Текст первого абзаца.
<P>Текст второго абзаца.</р>
Текст третьего абзаца.<Р>
Вместе с элементом абзаца можно использовать атрибут выравнивания align:
-
align="left" — выравнивание по левому краю;
-
align="center" - выравнивание по центру;
-
align=" right" — выравнивание по правому краю.
Для центрирования абзаца следует использовать такую конструкцию:
<Р align="center"> Текст абзаца
Абзацы форматируются браузером, и их вид зависит, в частности, от размера окна программы. Три следующих элемента позволяют внести некоторую определенность в формат абзаца.
<BR>
Элемент, обеспечивающий принудительный переход на новую строку. Он имеет только начальный тег. В месте его размещения строка заканчивается, а оставшийся текст печатается с новой строки.
Атрибут clear позволяет выравнивать объекты (например, рисунки) относительно текста, в котором использован элемент BR. Если элемент объекта содержит атрибут align, то в расположенных рядом элементах BR должен присутствовать атрибут clear, например:
<BR clear="right">
Значения атрибута:
-
попе — значение по умолчанию;
-
left — если объект выровнен влево;
-
right — если объект выровнен вправо;
-
all — для объекта, который может быть выровнен по любому краю.
Стандартные атрибуты: id, class, title, style.
<NOBR> </nobr>
Этот элемент по своему действию является прямой противоположностью предыдущего. Текст, заключенный между его тегами, будет выведен в одну строку. Если Длинная строка не уместится на экране, для ее просмотра придется использовать горизонтальную полосу прокрутки.
<PRE> </pre>
Элемент для обозначения текста, отформатированного заранее (preformatted). Подразумевается, что текст будет выведен в том виде, в котором был подготовлен автором. Например, учитываются символы конца строки, появившиеся при наборе текста в редакторе. Во всех других случаях браузер игнорирует эти символы. Возможен и обратный эффект: если пользователь введет текст как одну длинную строку, то она не будет разорвана браузером, а уйдет за край окна программы. В этом смысле элемент PRE работает так же, как элемент NOBR. По умолчанию для отформатированного заранее текста выбирается моноширинный шрифт. Этот, элемент удобно использовать для показа листингов программ или для вывода текстовых документов, переформатирование которых может привести к искажению их смысла.
Элемент PRE позволяет набрать текст с использованием специальных символов форматирования, таких как «line feed» или «carriage return». Теоретически можно представить ситуацию, когда разработчику Web-страницы потребуется показать, как создавали линии таблиц в далеком прошлом, когда текстовый режим уже существовал, а символы псевдографики еще не были изобретены. В ход шли плюсы, восклицательные знаки и тире. В этом случае элемент PRE также окажется незаменим, хотя я не рекомендую поддаваться ностальгическим порывам: лучше сделать черно-белый рисунок формата GIF.
Для этого элемента определен специальный атрибут, который позволяет задать ширину блока текста в символах:
width=число-символов
Этот атрибут не поддерживается многими браузерами. Стандартные атрибуты: id, class, lang, dir, title, style, атрибуты событий.
<CENTER> </center>
Элемент для центрирования текста, а точнее — любого содержимого. Этот элемент не является общеупотребительным. В тех случаях, когда это возможно, вместо него в элементах текста используют атрибут align="center".
<B></b>
Выделение текста полужирным шрифтом. Очень популярный элемент. Использование полужирного шрифта — прием, позаимствованный из текстовых редакторов.
<BIG>
Увеличение размера шрифта.
<SMALL> </small>
Уменьшение размера шрифта.
<I></i>
Выделение текста курсивом.
<STRIKE> </strike> или <S> </s>
Зачеркнутое начертание текста. В настоящее время элемент STRIKE заменяют более простым в написании элементом S.
<U></u>
Подчеркнутое начертание текста.
<SUB> </sub>
Элемент, создающий эффект нижнего индекса (subscript).
<SUP> </sup>
Элемент, создающий эффект верхнего индекса (superscript). Действие двух последних элементов иллюстрирует фрагмент файла гипертекста Text.htm. Оба этих элемента обеспечивают уменьшение размера шрифта. Поэтому их можно использовать и для форматирования абзаца целиком, если надо, чтобы он был выведен мелким шрифтом.
<TT> </tt>
Элемент, обозначающий текст телетайпа (teletype). Его особенность заключается в том, что он обеспечивает использование моноширинного шрифта.
<INS> </ins> и <DEL> </del>
Эти элементы позволяют выделить текст, который надо обозначить как вставленный (элемент INS) или удаленный (элемент DEL). Визуально вставленный текст выделяется подчеркиванием, а удаленный — зачеркиванием. Для указания источника изменений, то есть для документа, в котором находится Данный фрагмент либо дано объяснение, почему в тексте появилась такая вставка, может быть использован атрибут:
cite="Адрес(URL)"