15367-1 (662972), страница 2
Текст из файла (страница 2)
Из листинга 3 видно, как используется директива ServerAlias, если необходимо создать несколько виртуальных серверов с одинаковым содержанием. После того как вы занесете в конфигурационные файлы информацию об имеющихся на диске виртуальных серверах (разумеется, они должны быть описаны и в конфигурационных файлах DNS), можно приступить к последнему шагу настройки Apache-RUS.
Настройка перекодирования русскоязычных документов
Модуль поддержки русских кодировок был разработан в 1996 г. Дмитрием Крюковым (dvk@stack.net), а с февраля 1997 г. поддерживается рабочей группой Apache-RUS Team во главе с Алексеем Тутубалиным (lexa@ lexa.ru). За время своего развития модуль претерпел множество изменений и теперь обладает практически неограниченными возможностями настройки для любой конкретной конфигурации.
Инструкции, отвечающие за перекодирование, разделяются естественным образом на три группы. К первой относятся две директивы, указывающие, в какой кодировке хранятся файлы на диске: CharsetSourceEnc и CharsetByExtension ...
Например, файл httpd.conf может содержать строки:
CharsetSourceEnc koi8-r
CharsetByExtension windows-1251 .txt
Такая запись означает, что все файлы хранятся на диске в кодировке koi8-r; исключение составляют текстовые файлы с расширением txt, для которых используется Windows-1251.
Если кодировок более одной и документы в каждой кодировке хранятся в своем каталоге, директивы CharsetSourceEnc помещаются в соответствующие секции либо в файлы .htaccsess внутри каталогов.
Вторую группу составляют директивы CharsetDecl, CharsetAlias CharsetRecodeTable и CharsetWideRecode Table, которые определяют названия кодировок, их синонимы и таблицы перекодирования. Все они размещаются в секции - и в большинстве случаев не нуждаются в изменении.
В третью, самую многочисленную группу входят директивы, задающие порядок перекодирования символов от сервера клиенту и обратно.
Принято, чтобы при попадании на русскоязычный сервер пользователь получал страницу в "своей" кодировке, определяемой автоматически на основе той информации об операционной системе, которую передает серверу браузер: например, установив, что пользователь работает в Windows, сервер выдает ему страницу в кодировке Windows-1251, а установив, что он работает в Unix, выдает страницу в koi8. Если выбранная таким образом страница не подходит, клиент может сменить кодировку вручную. Основных схем выбора три: по префиксу каталога, по имени виртуального сервера и по номеру порта. У каждой из них есть свои преимущества и свои недостатки.
1) http://www.rmt.ru/koi/document.html
http://www.rmt.ru/win/document.html - выбор кодировки по префиксу каталога,
2) http://koi.www.rmt.ru/document.html
http://win.www.rmt.ru/document.html - выбор кодировки по имени сервера,
3) http://www.rmt.ru:8000/document.html
http://www.rmt.ru:8001/document.html - выбор кодировки по порту.
Для организации выбора кодировки по префиксу каталога нужно либо внести в секцию VirtualHost строку вида
Alias /koi /www/rmt
либо создать в соответствующем каталоге символическую ссылку на себя:
# cd /www/rmt
# ln -s . koi
Усилия, затрачиваемые на первоначальное конфигурирование, невелики, но для крупных серверов с разветвленной структурой такая схема не очень подходит: вряд ли удастся проконтролировать корректность ссылок на разные страницы узла с внешних серверов, да и за внутренними ссылками проследить не так-то просто (в большинстве случаев они должны быть относительными).
При выборе кодировки по имени сервера необходимо, чтобы информация о соответствующих именах была задана в настройках DNS-сервера, обслуживающего данный домен, а в файл httpd.conf в секцию VirtualHost вносятся строки:
ServerName www.rmt.ru
ServerAlias *.www.rmt.ru
...
Если в качестве имени поддомена выступает один из синонимов названия кодировки (CharsetAlias), то эта кодировка считается кодировкой клиента. При таком подходе ссылки внутри сервера могут быть любыми, и единственный недостаток данной схемы в том, что перекодирование не выполняется для браузеров, не указывающих в запросе имя сервера, - впрочем, их, как уже говорилось, осталось крайне мало. Если же совместимость со старыми браузерами категорически необходима, можно назначить каждому поддомену свой IP-адрес.
Чтобы применить выбор по номеру порта, необходимо в файле httpd.conf удалить директиву Port и снять комментарии со строк
Listen 80
Listen 8100
Listen 8101
Listen 8102
Listen 8103
CharsetByPort koi8-r 8100
CharsetByPort windows-1251 8101
CharsetByPort ibm866 8102
CharsetByPort iso-8859-5 8103
Номера портов не очень важны. В стандартной настройке Apache-RUS нумерация, как видим, начинается с 8100, но чаще ее начинают с 8000 или 8080.
Данная схема не требует внесения дополнительных записей в DNS и позволяет работать с виртуальными серверами даже клиентам, которые не поддерживают протокол HTTP/1.1, - ведь кодировка выбирается исходя из числа, указывающего на номер порта Web-сервера (по умолчанию это 80). Однако сетевые брандмауэры иногда запрещают работу с определенными портами, и если таким брандмауэром защищена сеть клиента, он не сможет установить соединение с вашим сервером. К сожалению, подобная ситуация возникает чаще, чем хотелось бы.
Схема выбора кодировки задается директивой CharsetSelectionOrder. Ее параметры определяют порядок применения правил выбора. Так, выбору по префиксу каталога соответствует строка
CharsetSelectionOrder Dirprefix Useragent Portnumber Hostname UriHostname
Выбору по имени домена - строка
CharsetSelectionOrder Hostname UriHostname Useragent Portnumber Dirprefix
Для выбора по номеру порта следует записать
CharsetSelectionOrder Portnumber Useragent Hostname UriHostname Dirprefix
Замечания
Чтобы документы, кодировка которых была выбрана автоматически, не оседали в кэшах прокси-серверов, Apache-RUS дает им специальный HTTP-заголовок, запрещающий кэширование. В результате при возврате на страницу (например, по кнопке Back) она считывается с сервера заново, что, во-первых, замедляет работу, а во-вторых (и это более серьезная проблема) очищает все текстовые формы, которые были на странице (то же происходит при использовании JavaScript). Разрешить кэширование позволяет директива CharsetDisableForcedExpires On, которая задается в секции для данного виртуального пути или в соответствующем файле .htaccess, но тогда возникает риск, что пользователи иногда будут получать страницы в "чужой" кодировке. Существуют и промежуточные варианты: например, можно установить CharsetDisableForcedExpires On (в секции ) только для тех документов, которые содержат формы, окна или JavaScript-сценарии.
Для полного отключения перекодирования в каталоге или на виртуальном сервере служит директива Charset Disable On.
При выборе кодировки по имени сервера или по префиксу каталога хорошим тоном является использование для графических файлов абсолютных ссылок с указанием имени сервера (например,
). Тогда при переходе клиента от основного сервера к выбранной кодировке изображения будут браться из локального кэша браузера, а не перечитываться заново. Это особенно актуально при большом объеме графической информации на сервере.
Запуск сервера
По окончании процедуры настройки следует запустить httpd-сервер. Для этого нужно войти в систему с привилегиями пользователя root и дать команду
# /usr/local/apache/sbin/apachectl start
(начиная с версии 27.4 - # /usr/local/apache/bin/apachectl start)
Если в конфигурационных файлах есть серьезные ошибки, сервер не запустится, а на экран будет выведено соответствующее сообщение. В любом случае после запуска сервера имеет смысл просмотреть файлы error_log и access_log, которые находятся в каталоге logs. Для проверки работоспособности сервера достаточно создать в его корневом каталоге файл index.html и обратиться из браузера по адресу сервера. Правильную установку режимов перекодирования следует проверять с помощью браузеров для различных операционных систем. Не забудьте добавить Apache в список программ, запускаемых при старте системы. Успехов вам в пополнении русского Web-пространства!
Об авторе
Артем Подстрешный - программист, работает в компании "Радио-МГУ". В "Мире ПК" опубликована его статья "Имена Internet". E-mail: art@radio-msu.net; http://www.radio-msu.net/
Ссылки
http://www.apache.org/ - официальный сервер разработчиков Apache
http://apache.lexa.ru/ - сервер группы разработчиков русского модуля Apache
ЛИСТИНГ 1 Фрагмент простого файла access.conf
## access.conf - Apache HTTP server configuration file
##
# access.conf: Global access configuration
# Online docs at http://www.apache.org/
Options FollowSymLinks
AllowOverride None
Options All
AllowOverride All
order allow,deny
allow from all
# You may place any other directories or locations you wish
to have access information for after this one.
ЛИСТИНГ 2 Описание виртуальных серверов с различными IP-адресами
...
ServerName www.radio-msu.net
DocumentRoot /www/radio-msu.net
ServerName www.radio-msu.net
ErrorLog /var/log/error_log.radio-msu.net
CustomLog /var/log/access_log.radio-msu.net combined
...
DocumentRoot /www/rmt.ru
ServerName www.rmt.ru
ErrorLog /var/log/error_log.radio-msu.net
CustomLog /var/log/access_log.radio-msu.net combined
...
ЛИСТИНГ 3 Описание виртуальных серверов, различающихся только доменным именем
...
ServerName www.radio-msu.net
NameVirtualHost 193.124.134.2
DocumentRoot /www/radio-msu.net
ServerName www.radio-msu.net
ErrorLog /var/log/error_log.radio-msu.net
CustomLog /var/log/access_log.radio-msu.net combined
...
DocumentRoot /www/people.radio-msu.net
ServerName people.radio-msu.net
ServerAlias *.people.radio-msu.net
ErrorLog /var/log/error_log.people.radio-msu.net
CustomLog /var/log/access_log.people.radio-msu.net combined
...
Список литературы
Артем Подстрешный. Работа с Web-сервером Russian Apache.















