Б. Страуструп - Язык программирования С++. Специальное издание, 3-изд. Бином. 2004 (1160791), страница 220
Текст из файла (страница 220)
сопИ со!!а1е<сдагй сгур = ияе /асе1<с1уре<сдаг >(г!Ь(, !оса1е г!!(!ос, со!(; // сравнение дтпских строк !оса!е Щ!!, с1ур( // классификация датских символов // и сравнение дагяских сгпрок ког1(о.берт() и.епа() г12(; // -. Понятие категории дает более простой способ манипулирования стандартными фасетами локализаций. Например, имея локализацию с!и, мы можем сконструировать локализацию, которая читает и сравнивает строки в соответствии с датскими правилами (где по сравнению с английским имеются три дополнительные гласные), но'в которой сохраняется синтаксис чисел, используемый в С+ч-: 1оса1е гЖ ик(1оса1ечс!аякк((, г!Ь, со!!а1е(сяуре! //датские буквы, алериканские числа При описании конкретных стандартных фасетов приводятся и другие примеры их использования.
В частности, обсуждение сойа1е Я Г.4.1) выявляет многие общие решения относительно архитектуры фасетов. Заметилп что стандартные фасеты часто зависят друг от друга. Например, пит ри! зависит от питрипс1. Только детально зная индивидуальные фасеты, вы сможете успешно комбинировать фасеты или создавать новые версии стандартных фасетов. Другими словами, помимо простых операций, упоминавшихся в 9 21.7, меданизмы локализаций предназначены не для новичков.
969 Гй. Стандартные фвсвты Разработка индивидуально~о фасета — обычно неблагодарный труд. Причина отчасти в том, что фасеты должны отражать неупорядоченные культурные соглашения, неподконтрольные разработчику библиотеки, а отчасти в том, что средства стандартной библиотеки С++ должны оставаться в значительной степени совместимыми со средствами стандартной библиотеки С и различными стандартами, зависящими от платформ. Например, РОЗ!Х предоставляет средства локализации, игнорировать которые разработчику библиотеки было бы неразумно. С другой стороны, среда, обеспечиваемая локализациями и фасетами, — очень общая и гибкая. Можно спроектировать фасет для хранения произвольных данных, а операции фасета мо|ут обеспечить любые желаемые действия с зтими данными.
Если поведение нового фасета не слишком ограничено обилием соглашений, его и роект, вероятно, окажется простым и ясным (9 Г.З.2). Г.4.1. Сравнение строк Стандартный фасет соПа1е (сравнение) обеспечивает сравнение массивов символов типа СЬ: 1етр!асе <с!аяз СЬ> с!азз яЫл соПасе: риЬПс !оса! е /асе1 ( риЬПс. 1урес!е/СЬ сЬаг !уре; 1уреде/ Ьаз!с з1ипу<сБя Игту 1уре; екрвса соуа1е(изе 1 г = О), Ы1 сотраге(сопз1 СБ' Ь, сопя1 СЬ' е, сопз1 СБ' Ь2, сопя1 СЬ* е2) сопя! ( ге1игп до сотраге(Ь, е, Ь2, е2), ) !опу БаяБ(сопя! СЬ* Ь, сопя! СЬ* е) сопя1 (ге1игп с!о БаяБ(Ь, е); ) з1г!лу 1уре !галя!огт(сопя! СЬ* Ь, сопз1 СЬ* е) сопя1 (ге1игп до 1галз/огт(Ь, е); ) Иавс!оса!екЫ Ы; // идентифика(лир фазе~ли (у Г2, у" ГЗ, у ГЗ.!) рго1ес1ед: -соПа1е(); // внимание: заи)ии)енний деструктор о!ггиа! тгс!о сотраге(сопз1 СЬ* Ь, солИ СБ" е, сопя! СЬ" Ь2, сопя1 СЬ' е2) сопИ; о/г1иа! з1гту 1уре с!о 1гапз/огт(сопя! СЬ" Ь, сопз1 СЬ' е) сопИ; Ыггиа! !опу с!о ЬазЬ(сопя! СЬ* Ь, сопз1 СЬ' е) сопя!, Как и все фасеты, соПа1е открыто наследуется от /асе1 н предоставляет конструктор, аргумент которого указывает, отвечает ли класс !оса!е за время жизни фасета (9 Г.З).
Заметьте, что деструктор защищен. Фасст соПа1е не предназначен для негюсрсдственного использования, а служит базовым классом для всех (производных) клас- ~ сов сравнения строк под управлением !оса!е (9 Г.З). Под интерфейс соПа1е прикладные программисты, поставщики реализаций и библиотек могут писать различные фасеты сравнения строк.
Базовой функцией сравнения строк по правилам конкретного соПа1е является сотраге(); она возвращает !, если первая строка лексикографически больше второй, о — если строки идентичны, и — ! — если вторая строка больше первой. Например: Приложение Г Локализация 9?О оои!Ясопя1 к1г!пуй я!, сопз1 я1г!пуй к2, сода1е<сйаг>й стр) ( сопя1 сйаг' ся1 = к1.с!а1а(1 // потому что сотрасе() рабоспиет с сйаг!/ сопз1 сЬ аг* сз2 = я2 с!а1а(); ящисй (стр.сотраге(ся1, ся!чя!.з!ее(), ся2, сз2+к2 я!яе()) ( саяе О: // ссдентссчссьсе с точки зрения стр гтрокп //- Ьгеай; саке — 1: //к! <з2 0- Ьгеай; саяе 1 //- Ьгеай; //я! >я2 оо!с!/(сопя!к!с!пуй я1, сопя! ягг!пуй к2, сопя! сйас и) ( Ьоо! Ь = я! == з2; (/сравнение (набор ссосволов реалпзацпи) сопя! сйаг' сз1 = з1л1ага(); !! потолсу что сотраге рабопсаесп сиассивол сйаг!/ сопк1сйаг" сз2 = я2с(а1а()с 1уреде!соПа!е<сйаг> Со1, сап к! Со!й О!оЬ = ике ~асе1<Со!>(!оса!еб)с // из текусцей глобальной // локализации спг!О = у!оЬ сотраге(сз!, сз!чя!.яие(), ск2, ск2 ' з2 з!ее())с сопя! Со!й ту соП= ияе /все!<Со!>(!осп/е(<"))с // из лсоеи любилсоблокалсюис(исс ии л! = ту соП.сотраге(ся1, ся!чз!.я!ее() ся2, ся2+з2 я!яе()); сопя! Со!й соП = ияе /псе1<Со!>(!оса!е(п))с /( ив локализассип по плени и спЕ с2 = со!! сотраге(ск!, ся!+я! зие(), сз2, ся2+з2 зие()), лп1!8 = !оса!е()(я1, к2), сп1 с4 .= !оса!е('<)(к С з2); тс !5 =.
!оса1е(п)(з1, я2); ((-. // в текущей глобальной локалситцпп // в лоей любипоб локилизас(ип // в локалссзации по илсени и Обратите внимание, что функции-члены соПа1е сравнивают массивы СЬ, а не строки Ьая!с ягг!пдили завершающиеся нулем С-строки. В частности, Сй с числовым значением 0 воспринимается как обычный символ, а не терминатор.
Кроме того, сотраге() отличается от к!гетр() тем, что возвращает конкретно -1, 0 и 1, а не О и (произвольные) отрицательные и положительные значения Я 20АА). Стандартный библиотечный тип з1г!пд не чувствителен к локализации. То есть сравнение производится с использованием правил, принятых для набора символов данной реализации Я В.2). Более того, стандартный тип я1г!пйг не позволяет непосредственно задать критерий сравнения (глава 20). Для осуществления сравнений, зависящих от локализации, мы воспользуемся функцией сотраге() фасета соПа1е. С точки зрения формы записи, быть может удобнее задействовать соПа1е() косвенно, через орега1ог() локализации Я Г.2А). Например: Г 4. Стандартные фасеты 971 В примере 10==(З, с1==14 и 12==с5.
Нетрудно представить случаи, когда г2,, сЗ и 14 раз- личаются. Рассмотрим последовательность слов из немецкого словаря: 01а!епб Осйб йсс1ь й~сйееп, Огсй1апу По соппашенню, существительные (и только) пишутся с заглавной буквы, но порядок не зависит от регистра. Зависящая от регистра сортировка расположила бы слова, начинающиеся с Г), перед словами, начинающимися с с(: ОГа!епб ОГа76 Огс>пипл, йсл, сйсЬСеп Символ а (умляут а) интерпретируется как «нечто вроде а>, поэтому он стоит раньше с. Однако в большинстве распространенных наборов символов числовое значение пбольше числового значения с. Соответственно, сп1('с') < 1л1('а') и на выходе простой сортировки, основанной на числовых значениях, будет: Ога1епй ОГсйеапу, О~пай сайсй, йсшеп Написание функции сравнения, упорядочивающей эту последовательность правильно согласно словарю, является довольно интересным упражнением Я Г.6(31).
, Функция ЬазЬ((вычисляет значениехеширования(~ 17 6 2З), которое, очевидно, может оказаться полезным при построении таблиц хеширования. Функция 1галзуогт() производит строку, сравнение которой с другимн строками дает тот же результат, что получился бы при сравнении с ее входной строкой. Функция 1гапз)огт предназначена для оптимизации кода, в котором одна строка сравнивается со многими. Это полезно при осуществлении поиска одной или нескольких строк во множестве строк.
Открытые функции сотраге(), ЬазЬ(] и 1гапзуогт(( реализованы обращениями к защищенным виртуальным функциям с(о сатрапе((, с(о Ьавй(( и ссо 1гилзуогт((соответственно. В производных классах «с1о функции» можно заместить. Такая стратегия «двух функций» позволяет разработчику библиотеки, реализующему невиртуальные функции, предоставить некоторую общую функциональность для всех вызовов, вне зависимости от того, чем на самом деле занимаются предоставляемые пользователями «с7о функции >. Использование виртуальных функций предохраняет полиморфную природу фасета, но потенциально накладно. Во избежание лишних вызовов функций, 1оса1е может выявить конкретный применяемый ~асе1 и кэшировать значения, нужные ей для повышения производительности Ц Г.2.2).
Статический член Ы типа ЕосаУезЫ идентифицирует фасет Я Г.З). Стандартные функции Ьаз 1асе1 и изе ~асе1полагаются на соответствие этих идентификаторов н фасетов Я Г.3.1). Два фасета, предоставляющие локализации идентичньш интерфейс и семантику, должны иметь одно и то же значение Ы. Например, у сойа1е<сЬаг> и со11асе Ьупате<сЬаг> — одинаковые Ы. И наоборот, два фасета, выполняющие различные функции (по отношению к локализации), должны иметь различные идентификаторы. 11апример, у питрипс!<сЬаг> н лат рЫ<сЬаг> — разные значения Ы Я Г.4.2). Приложение Г Локализация Г.4.1.1.
Именованные фасеты сравнения Фасет соИа(е Ьупате является вариацией соИа(е для конкретной локализации с именем, заданным аргументом конструктора: 1етр!а1е <с1авь СЬ> с!авв вЫ-соуаге Ьупате. ри61и:соуиге сЬ> ( риЫ!с: 1урес!е/'Ьав/с вгг!ау<СИ> вгг/пд гуре; ехрвс11 соваге Ьупате(сопв1сбаг*, в!ее 1 г = 61, // создинпе из ииенованной //локализации // абра нюте ения~ание: нп нового !д, ни навьи функций рго1ес1ес!. -соИаге Ьупате)); // ения~ание; заияяпценный деструктор // зал~естся виртуальные функции соуа1е<ей': ии Йо сотраге(сонет СЬ" Ь, сопв1 СЬ' е, сопв(СЬ' 62, сопв1 СИ" е2) сопв1; в1 мну 1уре с(о 1гапв/огт(сопв1 СЬ* Ь, сопв1 СЬ' е) сопл!; !опус!о Ьавй(сопв1 СЬ' Ь, сопв1СЬ 4 сопз1 Таким образом, фасетом соИа1е Ьупате можно пользоваться для извлечения соИа1е из локализации, именованной в среде исполнения программы Я Г.4).