Нэш Трей - C# 2010. Ускоренный курс для профессионалов (2010) (1160865), страница 62
Текст из файла (страница 62)
Если предоставляет, то вызывается 1 Готтаг Рточ1с(ет . Бег уо тиас с передачей типа 1си з гоаГогпзггет. Если возвращается реализация 1сизгопГогыаттет, то метод использует ее. В противном случае он использует реализацию 1Готтатгаь1е. 115тт1пд самого объекта или же реализацию ОЬ)ест.тозтт1пд. если объект не реализует 1ГогыаттаЬ1е. Рассмотрим следующий пример.
где снова продолжается предыдущий пример Соар1ех. но на этот раз расширяются возможности отладочного вывода вне структуры Совр1ех. Измененный код выделен полужирным. ив1пч Бузте1п; из1по Бузтев.Техт; из1по Бувтеы.61оЬа1) тат)опг риЬ1гс с1азз Сир1вхпвоуогввствг: 1Сизговуогиасеег, 1Гогвасвгои1г)вг ( // Реализация 1Гогваевгоч1бег риЬ11с оЬ3все Песуогзжс( Тура Топпастурв ) ( гл( Тогвастурв = Еуреое(1сивговуопвассег) ) ( гвсигп ЕЬ1вг ) в1вв ( гвтигп Си1гиге1пго.сиггепсси1сигв.
аесуогиас( Тогшастуре )г 234 Глава 8 астапов зсгсрх = срх.Тозсгаод( "Р", 1оса1 ) ( Сопзо1е.кгасеьаое( зггсрх ); зггсрх = срх.тоасг1оо( "Р", дегтзпу )) Соозо1е.игасе)впе ( зсгСрх ); Сомр1а Вйдрвгтэваа . захаре зггвг = пвх Сохр1ахввдуохиазвег(); звгСрх Бсгалд.аоюззк( боярогаасвэг, "(О:ввя)", ерх ); сопзо1э.мг1ееьалв( "1поэлалочяяй вывод:М(О) ", звгсрх ); Конечно, приведенный пример немного сложнее. Но если вы ие являетесь автором типа Сопр1ех, то это может быть единственным способом обеспечить специальное форматироваиие для данного типа. Применяя этот прием, можно предоставлять пользовательское форматирование любому из встроенных типов системы. Сравнение строк Когда речь заходит о сравнении строк, здесь .)()ЕТ ггщпе~чог)г обеспечивает достаточную гибкость. Строки можно сравнивать как иа основе информации о культуре, так и без ее учета.
Также строки можно сравнивать с учетом регистра яли без, причем правила независимого от регистра сравнения варьируются от культуры к культуре. В .НЕТ ггэгпеког)г предусмотрено несколько способов сравнения строк, и некоторые из иих представлены иепосредствеиио в типе яузгеп. Бгг1пд — через статический метод Ягг1по. Сопраге. На выбор доступно несколько его перегрузок, и самая базовая из иих использует для сравнения объект сп1гиге1п1о, присоединенный к текущему потоку.
Необходимость в сравнении строк возникает часто, и беспокоиться о накладных расходах, свяэаииых с культурно-зависимым сравнением, ие придется. Хорошим примером может быть сравнение внутренних строковых данных, скажем, из коифигурациоииого файла, или сравнение файловых каталогов.
Во времена .(чЕТ 1. 1 главным ииструмеитом, имеющимся в распоряжении, был метод Бсг1пд. Сопраге с передачей ему свойства 1пчагаапГСо1гиге, В большинстве случаев этот метод прекрасно работает, однако ои по-прежиему применяет к сравнению информацию о культуре. даже в случае нейтральности по отношению ко всем культурам, что обычно влечет за собой иэлишиие накладные расходы. В .НЕТ 2.0 ггэгпеюог)г было представлено новое перечисление БсгапдСопраг1зоп, которое позволяет выбрать правильный способ сравнения, иезависимый от культуры. Перечисление ягг1поСопрзг1зоп выглядит следующим образом: ри)ч11с епчх Бсг1одСохраг1зоо ( СиггеоГСч1гпге, Сиггесссч1гоге1длогесазе, 1лчагаалГСи1сиге, 1очагааогси1гпге1дпогеСаэе, Огягпа1, Огбала11дпогеСазе Последние два элемента в перечислении представляют особый интерес.
Сравнение иа основе порядка — основной способ сравнения строк; при этом просто сравниваются числовые зиачеиия символов двух строк (т.е., по сути, сравниваются двоичные зиаче- Работа со строками 235 иия каждого символа). Выполнение сравнения подобным образом исключает все нюансы, связанные с культурой из процесса сравнения и значительно повышает его эффективность. Если грубо оценить время выполнения для простых строк, то сравнение иа основе кодов символов оказывается приблизительно иа порядок быстрее.
Для более сложных строк, содержащих что-то кроме латинских символов нижнего регистра, выигрыш в производительности будет еще больше. В .1ЧЕТ 2.0 Ргатпевгог)г предложен новый класс по имени Бггзпдсоглрагег, реализующий интерфейс 1Сомрагег. Такие вещи, как сортироваииые коллекции, могут использовать его для управления сортировкой. Что касается поддержки локали, то тип Бузсеа.зсг1пдСогкрагег следует тому же шаблону,что и интерфейс 1гогглассаЬ1е. Для получения экземпляра БсггпдСоарагег, специфичного для культуры текущего потока, используется свойство Бсг1пдСоглрагег.
СсггепГСи1ссге. Вдобавок можно получить экземпляр Бсг1пдСоглрагег от БсггодСопрагег. СсггепГСс1гсге1дпогеСазе для выполнения независимого от регистра сравнения. Кроме того, с помощью свойств 1пчагаапгСс1гиге и 1пчаг1апгСс1гпге1дпогеСазе можно получить ие зависящие от культуры экземпляры. И, наконец, можно использовать свойства Ого1па1 и Огбапа11дпогеСазе для получения экземпляров, сравнивающих строки иа основе обычных правил порядкового сравнения строк. Как и можно было ожидать, если информация о культуре, присоединенная к текущему потоку, ие подходит, создавать экзеътляры Бсг1пдСомрагег можно иа основе явных локалей, просто вызывая метод Бгггпдсотрагег.сгеаге и передавая ему экземпляр Си1ссге1пго, представляющий нужную локаль, а также флаг чувствительности сравнения к регистру. При выборе среди разных способов сравнения руководствуйтесь целесообразностью его применения для решении конкретной задачи.
Общее эмпирическое правило заключается в том, что для всех данных. видимых пользователю (т.е. данных, которые будут представлены конечному пользователю тем или ииьгм образом), должны использоваться культурно-специфичные и культурно-нейтральные сравнения. В других случаях следует отдавать предпочтение порядковому сравнению.
Однако вряд ли придется когда-либо отображать пользователю строки, сравниваемые с применением 1пгаггапсси1сиге. В отношении данных, имеющих полностью внутренний характер, используйте порядковое сравнение. Фактически, порядковое сравнение с применением 1пчаггапгсс1гсге почти бесполезно. На заметку! До появления версии ЛЧЕТ 2.0 Егаглеаогх существовало общее руководство, гласящее, что при сравнении строк для принятия решений, связанных с безопасностью, необходимо использоватыпчагьапссс1сиге ВмЕСтО базового сравнения с применением си1сиге1пго. Сиггепгси1гиге. Для таких сравнений нужна тонко контролируемая среда, в которой можно иметь уверенность, что она не изменится по сравнению с тестовой средой.
Если сравнение основано на Ссггепсси1гсге, то этого достигнуть не удастся, поскольку конечные пользователи могут изменить текущую культуру на машине и тем самым запустить в действие не прошедший тестирование путь выполнения кода для принятия решения, связанного с безопасностью. Понятно, что протестировать абсолютно все существующие культуры практически невозможно. Естественно, в . МЕТ 2.0 и последующих версиях рекомендуется выполнять такие ответственные сравнения на основе простого порядка кодов символов, а не через 1пчаггапгсс1гиге, что позволит повысить эффективность и безопасность.
236 Глава 8 Работа со строками из внешних источников В пределах .)))ЕТ Ргагпеюог)с все строки представлены массивами символов 1)п1сос1е РТР-16. Однако часто возникает необходимость взаимодействия с внешним миром, использующим какую-то другую форму кодирования, например, 1)ТР-8. Иногда даже взаимодействуя с другими сущностями. использующими 16-битные строки 1)п1собе, может случиться, что в них применяется порядок следования байтов, начиная со старшего, который противоположен принятому на платформе 1пге1 порядку следования, начиная с младшего байта. В среде .)))ЕТ Ргагпеюог)с решение этой задачи упрощается за счет использования класса Буяпеш.ТехС.Епсоб1по. В этом разделе не приводится детальное описание яуясеш.техс.епсобтпд.
За подробной информацией об этом классе обращайтесь к документации МЗР)с). Ниже приведен краткий пример преобразования строк между разными кодировками с применением объектов Епсобспо, обеспечиваемыми классом Яуягеш.ТехС.Епсобапд. пя1по Яуясепы пя1по Яуягеш.тенг) рпЬ11с с1яяв ЕпггуРоппС ягвгтс чо1б Мвяп() ( ЯСГТПБ 1ЕСПГСОбЕБСГ = "ЗЛОРОВО!"; Епсоб1по 1епптсобе = Епсоб1пч.пп1собег Епсобвпд Ьепптсобе = Епсобтпу.ВТБЕпбтапБптсобе; Епсоб1ПВ пСГБ = Епсобгпо.ВТЕБ) Ьуге[) 1епптсобеВугея = 1есп1собе.сеСВугея(1еппссобеБСг)) Ъуге[) ЬесптсобеВугея = Епсобтпд,СопчегС( 1есптсобе, Ьесп1собе, 1еспгсобеВугея)п ЬуСе[) пСГБВугея = Епсоб1пБ.Сопчегг( 1епптсобе, пСГБ, 1епптсобеВусея сопяо1е.вг1сеьгпе( "исходная строкас (0)1п", 1есптсобеБсг Сопяо1е.нг1Се11пе( "Байты Бп1собе, сначала младший:" Бгг1пВВп11бег яЬ = пен ЯСгтпдВс11бег(); Гогеасп( Ьуге Ь Тп 1еспбсобеВугея ) ( зЬ .Аррепс[( Ь ) .Аррепб(" : ") ) ) Сопво1е Нг1Сеьспе( "(0)ссп", ЯЬ.ТоЯСгтпд() ); Сопяо1е.игтгеьтпе( "Байты Бп1собе, сначала старший:" яЬ = пен ЯггтпдВп11бег()) Гогеасп( ЬуСе Ь 1п Ьепп1собеВугея ) [ яЬ.Аррепб( Ь ).Аррепб(" ) Сопяо1е.нг1Сегтпе( "(0)1п", яЬ.ТоБСгтпд() )) Сопяо1е.нг1Сеьтпе( "Байты БТЕс" яЬ = пен БггтпдВп11бег(); Гогеасп( Ьуге Ь Тп пСГБВугея яЬ.Аррепб( Ь ).Аррепс)(" Сопяо1е.кг1Сещпе( яЬ.Тозггапд() ) ) Работа со строками 237 В коде примера сначала создается яузсеп.
ясг1пд с некоторым текстом на русском языке. Как упоминалось ранее, строка содержит строку Уп1собе, но в каком порядке идут байты символа — сначала старший или сначала младший? Ответ зависит от платформы, на которой запускается код. В системе 1п1е1 обычно сначала идет младший байт. Однако поскольку доступ к лежащему в основе байтовому представлению строк отсутствует, так как оно скрыто, это не имеет значения. Для получения байтов строки используется один из объектов епсобъпд, которые получается от яузгею. техт. епсоб1пд. В рассмотренном примере получаются локальные ссылки на объекты Епсос11пд для обработки строк Пи!себе с первым старшим байтом, первым младшим байтом и 11Тг-8. После этого их можно использовать для преобразования строк в требуемое байтовое представление.
Как видите, получены три представления одной и той же строки, и затем их последовательности байтов отправляются в стандартный вывод. Поскольку в данном примере в тексте применяется кириллический алфавит, байтовый массив !АСТР-8 получается длиннее, чем байтовый массив Уп1сог1е. Если бы исходная строка базировалась на латинском наборе символов, то массив ТЛТ-8 получился бы короче, чем массив Ттп1сос1е — обычно наполовину. Птавное, что следует запомнить: никогда не нужно строить предположения относительно требований по хранению для любой из кодировок. Чтобы узнать, сколько места потребуется для хранения кодированной строки, вызовите метод Епсоб1пд. ЯесВугеСоцпс.
Внимание! Никогда не стройте предположений относительно внутреннего формата представления строк в ССН. Нет никаких гарантий того, что оно не будет варьироваться от одной платформы к другой. Будет весьма неприятно, если вдруг код сделает какое-то предположение, отталкиваясь от платформы !п1е1, а затем даст сбой при запуске на платформе Яцп с функционирующей средой Моно ССЙ. Однажды в М!сгозотт могут даже решить перенести УУ!пботтв на другую платформу — точно так же, как в Арр!е приняли решение об использовании процессоров !п1е!. То, что объект Епсоо1пд.
ипъсобе не называется, скажем, Епсоб1пд. ь1сс1еепжапоп1соое, не означает, что С18 представляет внутри себя все строковые данные в формате с первым младшим байтои. На самом деле стандарт СВ ясно указывает, что все типы данных, занимающие более одного байта в памяти, представлены в порядке, зависящем от целевой платформы. Обычно возникает необходимость двигаться в противоположном направлении и выполнять преобразование массива байтов из внешнего мира в строку, с которой система сможет легко работать. Например, стек протоколов В!не!потуг использует кодировку Уптсог1е с первым старшим байтом для передачи строковых данных. Чтобы преобразовать байты в я уз Сепг.














