Марк Лутц - Изучаем Python, Четвертое издание (1184811), страница 61
Текст из файла (страница 61)
Тем не менее, несмотря на это ограничение,строковые методы иногда оказываются эффективнее, чем функции модуля re.Оригинальный модуль string (был убран в версии 3.0)История развития строковых методов достаточно запутана. В течение первого десятилетия существования Python в состав стандартной библиотеки входил модуль string, который содержал функции, во многом напоминающие современные строковые методы. В ответ на требования пользователей в версииPython 2.0 эти функции были преобразованы в методы строковых объектов.Однако, из-за большого объема программного кода, уже написанного к томувремени, оригинальный модуль string был сохранен для обеспечения обратнойсовместимости.Ныне вы должны использовать не оригинальный модуль string, а применятьтолько строковые методы. Фактически, как предполагается, оригинальныестроковые функции, соответствующие методам, были полностью убраны из состава стандартной библиотеки языка Python в версии 3.0.
Однако, посколькуиспользование модуля string еще можно встретить в старом программном коде,мы коротко рассмотрим его.В версии Python 2.6 по-прежнему существует два способа использования расширенных операций над строками: посредством вызова методов и вызовомфункций модуля string, которым в качестве аргумента передается объект строки. Например, допустим, что переменная X ссылается на объект строки, тогдавызов метода объекта будет выглядеть следующим образом:X.method(arguments)что эквивалентно вызову аналогичной функции из модуля string (представим,что этот модуль уже был импортирован):string.method(X, arguments)В следующем примере демонстрируется порядок использования метода:>>> S = ‘a+b+c+’>>> x = S.replace(‘+’, ‘spam’)>>> x‘aspambspamcspam’Чтобы выполнить ту же самую операцию с помощью модуля string, необходимоимпортировать модуль (по крайней мере, один раз) и передать функции объект:>>> import string>>> y = string.replace(S, ‘+’, ‘spam’)>>> y‘aspambspamcspam’Поскольку подход, основанный на применении модуля, был стандартом на протяжении многих лет, а строки являются одним из центральных компонентовбольшинства программ, при анализе существующих программ вам навернякавстретятся оба варианта работы со строками.234Глава 7.
СтрокиИ тем не менее, при создании новых программ вместо функций устаревшегомодуля вы должны использовать строковые методы. Для этого есть и другиесерьезные основания, помимо того, что многие функции модуля string былиисключены из состава стандартной библиотеки в версии Python���������������������������������������� 3.0. Одна из таких причин – схема вызова модуля требует от вас импортировать модуль string(при использовании строковых методов ничего импортировать не нужно).Другая причина заключается в том, что при использовании функций модуляс клавиатуры приходится вводить на несколько символов больше (когда модуль загружается с использованием инструкции import, а не from).
И наконец,функции модуля выполняются несколько медленнее, чем методы (в настоящеевремя функции модуля отображаются на вызовы методов, в результате чегопроизводятся дополнительные вызовы).Оригинальный модуль string без функций, эквивалентных строковым методам, остался в составе Python 3.0, потому что в нем присутствуют дополнительные средства работы со строками, включая предопределенные строковыеконстанты и систему шаблонных объектов (которая не описывается в этой книге из-за большой сложности – за дополнительной информацией обращайтеськ руководству по библиотеке языка Python).
Если вы хотите предусмотретьвозможность переноса своих программ, написанных для версии 2.6, на версиюPython 3.0, вы должны смотреть на базовые строковые функции как на призраки прошлого.Выражения форматирования строкУже с помощью представленных к этому моменту строковых методов и операций над последовательностями можно сделать немало, но, кроме того, в арсенале языка Python имеются дополнительные возможности обработки строк –операции форматирования строк позволяют выполнять подстановку в строкизначений различных типов за одно действие.
Про операции форматированиянельзя сказать, что они в каких-то случаях предоставляют единственно возможный способ решения каких-либо задач, но их удобно использовать, например когда необходимо отформатировать текст для вывода на экран. Благодарябогатству новых идей, появляющихся в мире языка �����������������������Python�����������������, операции форматирования строк могут выполняться двумя способами:Выражения форматирования строкПервоначально существовавший способ – он основан на модели функцииprintf из языка C и широко используется в существующих программах.Метод форматирования строкБолее новый способ, появившийся в версиях ������������������������������Python������������������������ 2.6 и 3.0, – более уникальный для языка Python, возможности которого в значительной степенипересекаются с возможностями выражений форматирования.Из-за новизны метода форматирования существует вероятность, что некоторыеиз его особенностей со временем будут переведены в разряд нерекомендуемых.Выражения форматирования, скорее всего, станут нерекомендуемыми в болеепоздних выпусках Python, хотя это во многом будет зависеть от предпочтенийактивных программистов на языке Python.
Но так как оба способа являютсялишь вариациями на одну и ту же тему, то в настоящее время можно смело использовать любой из них. Выражения форматирования строк появились в языке значительно раньше, поэтому мы начнем с них.Выражения форматирования строк 235В языке Python имеется двухместный оператор %, предназначенный для работы со строками (вы можете вспомнить, что для чисел он является операторомделения по модулю, или получения остатка от деления). Когда этот операторприменяется к строкам, он обеспечивает простой способ форматирования значений, согласно заданной строке формата. Проще говоря, оператор % обеспечивает возможность компактной записи программного кода, выполняющегомножественную подстановку строк, позволяя избавиться от необходимостиконструирования отдельных фрагментов строки по отдельности с последующим их объединением.Чтобы отформатировать строку, требуется:1.
Слева от оператора % указать строку формата, содержащую один или болееспецификаторов формата, каждый из которых начинается с символа % (например, %d).2. Справа от оператора % указать объект (или объекты, в виде кортежа), значение которого должно быть подставлено на место спецификатора (или спецификаторов) в левой части выражения.Например, в примере форматирования строки, который приводился ранеев этой главе, мы видели, что целое число 1 замещает спецификатор %d в строкеформата, расположенной в левой части выражения, а строка “dead” замещаетспецификатор %s. В результате получается новая строка, которая содержит этидве подстановки.>>> ‘That is %d %s bird!’ % (1, ‘dead’) # Выражение форматированияThat is 1 dead bird!Строго говоря, выражения форматирования строк не являются абсолютнонеобходимыми – все, что можно сделать с их помощью, точно так же можносделать с помощью серии преобразований и операций конкатенации. Однакооперация форматирования позволяет объединить множество шагов в однойинструкции.
Мощные возможности этой операции заслуживают того, чтобырассмотреть еще несколько примеров:>>> exclamation = “Ni”>>> “The knights who say %s!” % exclamation‘The knights who say Ni!’>>> “%d %s %d you” % (1, ‘spam’, 4)‘1 spam 4 you’>>> “%s -- %s -- %s” % (42, 3.14159, [1, 2, 3])‘42 -- 3.14159 -- [1, 2, 3]’В первом примере строка “Ni” внедряется в целевую строку слева, замещаяспецификатор %s. Во втором примере в целевую строку вставляются три значения. Обратите внимание: когда вставляется более одного значения, в правойчасти выражения их необходимо сгруппировать с помощью круглых скобок(то есть создать из них кортеж). Оператор форматирования % ожидает получитьсправа либо один объект, либо кортеж объектов.В третьем примере также вставляются три значения – целое число, вещественное число и объект списка, но обратите внимание, что в левой части выражениявсем значениям соответствует спецификатор %s, который соответствует операции преобразования в строку.
Объекты любого типа могут быть преобразованыв строку (это происходит, например, при выводе на экран), поэтому для любого236Глава 7. Строкиобъекта может быть указан спецификатор %s. Вследствие этого вам не придется выполнять специальное форматирование, в большинстве случаев вам достаточно будет знать только о существовании спецификатора %s.Имейте в виду, что выражение форматирования всегда создает новую строку,а не изменяет строку, расположенную в левой части. Поскольку строки являются неизменяемыми, этот оператор вынужден работать именно таким способом.
Как уже говорилось ранее, если вам требуется сохранить полученныйрезультат, присвойте его переменной.Дополнительные возможности форматирования строкиДля реализации более сложного форматирования в выражениях форматирования можно использовать любые спецификаторы формата, представленныев табл. 7.4. Большинство из них окажутся знакомы программистам, использовавшим язык C, потому что операция форматирования строк в языке Pythonподдерживает все наиболее типичные спецификаторы формата, которые допускается использовать в функции printf языка C (в отличие от которой выражение в языке Python возвращает результат, а не выводит его на экран). Некоторые спецификаторы из табл. 7.4 предоставляют альтернативные способы форматирования данных одного и того же типа, например %e, %f и %g обеспечиваютальтернативные способы форматирования вещественных чисел.Таблица 7.4.
Спецификаторы форматаСпецификаторНазначениеsСтрока (для объекта любого другого типа будет выполненвызов функции str(X), чтобы получить строковое представление объекта)rs, но использует функцию repr, а не strcСимволdДесятичное (целое) числоiЦелое числоuТо же, что и d (устарел: больше не является представлением целого без знака)oВосьмеричное целое числоxШестнадцатеричное целое числоXx, но шестнадцатеричные цифры возвращаются в верхнемрегистреeВещественное число в экспоненциальной формеEe, но алфавитные символы возвращаются в верхнемрегистреfВещественное число в десятичном представленииFВещественное число в десятичном представленииgВещественное число e или fВыражения форматирования строк СпецификаторНазначениеGВещественное число E или а%Символ %237Фактически спецификаторы формата в левой части выражения поддерживают целый набор операций преобразования с достаточно сложным собственнымсинтаксисом.