Марк Лутц - Изучаем Python, Четвертое издание (1184811), страница 102
Текст из файла (страница 102)
Подробности об использованных здесь функциях вы найдете в руководстве по стандартной библиотеке языка Python.Приемы программирования циклов407Последний пример представляет наиболее предпочтительный способ работы с текстовыми файлами. Он не только проще, но и способен работатьс файлами любого размера, так как не загружает файл целиком в память. Версия на базе итератора может оказаться самой быстрой, но покаостается неясным вопрос, связанный с производительностью операцийввода-вывода в Python3.0.В коде, написанном для версии Python 2.X, можно встретить вызовфункции file вместо open, а также устаревший метод файлов xreadlines,который позволяет добиться того же эффекта, что с итератором файлов(он действует так же, как метод readlines, но не загружает файл в память целиком).
Функция file и метод xreadlines были ликвидированыв Python 3.0 вследствие их избыточности. Вам также не следует использовать их, если вы пользуетесь Python 2.6, но они все еще могут вамвстретиться в старых программах. Подробнее об операциях чтения файлов рассказывается в главе 36, где вы узнаете, что работа с текстовымии двоичными файлами в версии Python 3.0 имеет немного отличающийся смысл.Приемы программирования цикловЦикл for относится к категории счетных циклов. Обычно он выглядит прощеи работает быстрее, чем цикл while, поэтому его нужно рассматривать в самуюпервую очередь, когда возникает необходимость выполнить обход последовательности.
Однако существуют ситуации, когда необходимо выполнять обходкаким-то особенным способом. Например, как быть, если необходимо выполнить обход каждого второго или каждого третьего элемента в списке или попутно выполнить изменения в списке? Или если необходимо реализовать параллельный обход более чем одной последовательности в одном и том же цикле for?Такие уникальные ситуации всегда можно запрограммировать с помощью цикла while и извлечения элементов вручную, но Python предоставляет две встроенные возможности, позволяющие управлять обходом элементов в цикле for:•• Встроенная функция range возвращает непрерывную последовательностьувеличивающихся целых чисел, которые можно использовать в качествеиндексов внутри цикла for.•• Встроенная функция zip возвращает список кортежей, составленных изэлементов входных списков с одинаковыми индексами, который может использоваться для одновременного обхода нескольких последовательностейв цикле for.Обычно циклы for выполняются быстрее, чем аналогичные им счетные циклына базе инструкции while, поэтому везде, где только возможно, лучше пользоваться такими инструментами, которые позволят использовать цикл for.
Рассмотрим каждый из этих встроенных инструментов по очереди.Счетные циклы: while и rangeФункция range является по-настоящему универсальным инструментом, который может использоваться в самых разных ситуациях. Чаще всего она ис-408Глава 13. Циклы while и forпользуется для генерации индексов в цикле for, но вы можете использовать еевезде, где необходимы списки целых чисел. В Python 3.0 функция range возвращает итератор, который генерирует элементы по требованию, поэтому, чтобыотобразить результаты ее работы, мы должны обернуть вызов этой функциив вызов функции list (подробнее об итераторах рассказывается в главе 14):>>> list(range(5)), list(range(2, 5)), list(range(0, 10, 2))([0, 1, 2, 3, 4], [2, 3, 4], [0, 2, 4, 6, 8])Функция range с одним аргументом генерирует список целых чисел в диапазоне от нуля до указанного в аргументе значения, не включая его.
Если функциипередать два аргумента, первый будет рассматриваться как нижняя границадиапазона. Необязательный третий аргумент определяет шаг – в этом случаеинтерпретатор будет добавлять величину шага при вычислении каждого последующего значения (по умолчанию шаг равен 1). Существует возможностьвоспроизводить последовательности чисел в диапазоне отрицательных значений и в порядке убывания:>>> list(range(-5, 5))[-5, -4, -3, -2, -1, 0, 1, 2, 3, 4]>>> list(range(5, -5, -1))[5, 4, 3, 2, 1, 0, -1, -2, -3, -4]Такое использование функции range само по себе может быть полезным, однако чаще всего она используется в циклах for.
Прежде всего, она обеспечиваетпростой способ повторить действие определенное число раз. Например, чтобывывести три строки, можно использовать функцию range для создания соответствующего количества целых чисел – в версии 3.0 инструкция for автоматически извлекает все значения из итератора range, поэтому нам не потребовалосьиспользовать функцию list:>>> for i in range(3):...print(i, ‘Pythons’)...0 Pythons1 Pythons2 PythonsФункция range также часто используется для косвенного обхода последовательностей.
Самый простой и самый быстрый способ выполнить обход последовательности заключается в использовании цикла for, когда основную работувыполняет интерпретатор:>>> X = ‘spam’>>> for item in X: print(item, end=’ ‘) # Простейший цикл...s p a mПри таком использовании все задачи, касающиеся выполнения итераций, решаются внутренними механизмами цикла for. Если вам действительно необходимо явно управлять логикой доступа к элементам, можно воспользоватьсяциклом while:>>> i = 0>>> while i < len(X):...print(X[i], end=’ ‘)# Обход с помощью цикла whileПриемы программирования циклов409...i += 1...s p a mОднако управлять индексами вручную можно и в цикле for, если использовать функцию range для воспроизведения списка индексов.
Это многоэтапныйпроцесс, но он вполне пригоден для генерирования смещений, а не элементовс этим смещениями:>>> X‘spam’>>> len(X)# Длина строки4>>> list(range(len(X)))# Все допустимые смещенияв X[0, 1, 2, 3]>>>>>> for i in range(len(X)): print(X[i],end=’ ‘) # Извлечение элементов вручную...s p a mВ этом примере выполняется обход списка смещений в строке X, а не фактических элементов строки – нам пришлось внутри цикла обращаться к строке X,чтобы извлечь каждый элемент.Обход части последовательности: range и срезыПоследний пример в предыдущем разделе вполне работоспособен, но он выполняется гораздо медленнее, чем мог бы.
Кроме того, нам пришлось выполнитьбольше работы, чем требуется для решения такой задачи. Если вы не предъявляете особых требований к индексам, всегда лучше использовать простейшуюформу цикла for – используйте цикл for вместо while везде, где только возможно, и используйте функцию range в циклах for, только если это действительнонеобходимо. Следующее простое решение является лучшим:>>> for item in X: print(item) # Простейшая итерация...Однако прием, представленный в предшествующем примере, позволяет намуправлять порядком обхода последовательности, например пропускать элементы:>>> S = ‘abcdefghijk’>>> list(range(0, len(S), 2))[0, 2, 4, 6, 8, 10]>>> for i in range(0, len(S), 2): print(S[i], end=’ ‘)...a c e g i kЗдесь в цикле выбирается каждый второй элемент строки S при обходе списказначений, сгенерированных функцией range.
Чтобы извлечь каждый третийэлемент, достаточно изменить третий аргумент функции range, передав в немзначение 3, и так далее. Таким образом, функция range позволяет пропускатьэлементы, сохраняя при этом простоту цикла for.Однако, на сегодняшний день это, пожалуй, не самый лучший способ. Есливам действительно необходимо пропустить элементы последовательности,410Глава 13. Циклы while и forможно использовать расширенную форму операции извлечения среза с тремя пределами, представленную в главе 7, которая обеспечивает более простойпуть к достижению цели. Чтобы получить каждый второй символ из строки S,можно извлечь срез с шагом 2:>>> S = ‘abcdefghijk’>>> for c in S[::2]: print(c, end=’ ‘)...a c e g i kИзменение списков: rangeЕще одно место, где можно использовать комбинацию функции range и циклаfor, – это циклы, изменяющие список в процессе его обхода.
Например, предположим, что по тем или иным причинам нам необходимо прибавить 1 к каждому элементу списка. Можно попытаться использовать для этой цели простейшую форму цикла for, но скорее всего это не то, что нам нужно:>>>>>>......>>>[1,>>>6L = [1, 2, 3, 4, 5]for x in L:x += 1L2, 3, 4, 5]xТакое решение вообще ничего не дает – здесь изменяется переменная цикла x,а не список L. Причину такого поведения трудно заметить. Всякий раз, когдацикл выполняет очередную итерацию, переменная x ссылается на очередноецелое число, которое уже было извлечено из списка.
В первой итерации, например, переменная x является целым числом 1. На следующей итерации в переменную x будет записана ссылка на другой объект – целое число 2, но это никакне повлияет на список, откуда было взято число 1.Чтобы действительно изменить список во время его обхода, нам необходимо использовать операцию присваивания по индексу и изменить значения во всехпозициях, по которым осуществляется цикл. Необходимые нам индексы можно воспроизвести с помощью комбинации функций len/range:>>> L = [1, 2, 3, 4, 5]>>> for i in range(len(L)):...L[i] += 1...>>> L[2, 3, 4, 5, 6]# Прибавить 1 к каждому элементу в списке L# Или L[i] = L[i] + 1При такой реализации список изменяется в процессе обхода.
Простой цикл forx in L: такого результата дать не может, потому что в таком цикле выполняетсяобход фактических элементов, а не позиций в списке. А возможно ли создатьэквивалентный цикл while? Для этого нам потребуется приложить немногобольше усилий, и такой цикл наверняка будет работать медленнее:>>> i = 0>>> while i < len(L):...L[i] += 1Приемы программирования циклов411...i += 1...>>> L[3, 4, 5, 6, 7]В данном случае решение на базе функции range может быть неидеальным. Генератор списка в виде[x+1 for x in L]также даст желаемый результат, но первоначальный список при этом не изменится (мы могли бы присвоить получившийся новый список обратно переменной L, но это выражение не изменит другие ссылки на первоначальныйсписок).