М. Лутц - Изучаем Python (4-е издание)- 2011 (1126907), страница 101
Текст из файла (страница 101)
Так как этот синтаксис может применяться в инструкциях присваивания, его также можно использовать в циклах for.Вернемся к форме присваивания кортежей, рассматривавшейся в предыдущем разделе. В каждой итерации кортеж значений присваивается кортежупеременных, точно так же, как в обычной инструкции присваивания:404Глава 13. Циклы while и for>>>>>>(1,>>>......1 24 5a, b, c = (1, 2, 3)# Присваивание кортежаa, b, c2, 3)for (a, b, c) in [(1, 2, 3), (4, 5, 6)]: # Используется в цикле forprint(a, b, c)36Благодаря тому, что в ��������������������������������������������������Python�������������������������������������������� 3.0 появилась возможность выполнить присваивание последовательности множеству переменных, где имени со звездочкойможет быть присвоено сразу множество элементов, мы можем использовать тотже прием для извлечения фрагментов вложенных последовательностей в цикле for:>>> a, *b, c = (1, 2, 3, 4)>>> a, b, c(1, [2, 3], 4)# Расширенная инструкция# распаковывания последовательностей>>> for (a, *b, c) in [(1, 2, 3, 4), (5, 6, 7, 8)]:...print(a, b, c)...1 [2, 3] 45 [6, 7] 8На практике этот подход можно использовать для выборки нескольких полейиз записей с данными, представленными в виде вложенных последовательностей.
В ��������������������������������������������������������������Python�������������������������������������������������������� 2.�����������������������������������������������������X����������������������������������������������������не поддерживается расширенная операция распаковывания последовательностей, однако того же эффекта можно добиться с помощьюоперации извлечения среза. Единственное отличие состоит в том, что операцияизвлечения среза возвращает результат, зависящий от типа исходной последовательности, тогда как расширенная операция распаковывания последовательностей всегда возвращает список:>>> for all in [(1, 2, 3, 4), (5, 6, 7, 8)]: # Извлечение среза в 2.6...a, b, c = all[0], all[1:3], all[3]...print(a, b, c)...1 (2, 3) 45 (6, 7) 8Подробнее об этой форме присваивания рассказывается в главе 11.Вложенные циклы forТеперь рассмотрим более сложный вариант цикла for.
Следующий пример иллюстрирует использование блока else и вложенный цикл for. Имея список объектов (items) и список ключей (tests), этот фрагмент пытается отыскать каждый ключ в списке объектов и сообщает о результатах поиска:>>> items = [“aaa”, 111, (4, 5), 2.01] #>>> tests = [(4, 5), 3.14]#>>>>>> for key in tests:#...for item in items:#...if item == key:#...print(key, “was found”)Множество объектовКлючи, которые требуется отыскатьДля всех ключейДля всех элементовПроверить совпадение405Циклы for...break...else:...print(key, “not found!”)...(4, 5) was found3.14 not found!Поскольку при обнаружении совпадения вложенная инструкция if вызываетинструкцию break, можно утверждать, что блок else будет выполняться тольков случае, когда поиск завершится неудачей.
Обратите внимание на вложениеинструкций. Если запустить этот фрагмент, одновременно будут выполнятьсядва цикла: внешний цикл будет выполнять обход списка ключей, а внутренний будет выполнять обход списка элементов в поисках каждого ключа. Уровень вложенности блока else имеет большое значение – он находится на уровнестроки заголовка внутреннего цикла for, поэтому он соответствует внутреннему циклу (не инструкции if и не внешнему циклу for).Примечательно, что этот пример можно упростить, если использовать оператор in для проверки вхождения ключа.
Поскольку оператор in неявно выполняет обход списка в поисках совпадения, он заменяет собой внутренний цикл:>>> for key in tests:...if key in items:...print(key, “was...else:...print(key, “not...(4, 5) was found3.14 not found!# Для всех ключей# Позволить интерпретатору отыскать совпадениеfound”)found!”)Вообще, ради компактности кода и скорости вычислений всегда правильнеебудет переложить на плечи интерпретатора как можно больше работы, как этосделано в данном примере.Следующий пример с помощью цикла for решает типичную задачу обработки данных – выборку одинаковых элементов из двух последовательностей (изстрок).
Это достаточно простая задача поиска пересечения двух множеств. После того как цикл for выполнится, переменная res будет ссылаться на список,содержащий все одинаковые элементы, обнаруженные в seq1 и seq2:>>> seq1 = “spam”>>> seq2 = “scam”>>>>>> res = []>>> for x in seq1:...if x in seq2:...res.append(x)...>>> res[‘s’, ‘a’, ‘m’]####Изначально список пустВыполнить обход первой последовательностиОбщий элемент?Добавить в конец результатаК сожалению, этот фрагмент работает только с двумя определенными переменными: seq1 и seq2. Было бы замечательно, если бы этот цикл можно былопривести к более универсальному виду, тогда его можно было бы использоватьмногократно. Эта простая идея ведет нас к функциям, теме следующей частикниги.406Глава 13.
Циклы while и forПридется держать в уме: сканирование файловЦиклы удобно использовать там, где надо повторно выполнять некоторыедействия или многократно обрабатывать данные. Файлы содержат множество символов и строк, поэтому они могут рассматриваться как одиниз типичных объектов применения циклов. Чтобы загрузить содержимоефайла в строку одной инструкцией, достаточно вызвать метод read:file = open(‘test.txt’, ‘r’) # Прочитать содержимое файла в строкуprint(file.read())Но для загрузки файла по частям обычно используется либо цикл while,завершающийся инструкцией break по достижении конца файла, либоцикл for. Чтобы выполнить посимвольное чтение, достаточно любого изследующих фрагментов:file = open(‘test.txt’)while True:char = file.read(1) # Читать по одному символуif not char: breakprint(char)for char in open(‘test.txt’).read():print(char)Тут цикл for выполняет обработку каждого отдельного символа, но загрузка содержимого файла в память производится однократно.
Чтениестроками или блоками циклом while реализуется следующим образом:file = open(‘test.txt’)while True:line = file.readline() # Читать строку за строкойif not line: breakprint(line, end=’ ‘) # Прочитанная строка уже содержит символ \nfile = open(‘test.txt’, ‘rb’)while True:chunk = file.read(10) # Читать блоками по 10 байтовif not chunk: breakprint(chunk)Двоичные данные обычно читаются блоками определенного размера.Однако в случае текстовых данных построчное чтение с помощью циклаfor выглядит проще и работает быстрее:for line in open(‘test.txt’).readlines():print(line, end=’’)for line in open(‘test.txt’): # Использование итератора: лучший способprint(line, end=’’)# чтения текстаМетод файлов readlines загружает файл целиком в список строк, тогдакак при использовании итератора файла в каждой итерации загружается только одна строка (итераторы подробно рассматриваются в главе 14).
Подробности об использованных здесь функциях вы найдете в руководстве по стандартной библиотеке языка Python.Приемы программирования циклов407Последний пример представляет наиболее предпочтительный способ работы с текстовыми файлами. Он не только проще, но и способен работатьс файлами любого размера, так как не загружает файл целиком в память.
Версия на базе итератора может оказаться самой быстрой, но покаостается неясным вопрос, связанный с производительностью операцийввода-вывода в Python3.0.В коде, написанном для версии Python 2.X, можно встретить вызовфункции file вместо open, а также устаревший метод файлов xreadlines,который позволяет добиться того же эффекта, что с итератором файлов(он действует так же, как метод readlines, но не загружает файл в память целиком). Функция file и метод xreadlines были ликвидированыв Python 3.0 вследствие их избыточности. Вам также не следует использовать их, если вы пользуетесь Python 2.6, но они все еще могут вамвстретиться в старых программах.
Подробнее об операциях чтения файлов рассказывается в главе 36, где вы узнаете, что работа с текстовымии двоичными файлами в версии Python 3.0 имеет немного отличающийся смысл.Приемы программирования цикловЦикл for относится к категории счетных циклов. Обычно он выглядит прощеи работает быстрее, чем цикл while, поэтому его нужно рассматривать в самуюпервую очередь, когда возникает необходимость выполнить обход последовательности. Однако существуют ситуации, когда необходимо выполнять обходкаким-то особенным способом. Например, как быть, если необходимо выполнить обход каждого второго или каждого третьего элемента в списке или попутно выполнить изменения в списке? Или если необходимо реализовать параллельный обход более чем одной последовательности в одном и том же цикле for?Такие уникальные ситуации всегда можно запрограммировать с помощью цикла while и извлечения элементов вручную, но Python предоставляет две встроенные возможности, позволяющие управлять обходом элементов в цикле for:•• Встроенная функция range возвращает непрерывную последовательностьувеличивающихся целых чисел, которые можно использовать в качествеиндексов внутри цикла for.•• Встроенная функция zip возвращает список кортежей, составленных изэлементов входных списков с одинаковыми индексами, который может использоваться для одновременного обхода нескольких последовательностейв цикле for.Обычно циклы for выполняются быстрее, чем аналогичные им счетные циклына базе инструкции while, поэтому везде, где только возможно, лучше пользоваться такими инструментами, которые позволят использовать цикл for.
Рассмотрим каждый из этих встроенных инструментов по очереди.Счетные циклы: while и rangeФункция range является по-настоящему универсальным инструментом, который может использоваться в самых разных ситуациях. Чаще всего она ис-408Глава 13. Циклы while и forпользуется для генерации индексов в цикле for, но вы можете использовать еевезде, где необходимы списки целых чисел. В Python 3.0 функция range возвращает итератор, который генерирует элементы по требованию, поэтому, чтобыотобразить результаты ее работы, мы должны обернуть вызов этой функциив вызов функции list (подробнее об итераторах рассказывается в главе 14):>>> list(range(5)), list(range(2, 5)), list(range(0, 10, 2))([0, 1, 2, 3, 4], [2, 3, 4], [0, 2, 4, 6, 8])Функция range с одним аргументом генерирует список целых чисел в диапазоне от нуля до указанного в аргументе значения, не включая его.