Лутц М. - Изучаем Python (1077325), страница 55
Текст из файла (страница 55)
Теперь нам необходимо преобразовать эти строки в целые числа, чтобы можно было выполнять математические операции над ними: »> 1пт(раста[1)) № Преобразоват~ строку а целое число 44 »> повьете = [1пт(Р) тот Р [п рагтв) № преобразоват~ весь список Теперь нам необходимо выполнить обратные преобразования, чтобы получить действительные объекты языка Ру1йоп из строк в текстовом файле.
Интерпретатор Ру1)топ никогда автоматически не выполняет преобразование строк в числа или в объекты других типов, поэтому нам необходимо выполнить соответствующие преобразования, чтобы можно было использовать операции над этими объектами, такие как индексирование, сложение и т.
дл 249 Файлы »> пчеЬегв [43, 44, 45] Как мы уже знаем, функция 1пС преобразует строку цифр в объект целого числа, а генератор списков, представленный в главе 4, позволяет применить функцию ко всем элементам списка в одной инструкции (подробнее о генераторах списков читайте далее в этой книге). Обратите внимание: для удаления завершающего символа >п в конце последней подстроки не был использован метод гэсг[р, потому что спс и некоторые другие функции преобразования просто игнорируют символы- разделители, окружающие цифры.
Для преобразования списка и словаря в третьей строке файла воспользуемся встроенной функцией еча1, интерпретирущей строку как код на РуСйоп (формально строка содержит выражение на языке РуС]>оп): »> 11пе = Р.гевб11пв() »> 11пе "[1, 2, 3]Ж('а': 1, 'Ь': 2)1п" »> раггв = 11пе.вр11С('3') »> рагсв ['[П 2, 3]', "('а': 1, Ь: 2йп" ] »> ечацрвгсв[0]) [1, 2, 3] »> оЬ]еотв = [еча1(Р) Гог Р 1п рвггв] »> ОЬ]вота [[ 1, 2, 3], ('а': 1, 'Ь': 2)] а Раобить на строки по символу Я а Преобразовать отроку в объект О То ае саиое длл всех строк в списке Поскольку теперь все данные представляют собой список обычных объектов, а не строк, мы сможем применять к ним операции списков и словарей.
»> Р = орел('баса(1!в.схс', 'е') »> сврогС р1оа1е Сохранение объектов Русс)оп с помощью модуля ркЫе Функция еча1, использованная в предыдущем примере для преобразования строк в объекты, представляет собой мощный инструмент. И иногда даже слишком мощный. Функция еча1 без лишних вопросов выполнит любое выражение на языке РуС]соп, даже если в результате будут удалены все файлы в компьютере, если передать в выражение соответсгвующие права доступа! Если вам действительно необходимо извлекать объекты РуС)гоп из файлов, но вы не можете доверять источнику этих файлов, идеальным решением будет использование модуля р)сЬ1е, входящего в состав стандартной библиотеки РуС)гоп.
Модуль рсск1е позволяет сохранять в файлах практически любые объекты РуС)гоп без необходимости с нашей стороны выполнять какие-либо преобразования. Он напоминает суперуниверсальную утилиту форматирования и преобразования данных. Чтобы сохранить словарь в файле, например, мы передаем его непосредственно в функцию модуля р1сК1е: 250 Глава 9. Кортежи, файлы и все остальное а Модуль ртоа1е запишет а файл любой обьект »> рсоа1е.беар(Ь, Е) »> Е.о1оае() Чтобы потом прочитать словарь обратно, можно просто еще раз вос- пользоваться возможностями модуля рссМ1е: »> Е = орел('батат(1е.тхС') »> Е = рсоа1е.1оаб(Е) »> Е ('а': 1, 'Ь'; 2) а Загруаает любие обьекты из файла Нам удалось получить назад точно такой же объект словаря без необходимости вручную выполнять какие-либо преобразования. Модуль рссх1е выполняет то, что называется сериализацией объектов — преобразование объектов в строку и из строки байтов, не требуя от нас почти никаких действий.
В действительности, внутренняя реализация модуля рссх1е выполнила преобразование нашего словаря в строку, при этом незаметно для нас (и может выполнить еще более замысловатые преобразования при использовании модуля в других режимах): »> орел('батат()е.СхС').гоаб() "(орОСпз'а'Спр)1п11>,пзз'ь'~пр2Сп12Спз." Поскольку модуль рсск1е умеет реконструировать объекты из строкового представления, нам не требуется самим возиться с этим. Дополнительную информацию о модуле рсса1е вы найдете в руководстве по стандартной библиотеке языка РуС)соп или попробовав импортировать модуль в интерактивном сеансе и передав его имя функции Ье1р.
Когда будете заниматься исследованием этого модуля, обратите также внимание на модуль вле1уе — инструмент, который использует модуль ртсх1е для сохранения объектов РуС)топ в файлах с доступом по ключу, описание которых далеко выходит за рамки этой книги. Сохранение и интерпретация упакованных двоичных данных в файлах Прежде чем двинуться дальше, необходимо рассмотреть еще один аспект работы с файлами: в некоторых приложениях приходится иметь дело с упакованными двоичными данными, которые создаются, например, программами на языке С. Для их сохранения и восстановления можно воспользоваться модулем вс гесс из стандартной библиотеки языка РуСЬоп. В некотором смысле это совершенно другой инструмент преобразования данных, интерпретирующий строки в файлах как двоичные данные. Например, чтобы создать файл с упакованными двоичными данными, откройте его в режиме 'шЬ' (тюг1Се Ыпагу — запись двоичных данных) н передайте модулю вс гост строку форматирования и некоторый объект РуС)топ.
В следующем примере используется строка форматирования, которая определяет пакет данных как содержащий 4-байтовое целое число, 4-символьную строку и 2-байтовое целое число, причем все представлены в формате Ын-епс((ап — в порядке следования байтов лот стар- гб8 Файлы шего к младшему» (существуют также спецификаторы форматов, которые поддерживают наличие символов дополнения слева, числа с плавающей точкой и многие другие): »> е = орви('ба1а.ьзп', 'вь') в Открыть байл дли записи в двоичнои реииие »> аврог1 в1гис1 »> Ьу1ез = з1гисс.раси('>14зл', 7, 'зрвв', 8) з Создать пакет двоичных денных »> Ьу1ез '1х001х001х001х07зрав1х001х08' »> Е.вг11в(ЬУ1вз) й Записать строку байтов »> Е.с1озе() Интерпретатор Ру10оп создает строку двоичных данных, которая затем записывается в файл обычным способом (строка состоит из экранированных последовательностей, представляющих шестнадцатеричные значения).
Чтобы преобразовать эти значения в обычные объекты языка РуЬ)гоп, достаточно просто прочитать строку обратно и распаковать ее с использованием той же строки формата. Следующий фрагмент извлекает значения, преобразуя их в обычные объекты (целые числа и строка): »> Е = орвп('бата.ип', 'гЬ') »> ба1а = Е. гваб() Е Получить упакованные двоичные данные »> бв1а '1х001х001х001х07зрав1х001х08' »> чв1ивз = з1гис1.ипрвсх('>14зь', бв1а) а преобразовать е объекты »> ча1ивз (7, 'зрав', 8) Файлы с двоичными данными относятся к категории низкоуровневых средств, которые мы не будем рассматривать подробно.
За дополнительной информацией обращайтесь к руководству по библиотеке языка Руспоп или импортируйте модуль 81гис1 в интерактивном сеансе и передайте имя 81гисС функции ле1р. Обратите также внимание на то, что режимы доступа к двоичным файлам 'п0' и ' г0' могут использоваться для обработки простейших двоичных файлов, таких как изображения или аудиофайлы, без необходимости выполнять распаковку их содержимого. Другие инструменты для работы с файлами Как показано в табл. 9.2, существуют более сложные инструменты для работы с файлами, более того, существуют и другие инструменты, которые отсутствуют в таблице.
Например, функция зеех переустанавливает текущую позицию в файле (которая будет использована в следующей операции чтения или записи), функция 71изл принудительно выталкивает содержимое выходных буферов на диск (по умолчанию файлы всегда буферизуются) и т. д. Руководство по стандартной библиотеке и книги, упомянутые в предисловии, содержат полный перечень методов для работы с файлами. Чтобы кратко ознакомиться с ним, можно также воспользоваться функцией б1г или Ле1р в интерактивном сеансе, передав ей слово 711е 252 Глава 9. Кортежи, файлы н есе остальное (имя типа объектов). Дополнительные примеры работы с файлами вы найдете во врезке «Придется держать в уме: сканирование файлов» в главе 13.
В ней приводятся типичные примеры организации циклов для просмотра содержимого файлов и приводятся инструкции, которые мы еще не рассматривали. Следует также отметить, что функция орел и объекты файлов, которые она возвращает, являются в языке Ру1Ьоп основным интерфейсом к внешним файлам, однако в арсенале Ру1Ьоп существуют и другие инструменты, напоминающие файлы. Кроме того, имеется возможность взаимодействовать с дескрипторами файлов (целочисленные значения, которые поддерживаются такими низкоуровневыми средствами, как механизм блокировки Файлов), реализованная в модуле оэ; сокетами, каналами и файлами Р1РО (объекты, по своим характеристикам напоминающие файлы, используемые для синхронизации процессов или организации взаимодействий по сети); с файлами с доступом по ключу, известными как «хранилища» («еЬе)чеэ») и используемыми для хранения объектов языка Ру$Ьоп по ключу; и многими другими.
За получением дополнительной информации обо всех этих инструментах обращайтесь к специализированной литературе по языку РуФЬоп. Пересмотренный перечень категорий типов Таблица Я.З. Классификация объектов Изменяемый? Категория Ткп объектов Нет Числа Строки Списки Словари Кортежи Файлы Числа Последовательности Последовательности Отображения Последовательности Расширения Нет Да Да Нет Понятие пепримевимо Теперь, когда мы познакомились со всеми встроенными базовыми типами языка РуФЬоп в действии, давайте завершим наше турне рассмотрением некоторых общих для них свойств. В табл.
9.3 приводится классификация всех рассмотренных типов по категориям, которые были введены ранее. Над объектами одной категории могут выполняться одни и те же операции, например, над строками, списками и кортежами можно выполнять операции для последовательностей. Непосредственное изменение допускают только изменяемые объекты (списки и словари) — вы не сможете непосредственно изменить числа, строки и кортежи. Файлы только экспортируют методы, поэтому понятие изменяемости к ним по-настоящему неприменимо— хотя они могут изменяться при выполнении операции записи, но это не имеет никакого отношения к ограничениям типов в языке Ру»Ьоп.