М. Лутц - Изучаем Python (4-е издание)- 2011 (1126907), страница 17
Текст из файла (страница 17)
Вы вводите программный код в текстовый файл, а затем запускаете этот файл с помощью интерпретатора. Однако, когда вы говорите интерпретатору «вперед», за кулисами много чего происходит. Хотя знание внутреннего устройства Python и не требуется для овладения навыками программирования на этом языке, тем не менее, понимание того, как производится выполнение программ, поможет вам увидеть всю картину в целом.Когда интерпретатор Python получает от вас команду запустить сценарий, онвыполняет несколько промежуточных действий, прежде чем ваш программный код начнет «скрипеть колесами».
В частности, сценарий сначала будетскомпилирован в нечто под названием «байт-код», а затем передан механизму,известному под названием «виртуальная машина».Выполнение программы67Компиляция в байт-кодКогда вы запускаете программу, практически незаметно для вас Python сначала компилирует ваш исходный текст (инструкции в файле) в формат, известный под названием байт-код. Компиляция – это просто этап переводапрограммы, а байт-код – это низкоуровневое, платформонезависимое представление исходного текста программы.
Интерпретатор Python транслируеткаждую исходную инструкцию в группы инструкций байт-кода, разбивая еена отдельные составляющие. Такая трансляция в байт-код производится дляповышения скорости – байт-код выполняется намного быстрее, чем исходныеинструкции в текстовом файле.В предыдущем абзаце вы могли заметить фразу – практически незаметно длявас. Если интерпретатор Python на вашем компьютере обладает правом записи, он будет сохранять байт-код вашей программы в виде файла с расширением.pyc (.pyc – это компилированный исходный файл .py). Вы будете обнаруживатьэти файлы после запуска программ по соседству с файлами, содержащими исходные тексты (то есть в том же каталоге).Интерпретатор сохраняет байт-код для ускорения запуска программ.
В следующий раз, когда вы попробуете запустить свою программу, Python загрузитфайл .pyc и минует этап компиляции – при условии, что исходный текст программы не изменялся с момента последней компиляции. Чтобы определить,необходимо ли выполнять перекомпиляцию, Python автоматически сравнитвремя последнего изменения файла с исходным текстом и файла с байт-кодом.Если исходный текст сохранялся на диск после компиляции, при следующемего запуске интерпретатор автоматически выполнит повторную компиляциюпрограммы.Если интерпретатор окажется не в состоянии записать файл с байт-кодом надиск, программа от этого не пострадает, просто байт-код будет сгенерированв памяти и исчезнет по завершении программы.1 Однако поскольку файлы .pycповышают скорость запуска программы, вам может потребоваться иметь возможность сохранять их, особенно для больших программ.
Кроме того, файлыс байт-кодом – это еще один из способов распространения программ на языкеPython. Интерпретатор запустит файл .pyc, даже если нет оригинальных файлов с исходными текстами. (В разделе «Фиксированные двоичные файлы» описывается еще один способ распространения программ).Виртуальная машина Python (PVM)Как только программа будет скомпилирована в байт-код (или байт-код будетзагружен из существующих файлов .pyc), он передается механизму под названием виртуальная машина Python (PVM – для любителей аббревиатур).
Аббревиатура PVM выглядит более внушительно, чем то, что за ней стоит на самомделе, – это не отдельная программа, которую требуется устанавливать. Фактически PVM – это просто большой цикл, который выполняет перебор инструк1Строго говоря, байт-код сохраняется только для импортируемых файлов, но не дляфайла самой программы. Об импорте мы поговорим в главе 3 и снова вернемся к немув части V. Байт-код также никогда не сохраняется для инструкций, введенных в интерактивном режиме, который описывается в главе 3.68Глава 2. Как Python запускает программыций в байт-коде, одну за одной, и выполняет соответствующие им операции.PVM – это механизм времени выполнения, она всегда присутствует в составесистемы Python и это тот самый программный компонент, который выполняетваши сценарии.
Формально – это последняя составляющая того, что называют«интерпретатором Python».На рис. 2.2 показана последовательность действий, которая описывается здесь.Не забывайте, что все эти сложности преднамеренно спрятаны от программистов. Компиляция в байт-код производится автоматически, а PVM – это всеголишь часть системы Python, которую вы установили на свой компьютер. Повторю еще раз, что программисты просто создают программный код на языкеPython и запускают файлы с инструкциями.Исходный текстm.pyВыполнениеm.pycPVMРис. 2.2. Традиционная модель выполнения программ на языке Python:исходный текст, который вводится программистом, транслируется в байткод, который затем исполняется виртуальной машиной Python.
Исходныйтекст автоматически компилируется и затем интерпретируетсяПроизводительностьЧитатели, имеющие опыт работы с компилирующими языками программирования, такими как C и C++, могут заметить несколько отличий в модели выполнения Python. Первое, что бросается в глаза, – это отсутствие этапа сборки,или вызова утилиты «make»: программный код может запускаться сразу же,как только будет написан. Второе отличие: байт-код не является двоичным машинным кодом (например, инструкциями для микропроцессора Intel). Байткод – это внутреннее представление программ на языке Python.По этой причине программный код на языке Python не может выполнятьсятак же быстро, как программный код на языке C или C++, о чем уже говорилось в главе 1.
Обход инструкций выполняет виртуальная машина, а не микропроцессор, и чтобы выполнить байт-код, необходима дополнительная интерпретация, инструкции которого требуют на выполнение больше времени,чем машинные инструкции микропроцессора. С другой стороны, в отличие отклассических интерпретаторов, здесь присутствует дополнительный этап компиляции – интерпретатору не требуется всякий раз снова и снова анализировать инструкции исходного текста. В результате Python способен обеспечитьскорость выполнения где-то между традиционными компилирующими и традиционными интерпретирующими языками программирования. Подробнеео проблеме производительности рассказывается в главе 1.Разновидности модели выполнения69Скорость разработкиС другой стороны, в модели выполнения Python отсутствуют различия междусредой разработки и средой выполнения.
То есть системы, которые компилируют и выполняют исходный текст, – это суть одна и та же система. Для читателей, имеющих опыт работы с традиционными компилирующими языками,это обстоятельство может иметь некоторое значение, но в Python компиляторвсегда присутствует во время выполнения и является частью механизма, выполняющего программы.Это существенно увеличивает скорость разработки. Не нужно всякий раз выполнять компиляцию и связывание программ прежде чем запустить их, – выпросто вводите исходный текст и запускаете его. Это также придает языку некоторый динамизм – вполне возможно, а нередко и удобно, когда программына языке Python создаются и выполняются другими программами Python вовремя выполнения.
Например, встроенные инструкции eval и exec принимаюти выполняют строки, содержащие программный код на языке Pyt�����������h����������on. Благодаря такой возможности Python может использоваться для настройки продуктов – программный код Python может изменяться «на лету», а пользователимогут изменять части системы, написанные на языке Python, без необходимости перекомпилировать систему целиком.Если смотреть с более фундаментальных позиций, то все, что имеется в Python,работает на этапе времени выполнения – здесь полностью отсутствует этаппредварительной компиляции, все что необходимо, производится во времявыполнения программы.
Сюда относятся даже такие операции, как созданиефункций и классов и связывание модулей. Эти события в более статичных языках происходят перед выполнением, но в программах на языке Python происходят во время выполнения. В результате процесс программирования приобретает больший динамизм, чем тот, к которому привыкли некоторые читатели.Разновидности модели выполненияПрежде чем двинуться дальше, я должен заметить, что внутренний поток выполнения, описанный в предыдущем разделе, отражает современную стандартную реализацию интерпретатора Python, которая в действительности неявляется обязательным требованием самого языка Python. Вследствие этогомодель выполнения склонна изменяться с течением времени.
Фактически ужесуществуют системы, которые несколько меняют картину, представленную нарис. 2.2. Давайте потратим несколько минут, чтобы ознакомиться с наиболеезаметными изменениями.Альтернативные реализации PythonВ то время когда я писал эту книгу, существовали три основные альтернативные реализации языка Python – CPython, Jython и IronPython, а также несколько второстепенных реализаций, таких как Stackless Python.
В двух словах: CPython – это стандартная реализация, а все остальные создавались дляспецифических целей и задач. Все они реализуют один и тот же язык Python,но выполняют программы немного по-разному.70Глава 2. Как Python запускает программыCPythonОригинальная и стандартная реализация языка Python обычно называетсяCPython, особенно когда необходимо подчеркнуть ее отличие от двух другихальтернатив. Это название происходит из того факта, что реализация написанана переносимом языке ANSI C. Это тот самый Python, который вы загружаетес сайта http://www.python.org, получаете в составе дистрибутива ActivePythonи который присутствует в большинстве систем Linux и Mac OS X. Если вы обнаружили у себя предварительно установленную версию Python, то более чемвероятно это будет CPython, – при условии, что ваша компания не используеткакую-то специфическую версию.Если вы не предполагаете создавать приложения на Java или для платформы.NET, возможно, вам следует отдать предпочтение стандартной реализацииCPython.