А.В. Ахо, М.С. Лам, Р. Сети, Дж. Д. Ульман - Компиляторы - принципы, технологии и инструментарий (1114947), страница 7
Текст из файла (страница 7)
В главах, начиная с 8, детально рассматриваются методы машинно-зависимой и машинно-независимой оптимизации. 1.2.6 Генерация кода Генератор кода получает в качестве входных данных промежуточное представление исходной программы и отображает его в целевой язык. Если целевой язык Фаза машинно-независимой оптимизации кода пытается улучшить промежуточный код, чтобы затем получить более качественный целевой код. Обычно "более качественный", "лучший" означает "более быстрый", но могут применяться и другие критерии сравнения, как, например, "более короткий код" или "код, использующий меньшее количество ресурсов". Например, непосредственный алгоритм генерирует промежуточный код (1.3), используя по команде для каждого оператора в синтаксическом дереве, полученном на выходе семантического анализатора.
Простой алгоритм генерации промежуточного кода с последующим оптимизатором кода представляет собой рациональный способ генерации хорошего целевого кода. Оптимизатор может определить, что преобразование 60 из целого числа в число с плавающей точкой может быть выполнено единственный раз во время компиляции, так что операция 1пттоаоат может быть устранена путем замены целого числа 60 числом с плавающей точкой 60.0. Кроме того, ~3 используется только один раз — для передачи значения в Ы1, так что оптимизатор может преобразовать (1.3) в более короткую последовательность Глава 1.
Введение в компиляцию представляет собой машинный код, для каждой переменной, используемой программой, выбираются соответствующие регистры или ячейки памяти. Затем промежуточные команды транслируются в последовательности машинных команд, выполняющих те же действия. Ключевым моментом генерации кода является аккуратное распределение регистров для хранения переменных.
Например, при использовании регистров В1 и В2 промежуточный код (К4) может транслироваться в машинный код ЬВР В2, 163 МУАР В2, В2, №60.0 ЬВе В1, 1с12 АВВе В1, В1, В2 ЯТГ Ы1, В1 (1. 5) Первый операнд каждой команды определяет приемник. е в каждой команде говорит о том, что команда работает с числами с плавающей точкой. Код (1.5) загружает содержимое адреса 1с13 в регистр В2, затем умножает его на константу с плавающей точкой 60.0.
№ указывает, что 60.0 следует рассматривать как непосредственное значение. Третья команда помещает 1с(2 в регистр В1, а четвертая прибавляет к нему предварительно вычисленное и сохраненное в регистре В2 значение. Наконец, значение регистра В1 сохраняется в адресе тб1, так что код корректно реализует инструкцию присваивания (1.1).
Подробнее генерация кода рассматривается в главе 8. Это беглое знакомство с генерацией кода полностью игнорирует важный вопрос о распределении памяти для идентификаторов в исходной программе. Как вы увидите в главе 7, организация памяти во время выполнения программы зависит от компилируемого языка. Решения о распределении памяти принимаются либо в процессе генерации промежуточного кода, либо при генерации целевого кода. 1.2.7 Управление таблицей символов Важная функция компилятора состоит в том, чтобы записывать имена переменных в исходной программе и накапливать информацию о разных атрибутах каждого имени.
Эти атрибуты могут предоставлять информацию о выделенной памяти для данного имени, его типе, области видимости (где именно в программе может использоваться его значение) и, в случае имен процедур, такие сведения, как количество и типы их аргументов, метод передачи каждого аргумента (например, по значению или по ссылке), а также возвращаемый тип. Таблица символов представляет собой структуру данных, содержащую записи для каждого имени переменной, с полями для атрибутов имени.
Структура данных 41 1.2. Структура компилятора должна быть разработана таким образом, чтобы позволять компилятору быстро находить запись для каждого имени, а также быстро сохранять данные в записи и получать их из нее. Таблицы символов рассматриваются в главе 2. 1.2.8 Объединение фаз в проходы Фазы связаны с логической организацией компилятора. При реализации работа разных фаз может быть сгруппирована в проходы (разя), которые считывают входной файл и записывают выходной. Например, фазы анализа — лексический анализ, синтаксический анализ, семантический анализ и генерация промежуточного кода — могут быть объединены в один проход. Оптимизация кода может представлять собой необязательный проход. Затем может быть еще один проход, заключающийся в генерации кода для конкретной целевой машины.
Некоторые наборы компиляторов созданы вокруг тщательно разработанного промежуточного представления, которое позволяет начальной стадии для некоторого языка программирования взаимодействовать с заключительной стадией для определенной целевой машины.
При наличии таких наборов можно создавать компиляторы для различных исходных языков и одной целевой машины, комбинируя различные начальные стадии с заключительной стадией для этой целевой машины. Аналогично можно разрабатывать компиляторы для различных целевых машин, комбинируя начальную стадию с заключительными стадиями для различных целевых машин. 1.2.9 Инструментарий для создания компиляторов Разработчики компиляторов, как и разработчики любого другого программного обеспечения, могут с успехом использовать современные среды разработки программного обеспечения, содержащие такие инструменты, как редакторы языков, отладчики, средства контроля версий, профайлеры, средства тестирования и т.п.
В дополнение к этим средствам обшего назначения может использоваться ряд более специализированных инструментов, созданных для помощи в реализации различных фаз компилятора. Эти инструменты используют собственные специализированные языки для описания и реализации отдельных компонентов, и многие из них основаны на весьма сложных алгоритмах. Наиболее успешными являются те инструменты, которые скрывают детали алгоритма генерации и создают компоненты, легко интегрируемые в компилятор. К широко используемым инструментам для создания компиляторов относятся следующие.
1. Генераторы синшаксических анализаторов, которые автоматически создают синтаксические анализаторы на основе грамматического описания языка программирования. 42 Глава 1. Введение в компиляцию 2. Генераторы сканеров, которые создают лексические анализаторы иа основе описания токеиов языка с использованием регулярных выражений. 3.
Средства синтаксически управляемой трансляиии, которые создают наборы подпрограмм для обхода синтаксического дерева и генерации промежуточного кода. 4. Генераторы генераторов кода, которые создают генераторы кода иа основе набора правил трансляции каждой операции промежуточного языка в машинный язык для целевой машины. 5. Средства работы с потоком данных, которые облегчают сбор информации о передаче значений от одной части программы ко всем другим. Анализ потоков данных представляет собой ключевую часть оптимизации кода.
6. Наборы для построения компиляторов, которые представляют собой интегрированные множества подпрограмм для построения разных фаз компиляторов. В этой книге будут описаны многие из перечисленных инструментов. 1.3 Эволюция языков программирования Первые ЭВМ появились в 1940-х годах и программировались исключительно иа машинных языках путем последовательностей нулей и единиц, которые явно указывали компьютеру, какие операции и в каком порядке должны быть выполнены. Сами операции были очень низкоуровневыми: переместить данные из одной ячейки памяти в другую, сложить содержимое двух регистров, сравнить два значения и т.д.
Надо отметить, что такое программирование было очень медленным, утомительным и подверженным ошибкам. Однажды написанную программу было очень трудно понять и модифицировать. 1.3.1 Переход к языкам высокого уровня Первым шагом в создании более дружественных языков программирования была разработка мнемонических ассемблерных языков в начале 1950-х годов. Изначально команды ассемблера являлись всего лишь мнемоническими представлеииями машинных команд. Позже в языки ассемблера были введены макросы, так что программист мог определять параметризованные сокращения для часто использующихся последовательностей машинных команд. Большим шагом к высокоуровневым языкам программирования стала разработка во второй половине 1950-х годов языка программирования гогггап — для 1.3.
Эволюция языков программирования 43 научных вычислений, СоЬо1 — для обработки бизнес-данных и 1лзр — для символьных вычислений. Философия, стоящая за этими языками, заключается в создании высокоуровневой системы обозначений, облегчающей программисту написание программ для численных вычислений, бизнес-приложений и символьных программ. Эти языки были столь успешны, что применяются и сегодня.
В последующие десятилетия было создано множество языков программирования с новыми возможностями, которые делали написание программ более простым, естественным и надежным. Позже в этой главе мы рассмотрим некоторые ключевые возможности многих современных языков программирования. В настоящее время существуют тысячи языков программирования. Их можно классифицировать различными способами. Один из способов классификации— по поколениям. Языки первого поколения — это машинные языки; языки второго поколения — языки ассемблера, а к языкам третьего поколения относятся высокоуровневые языки программирования, такие как Рогпап, СоЬо!, Ь1зр, С, С++, С№ и зача.