Лекции по конструированию компиляторов. В.А. Серебряков (1134687), страница 17
Текст из файла (страница 17)
С каждым методом связан список операторов catch. Каждый оператор catch описывает диапазон инструкций, для которых он активен, тип исключения, который он обрабатывет, и с ним связан набор инструкций, которые его реализуют. При возникновении исключительной ситуации просматривается список операторов catch, чтобы установить соответствие. Исключительная ситуация соответствует оператору catch, если инструкция, вызавшая исключительную ситуацию, лежит в соответствующем диапазоне и исключительная ситуация принадлежит подтипу типа ситуации, которые обарабатывает оператор catch. Если соответствующий оператор catch найден, управление передается обработчику. Если нет, текущий стэк-фрейм удаляется, и и сключительная ситуация возбуждается вновь.
Порядок операторов catch в списке важен. Интерпретатор передают управление первому подходящему оператору catch.
7.5. Организация информации в генераторе кода
Чисто синтаксическое дерево несет только информацию о структуре программы. На самом деле в процессе генерации кода требуется также информация о переменных (например, их адреса), процедурах (также адреса, уровни), метках и т.д. Для представления этой информации возможны различные решения. Наиболее распространены два. 1) всю эту информацию можно хранить в таблицах генератора кода; 2) информация хранится в вершинах дерева с соответствующими указателями.
Рассмотрим, например, структуру таблиц, которые могут быть использованы в сочетании с Лидер-представлением. Поскольку Лидер-представление не содержит информации об адресах переменных, значит, эту информацию нужно формировать в процессе обработки объявлений и хранить в таблицах. Это касается и описаний массивов, записей и т.д. Кроме того, в таблицах также должна содержаться информация о процедурах (адреса, уровни, модули, в которых процедуры описаны, и т.д.). Таким образом структура таблиц может быть такой, как это изображено на рис. 7.9.
Т
аблица уровней Таблица описаний
процедур
Для типа:размер
Для переменной:указатель на
тип и адрес (смещение)
Для процедуры: адрес,...
.............................
Рис. 7.9
При входе в процедуру в таблице уровней процедур заводится новый вход - указатель на таблицу описаний. При выходе указатель восстанавливается на старое значение. Если промежуточное представление - дерево, то информация может храниться в вершинах самого дерева. Например, та же информация может быть представлена, как на рис. 7.10.
Раздел описаний
Описание Описание Раздел
типа переменной операторов
Рис. 7.10
7.6. Уровень промежуточного представления
Как видно из приведенных примеров, промежуточное представление программы может в различной степени быть близким либо к исходной программе, либо к машине. Например, промежуточное представление может содержать адреса переменных, и тогда оно уже не может быть перенесено на другую машину. С другой стороны, промежуточное представление может содержать раздел описаний программы, и тогда информацию об адресах можно извлечь из обработки описаний. В то же время ясно, что первое более эффективно, чем второе. Операторы управления в промежуточном представлении могут быть представлены в исходном виде (в виде операторов языка if, for, while и т.д.), а могут содержаться в виде переходов. В первом случае некоторая информация может быть извлечена из самой структуры (например, для оператора for - информация о переменной цикла, которую, может быть, разумно хранить на регистре, для оператора case - информация о таблице меток и т.д.). Во втором случае представление проще и унифицированней.
Некоторые формы промежуточного представления лучше годятся для различного рода оптимизаций (например, косвенные тройки - для перемещения кода), некоторые - хуже (например, префиксная запись для этого плохо подходит).
Глава 8. Генерация кода
Задача генератора кода - построение эквивалентной машинной программы по программе на входном языке. Обычно в качестве входного для генератора кода служит некоторое промежуточное представление программы. В свою очередь, генерация кода состоит из ряда специфических, относительно независимых подзадач: распределение памяти (в частности, распределение регистров), выбор команд, генерация объектного (или загрузочного) модуля. Конечно, независимость этих подзадач относительна: например, при выборе команд нельзя не учитывать схему распределения памяти, и, наоборот, схема распределения памяти (регистров, в частности) необходимо ведет к генерации той или иной последовательности команд. Однако удобно и практично эти задачи все же разделять и при этом особо обращать внимание на их взаимодействие.
В какой-то мере схема генератора кода зависит от формы промежуточного представления. Ясно, что генерация кода из дерева отличается от генерации кода из троек, а генерация кода из префиксной записи отличается от генерации кода из ориентированного графа. В то же время все генераторы кода имеют и много общего и основные применяемые алгоритмы отличаются, как правило, только в деталях, связанных с используемым промежуточным представлением.
В дальнейшем в качестве промежуточного представления мы будем использовать префиксную нотацию и алгоритмы генерации кода будем излагать в виде атрибутных схем со входным языком Лидер.
8.1. Модель машины
При изложении алгоритмов генерации кода мы будем следовать некоторой модели машины, в основу которой положена система команд микропроцессора Motorola 68020.
В системе команд используются следующие способы адресации:
D - значение находится в регистре данных;
А - значение находится в адресном регистре;
POST - пост-инкрементная адресация (А)+: исполнительный адрес есть значение адресного регистра и после исполнения команды значение этого регистра увеличивается на длину операнда;
PRE - пре-инкрементная адресация -(А): перед исполнением операции содержимое адресного регистра уменьшается на длину операнда, исполнительный адрес равен новому содержимому адресного регистра;
DIRECT - прямая адресация через регистры: исполнительный адрес равен значению выражения ADDREG+INDEXREG*SCALE +ADDRDISP - содержимое адресного регистра + содержимое индексного регистра, умноженное на SCALE+адресное смещение;
INDPPRE - пре-косвенная через память: (ADDREG+INDEXREG* SCALE+ADDRDISP)+INDEXDISP - выражение в скобках дает адрес ячейки, содержимое которой + индексное смещение дает исполнительный адрес;
INDPOST - пост-косвенная через память: (ADDREG+ADDRDISP) +INDEXREG*SCALE+INDEXDISP - выражение в скобках дает адрес ячейки, содержимое которой + содержимое индексного регистра, умноженное на SCALE + индексное смещение, дает исполнительный адрес;
DIRPC - прямая через PC (счетчик команд): исполнительный адрес определяется выражением PC+INDEXREG*SCALE+ADDRDISP;
INDPREPC - пре-косвенная через PC: (PC+INDEXREG* SCALE+ ADDRDISP)+INDEXDISP - то же, что INDPRE, но в качестве адресного регистра исползуется PC;
INDPOSTPC - пост-косвенная через PC: (PC+ADDRDISP)+INDEXREG *SCALE+INDEXDISP то же, что и INDPOST, но в качестве адресного регистра используется PC;
ABS - абсолютная;
IMM - непосредственный операнд.
В дальнейшем изложении будут использованы следующие команды:
MOVEA ИА,А - загрузить содержимое по исполнительному адресу ИА на адресный регистр А;
MOVE ИА1,ИА2 - содержимое по исполнительному адресу ИА1 переписать по исполнительному адресу ИА2;
MOVEM список регистров,ИА - сохранить указанные регистры в памяти по адресу ИА;
MOVEM ИА,список регистров - восстановить указанные регистры из памяти по адресу ИА;
LEA ИА,А - загрузить исполнительный адрес ИА на адресный регистр А;
MUL ИА,D - умножить содержимое по исполнительному адресу ИА на содержимое регистра данных D и результат разместить в D;
ADD ИА,D - сложить содержимое по исполнительному адресу ИА с содержимым регистра данных D и результат разместить в D;
SUB ИА,D - вычесть содержимое по исполнительному адресу ИА из содержимого регистра данных D и результат разместить в D;
CMP ИА,D - содержимое регистра данных D вычитается из содержимого по исполнительному адресу ИА, при этом формируется признак результата, но содержимое регистра D не меняется;
TST ИА - выработать код условия по значению, находящемуся по исполнительному адресу ИА;
BNE ИА - условный переход по признаку NE (не равно) по исполнительному адресу ИА;
BEQ ИА - условный переход по признаку EQ (равно) по исполнительному адресу ИА;
BLE ИА - условный переход по признаку LE (меньше или равно) по исполнительному адресу ИА;
BGT ИА - условный переход по признаку GT (больше) по исполнительному адресу ИА;
BLE ИА - условный переход по признаку KE (меньше или равно) по исполнительному адресу ИА;
BLT ИА - условный переход по признаку LT (меньше) по исполнительному адресу ИА;
BR ИА - безусловный переход по адресу ИА;
JSR ИА - переход с возвратом на подпрограмму по адресу ИА;
JMP ИА - безусловный переход по исполнительному адресу;
RTD размер локальных - возврат из подпрограммы с указанием размера локальных;
LINK A,размер локальных - в стеке сохраняется значение регистра А, в регистр А заносится указатель на это место в стеке и указатель стека продвигается на размер локальных;
UNLK A - стек сокращается на размер локальных и регистр А восстанавливается из стека.
8.2. Динамическая организация памяти
Рассмотрим схему реализации магазина периода выполнения для простейшего случая (как, например, в языке Паскаль), когда все переменные в магазине (фактические параметры и локальные переменные) имеют известные при трансляции смещения. Магазин служит для хранения локальных переменных (и параметров) и обращения к ним в языках, допускающих рекурсивные определения процедур. Еще одной задачей, которую необходимо решать при трансляции языков с блочной структурой - обеспечение реализации механизмов статической вложенности. Рассмотрим рекурсивную программу рис. 8.1.
PROCEDURE P1;
VAR V1; P2 V2
PROCEDURE P2;
VAR V2;
BEGIN P2;
V1:=... P2 V2
V2:=...
END P2; P1 V1
BEGIN P2;
END P1;
Рис. 8.1 Рис. 8.2
В процессе выполнения этой программы в магазине может сложиться ситуация, изображенная на рис. 8.2. Находясь в процедуре P2, мы должны иметь доступ к последнему экземпляру значений переменных процедуры P2 и к экземляру значений переменных процедуры P1, из которой была вызвана P2. Кроме того, необходимо обеспечить восстановление состояния программы при завершении выполнения процедуры.
Мы рассмотрим две возможные схемы динамической организации памяти: схему со статической цепочкой и с дисплеем в памяти. В первом случае все статические контексты связаны в список, который называется статической цепочкой; в каждой записи для процедуры в магазине хранится указатель на запись статически охватывающей процедуры (помимо, конечно, указателя динамической цепочки - указателя на "базу" динамически предыдущей процедуры). Использование той или иной схемы определяется, помимо прочих условий, прежде всего числом адресных регистров.
8.2.1. Организация магазина со статической цепочкой