Лекции по конструированию компиляторов. В.А. Серебряков (1134687), страница 19
Текст из файла (страница 19)
DeclPart Size
Decl Decl Decl
Disp Disp Disp
Size Size Size
Рис. 8.10
Все объявления, кроме объявлений переменных, имеют нулевой размер. Размер объявления переменной определяется следующим правилом:
RULE
Decl ::= 'VAR' TypeDes
SEMANTICS
Tablentry Entry;
0: Entry=IncTab;
Size<0>=((Table[VAL<2>]+1) / 2)*2;
// Выравнивание на границу слова
Table[Entry]=Disp<0>+Size<0>.
В качестве примера трансляции определения типа рассмотрим обработку описания записи:
RULE
TypeDes ::= 'REC' ( TypeDes ) 'END'
SEMANTICS
int Disp;
Tablentry Temp;
0: Entry<0>=IncTab;
Disp=0;
2A: { Temp=IncTab;
Table[Temp]=Disp;
Disp=Disp+Table[Entry<2>]+1) / 2)*2;
// Выравнивание на границу слова
}
Table[Entry<0>]=Disp.
8.4. Трансляция переменных.
Переменные отражают все многообразие механизмов доступа в языке. Переменная имеет синтезированный атрибут ADDRESS - это запись, описывающая адрес в команде МС68020. Этот атрибут сопоставляется всем нетерминалам, представляющим значения. В системе команд МС68020 много способов адресации, и они отражены в структуре значения атрибута ADDRESS, имеющего следующий тип:
enum Register
{D0,D1,D2,D3,D4,D5,D6,D7,A0,A1,A2,A3,A4,A5,A6,SP,NO};
enum AddrMode
{D,A,Post,Pre,Direct,IndPre,IndPost,
DirPC,IndPrePC,IndPostPC,Abs,Imm};
struct AddrType{
Register Addreg,IndexREG;
int IndexDisp,AddrDisp;
short Scale;
};
Значение регистра NO означает, что соответствующий регистр в адресации не используется.
Доступ к переменным осуществляется в зависимости от их уровня: глобальные переменные адресуются с помощью абсолютной адресации; переменные процедуры текущего уровня адресуются через регистр базы А6.
Если стек организован с помощью статической цепочки, то переменные предыдущего статического уровня адресуются через регистр статической цепочки А5; переменные остальных уровней адресуются "пробеганием" по статической цепочке с использованием вспомогательного регистра. Адрес переменной формируется при обработке структуры переменной слева направо и передается сначала сверху вниз как наследуемый атрибут нетерминала VarTail, а затем передается снизу-вверх как глобальный атрибут нетерминала Variable. Таким образом, правило для обращения к переменной имеет вид (первое вхождение Number в правую часть - это уровень переменной, второе - ее Лидер-номер):
RULE
Variable ::= VarMode Number Number VarTail
SEMANTICS
:int Temp;
AddrType AddrTmp1,AddrTmp2;
3: if (Val<2>==0) // Глобальная переменная
{Address<4>.AddrMode=Abs;
Address<4>.AddrDisp=0;
}
else // Локальная переменная
{Address<4>.AddrMode=Direct;
if (Val<2>==Level<Block>)
// Переменная текущего уровня
Address<4>.Addreg=A6;
else if (Val<2>==Level<Block>-1)
// Переменная предыдущего уровня
Address<4>.Addreg:=A5;
else {Address<4>.Addreg=GetFree(RegSet<Block>);
AddrTmp1.AddrMode=Direct;
AddrTmp1.Addreg=A5;
AddrTmp1.IndexReg=No;
AddrTmp1.AddrDisp=0;
Emit2(MOVEA,AddrTmp1,Address<4>.Addreg);
AddrTmp1.Addreg=Address<4>.Addreg;
AddrTmp2.AddrMode=A;
AddrTmp2.Addreg=Address<4>.Addreg;
for (Temp=Level<Block>-Val<2>;???;Temp)
Emit2(MOVEA,AddrTmp1,AddrTmp2);
}}
if (Val<2>==Level<Block>)
Address<4>.AddrDisp=Table[Val<3>];
else Address<4>.AddrDisp=Table[Val<3>]
+Table[LevelTAB[Val<2>]];
}}.
Функция GetFree выбирает очередной свободный регистр (либо регистр данных, либо адресный регистр) и отмечает его как использованный в атрибуте RegSet нетерминала Block. Процедура Emit2 генерирует двухадресную команду. Первый параметр этой процедуры - код команды, второй и третий параметры имеют тип Address и служат операндами команды (здесь для упрощения изложения в качестве параметров этой процедуры используются контрукции типа '(А)'; имеется в виду косвенная адресация через адресный регистр). Смещение переменной текущего уровня отсчитывается от базы (А6), а других уровней - от указателя статической цепочки, поэтому оно определяется как алгебраическая сумма LOCALSize и величины смещения переменной (отрицательного!).
Если стек организован с помощью дисплея, то трансляция для доступа к переменным может быть осуществлена следующим образом:
RULE
Variable ::= VarMode Number Number VarTail
SEMANTICS
int Temp;
3: if (Val<2>==0) // Глобальная переменная
{Address<4>.AddrMode=Abs;
Address<4>.AddrDisp=0;
}
else // Локальная переменная
{Address<4>.AddrMode=Direct;
if (Val<2>=Level<Block>)
// Переменная текущего уровня }
{Address<4>.Addreg=A6;
Address<4>.AddrDisp=Table[Val<3>];
}
else {Address<4>.AddrMode=IndPost;
Address<4>.Addreg=NO;
Address<4>.IndexREG=NO;
Address<4>.AddrDisp=DispLAY[Val<2>];
Address<4>.IndexDisp=Table[Val<3>];
}}}.
Рассмотрим трансляцию доступа к полям записи. Она описывается следующим правилом (Number - это Лидер-номер описания поля):
RULE
VarTail ::= 'FIL' Number VarTail
SEMANTICS
if (Address<0>.AddrMode==Abs)
{Address<3>.AddrMode=Abs;
Address<3>.AddrDisp=Address<0>.AddrDisp+Table[Val<2>];
}
else {Address<3>=Address<0>;
if (Address<0>.AddrMode==Direct)
Address<3>.AddrDisp=Address<0>.AddrDisp
+Table[Val<2>];
else Address<3>.IndexDisp=Address<0>.IndexDisp
+Table[Val<2>];
}.
Смещение в случае абсолютной и прямой адресации определяется полем AddrDisp, а в остальных случаях - полем IndexDisp. Таким образом, видно, что при обработке полей записей идет только накопление смещения поля без генерации каких-либо команд.
Атрибутные зависимости для этого правила могут быть изображены следующим образом (рис. 8.11):
VarTail Disp
Number VarTail Disp
Table
Disp
Рис. 8.11
Рассмотрим теперь выборку элемента массива. Лидер-синтаксис обращения к элементу массива следующий:
VarTail ::= 'ARR' Number Typexpr VarTail
Здесь Number - Лидер номер описания диапазона индексов; Typexpr - индексное выражение. По адресу левой части правила, представляющей переменную-массив, от которого берется индекс, и по индексному выражению, представленному нетерминалом Typexpr, мы должны сформировать адрес элемента массива. В приведенной ниже таблице решений функция GetAddr выбирает очередной свободный адресный регистр.
Под "рабочим" регистром в таблице решений имеется в виду регистр, значение которого может быть испорчено (примером "не рабочего" регистра может служить регистр А6 или регистр А5, если он используется как указатель процедуры предыдущего статического уровня).
MaxReg - максимальный номер адресного регистра, которым можно пользоваться как рабочим. Все адресные регистры разделены на два множества: имеющие номера, большие MaxReg, заняты предварительным распределением, остальные - рабочие. Функция GetAddr выдает очередной свободный рабочий адресный регистр.
Т
ип адресации VarTail левой части:
IndPre || Direct (IndPost || Abs) ||
IndexReg==NO ((Direct || IndPre)
&& (IndexReg!=NO))
ElSize<3>== AddrDisp<4>= AddrDisp<4>:=
1,2,4,8 AddrDisp<0> -Left<2>*ElSize<3>
AddrMode<3>==D -Left<2>*ElSize<3> AddrMode<4>=IndPost
Addreg<4>=Addreg<0> Addreg<4>=
IndexReg<4>= (Addreg<0>==рабочий)
Addreg<3> ?Addreg<0>
AddrMode<4>=IndPost :GetAddr
Scale<4>=ElSize<3> IndexReg<4>=
Addreg<3>
Scale<4>=ElSize<3>
LEA Address<0>,
Address<4>
E
lSize<3> AddrDisp<4>= AddrDisp<4>=
!=1,2,4,8 AddrDIP<0>- -Left<2>*ElSize<3>
AddrMode<3>==D Left<2>*ElSize<3> AddrMode<4>=IndPost
Addreg<4>=Addreg<0> Addreg<4>=
IndexReg<4>= (Addreg<0>==рабочий)
Addreg<3> ?Addreg<0>
Scale<4>=1 :GetAddr
AddrMode<4>=IndPost IndexReg<4>=
Addreg<3>
MUL ElSize<3>, Scale=1
Addreg<3>
LEA Address<0>,
Address<4>
MUL ElSize<4>,
IndexReg<4>
E
lSize<3>== AddrDisp<4>= AddrDisp<4>=
1,2,4,8 AddrDisp<0>- -Left<2>*ElSize<3>
AddrMode<3>!=D Left<2>*ElSize<3> AddrMode<4>=IndPost
Addreg<4>=Addreg<0> Addreg<4>= IndexReg<4>=GetFree (Addreg<0>==рабочий)
AddrMode<4>=IndPost ?Addreg<0>
Scale<4>=ElSize<3> :GetAddr
IndexReg<4>=GetFree()
MOVE Address<3>, Scale<4>=ElSize<3>
IndexReg<4>
LEA Address<0>,
Address<4>
MOVE Address<3>,
IndexReg<4>
ElSize<3> AddrDisp<4>= AddrDisp<4>:=
<>1,2,4,8 AddrDisp<0>- -Left<2>*ElSize
AddrMode<3><>D Left<2>*ElSize<3> AddrMode<4>=IndPre
Addreg<4>=Addreg<0> Addreg<4>= IndexReg<4>=GetFree (Addreg<0>==рабочий)
AddrMode<4>=IndPre ?Addreg<0>
Scale<4>=ElSize<3> :GetAddr
IndexReg<4>=GetFree()
MOVE Address<3>, Scale<4>=1
IndexReg<4>
MUL ElSize<3>, LEA Address<0>,
IndexReg<4> Address<4>
MOVE Address<3>,
IndexReg<4>
MUL ElSize<3>,
IndexReg<4>
Приведенная таблица реализуется следующим правилом:
RULE
VarTail ::= 'ARR' Number Typexpr VarTail
SEMANTICS
int Size;
bool Flag;
AddrType AddrTmp1,AddrTmp2;
Flag= ((Address<0>.AddrMode==IndPre)
|| (Address<0>.AddrMode==Direct))
&& (Address<0>.IndexReg==NO);
Size=Table[Val<2>];
if (Address<3>.AddrMode==D)
IndexReg<4>=Addreg<3>;
else IndexReg<4>=GetFree;
AddrMode<4>=IndPre;
if (Flag)
{Address<4>.AddrDisp=Address<0>.AddrDisp-Table[Val<2>]*Size;
Addreg<4>=Addreg<0>;
}
else {Address<4>.AddrDisp=-Table[Val<2>]*Size;
if (Address<0>.Addreg<=MaxReg)
Addreg<4>=Addreg<0>;
else Addreg<4>=GetAddr;
}
if (Size & 14) // 2,4,8
Address<4>.Scale=Size);
else Address<4>.Scale=1;
AddrTmp1.AddrMode=D;
AddrTmp1.Addreg=IndexReg<4>;
if (Flag) Emit2(LEA,Address<0>,Address<4>);
if (Address<3>.AddrMode!=D)
Emit2(MOVE,Address<3>,AddrTmp1);
AddrTmp2.AddrMode=IMM;
AddrTmp2.AddrDisp=ElSize<3>;
if (!(Size & 15)) // 1,2,4,8
Emit2(MUL,AddrTmp2,AddrTmp1).
8.5. Трансляция целых выражений
Трансляция выражений различных типов управляется синтаксически благодаря наличию указателя типа перед каждой операцией. Мы рассмотрим некоторые наиболее характерные проблемы генерации кода для выражений.
Система команд МС68020 обладает двумя особенностями, сказывающимися на генерации кода для арифметических выражений (то же можно сказать и о генерации кода для выражений типа "множества"):