46023 (665330), страница 16

Файл №665330 46023 (Проектирование трансляторов) 16 страница46023 (665330) страница 162016-07-31СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 16)

пользуется польская запись. Она имеет ряд преимуществ перед ин-

фиксной: формула может быть записана без скобок; эта форма пред-

ставления очень удобна для ЭВМ со стековой адресацией; если зна-

ки операций в инфиксной форие различаются по старшинству, то

польская запись устраняет эту систему приоритетов).

В польской записи операнды следуют непосредственно за опера-

торами. Вычисление таких записей производится с помощью стека,

где будут находиться все операнды, встретившиеся при просмотре

выражения.

Просмотр начинается с самого левого символа. Прочитав его и

обработав, переходим к следующему. Последовательность обработки

такова:

1) если сканирующий символ - идентификатор или константа, то

его значение заносится в стек и осуществляется переход к следую-

щему;

2) если сканирующий символ-бинарный оператор, то он приме-

няется к двум верхним операндам в стеке и затем они заменяются на

полученный результат;

3) если сканирующий символ - унарный оператор, то он приме-

няется к верхнему операнду в стеке, который затем заменяется на

полученный результат.

Тетрады

Для бинарных операций удобной формой представления являются

тетрады. Тетрада имеет вид:

В тетраде отсутствует поле результата. Если позже какой-ли-

бо операнд окажется результатом данной операции, то он будет на

нее непосредственно ссылаться.

Существуют и другие формы внутреннего представления.

Деревья

Мы опpеделили КС-язык, задаваемые некотоpой гpамматикой, как

множество теpминальных цепочек, котоpые можно вывести из на-

чального символа. Можно постpоить деpево вывода цепочки КСязыка.

Это легко сделать, интеpпpетиpуя подстановки, как шаги постpое-

ния деpева.Однако деpево не несет никакой инфоpмации о поpядке

пpименеия пpавил, кpоме того что пpавила должны пpименяться к

каждой веpшине деpева pаньше, чем к нетеpминальным веpшинам pас-

положенным ниже. Поскольку поpядок вывода в деpеве скpыт, то мо-

жет быть несколько выводов, соответствующих одному и тому же

деpеву вывода. Для каждого деpева существует единственный левый и

единственный пpавый вывод, котоpый получается, если всегда заме-

нять самый пpавый нетеpминал. Многие методы обpаботки языков pас-

читаны исключительно на левые или пpавые выводы,так как они очень

удобны для семантической обpаботки. Когда одна цепочка может

иметь несколько деpевьев вывода, говоpят, что соответствующая

гpамматика неоднозначна. Все сказанное можно pезюмиpовать следую-

щим обpазом:

1. Каждой цепочке, вводимой в данной КС-гpамматике, соответ-

ствует одно или несколько деpевьев вывода.

2. Каждому деpеву соответствует один или несколько выводов.

3. Каждому деpеву соответствует один пpавый и один левый вы-

вод.

4. Если каждой цепочке, вводимой в КС-гpамматике, соответ-

ствует единственное деpево вывода, эта гpамматика называется од-

нозначной; в пpотивном случае ее называют неоднозначной.

ЛЕКЦИЯ 14

ОПТИМИЗАЦИЯ ПРОГРАММЫ

Улучшение выходной программы обычно называют ее оптимиза-

цией, а часть транслятора, выполняющая эту функцию - отимизирую-

щей частью транслятора.

Оптимизирующая часть транслятора:

1. Устраняет недостатки программы,вызванные небрежностью или

низкой квалификацией программиста.

2. Устраняет излишние вычислеия, неизбежно возникающие в

процессе трансляции даже при самом тщательном написании програм-

мы на языке высокого уровня.

Если транслятор производит оптимизацию программы, необходи-

мо делать специальный проход, переводящий программу с исходного

языка на промежуточный.

Оптимизировать программу, уже протранслированную в коды ма-

шины, трудно по трем причинам: во-первых, единицы действия прог-

раммы в кодах команд слишком мелки, что уже само по себе затруд-

няет анализ, во-вторых, при трансляции входной программы в коды

машины возможна потеря имеющейся в ней информации. Например, за-

сылка промежуточных результатов в разные рабочие ячейки памяти

делает практически невозможной идентификацию одинаковых частей

программы; в-третьих из-за нестандартности форматов различных

элементов языка и рекурсивных конструкций, широко применяемых в

текстах программ.

Строго сформулировать требования, предьявляемые к промежу-

точному языку, трудно.

Однако уже из самого обоснования необходимости промежуточно-

го языка видно, что:

а) операторы языка не должны быть слишком мелкими;

б) символы, идентификаторы и числа должны иметь фиксирован-

ный формат;

в) в строении операторов желательно отсутствие рекурсивности;

г) должна сохраняться вся информация, необходимая для опти-

мизации, которая есть во входном языке;

д) язык должен быть приспособлен к выполнению оптимизирую-

щих преобразований и удобен для последующей трансляции в коды вы-

числительной машины.

Требования пп. "г" и "д" показывают, что разработать еди-

ный универсальный промежуточный язык для трансляции с любого язы-

ка программирования в коды любой ВМ трудно.

Помимо программы на промежуточном языке, состоящей из после-

довательности операторов, необходимы следующие таблицы:

1. Таблицы идентификаторов и констант с обычной информацией

о переменных и константах;

2. Таблица блоков, определяющая номера блоков, их границы,

непосредственно предшествующие и следующие блоки, а также любую

информацию о частоте повторения блока;

3. Таблица последовательности операторов, определяющая ли-

нейную последовательность операторов в блоке. Она содержит после-

довательность указателей операторов mi. Эта таблица необходима,

поскольку один указатель может принадлежать нескольким операторам.

Подстановка и устранение идентичных операторов

Подстановка - это замена переменной или mi - идентификатора

результата заданной или вычисленной константой, причем эта заме-

на производится во время трансляции, а не в процессе решения.

Подстановка является полностью внутриблочной процедурой и

выполняется перед устранением излишних команд.

Сдвиг инвариантных операторов

Сильно связанной областью называется такое множество его уз-

лов, что для любых двух вершин x и y (x != y) существует путь из

x в y.

Оператор инвариантен в сильно связанной области, если его

операнды не зависят от места определения переменных в данной об-

ласти.

Будем рассматривать сильно связанные области Ri, обладающие

следующими свойствами:

1) Ri является сильносвязанной областью, состоящей из мно-

жества блоков, каждый из которых предшетвует сам себе и следует

сам за собой внутри этого множества;

2) Ri != Rj;

3) для каждого i

Rj Ri.

Как уже отмечалось, сдвиг инвариантного оператора из тела

цикла сокращает время выполнения программы. Особенность рассмат-

риваемого метода заключается в том, что оператор сдвигается из

блока во всех случаях, когда он может быть сдвинут независимо от

того, находится он внутри цикла или нет. Ухудшение программы

произойти не может.

Замена переменных в операторах условного перехода

В результате сокращения глубины операции рекурсивная прог-

раммная переменая , являющаяся управляющей в операторе условного

перехода, может быть заменена в нем генерируемой переменной t(mi-

идентификаторов).

Процедура замены переменной в операторе условного перехода

заключается в следующем. После сокращения глубины операции во

всех операторах, использующих рекурсивно определяемые програм-

мные переменные I, находят операторы условного перехода, в кото-

рых I является управляющей переменной.

Определение не используется и может быть устранено, если ре-

зультат определения не является операндом ни одного оператора ре-

курсивного определения и результат этого последнего не ис-

пользуется ни в каком другом операторе.

Как только определение устранено, все вычисления, от кото-

рых оно зависит, если они нигде больше не используются, могут

быть устранены.

Вставка псевдоблока

В процессе оптимизации операторы, сдвигаемые из блоков, со-

бираются в псевдоблок. После оптимизации области Rk операторы

псевдоблока должны быть вставлены в программу так, чтобы они вы-

полнялись до (после) выполнения операторов области Ri.

Для того, чтобы операторы псевдоблока выполнялись на всех

входных (выходых) путях области Rk, они должны вставляться во все

блоки, непосредственно предшествующие (следующие) области либо из

псевдоблока должен быть сформирован блок ,который будет вставлен

на все входные (выходные) пути области Rk.

ЛЕКЦИЯ 15

ОПТИМИЗАЦИЯ ПРОГРАММЫ (ПРОДОЛЖЕНИЕ)

Синтез (генерация) выходного текста

Промежуточный код

Промежуточные коды (или обьектные языки) можно проектиро-

вать на различных уровнях. Так, иногда промежуточный код полу-

чают, просто разбивая сложные структуры языка на более удобные

для обращения элементы. Однако можно в качестве промежуточного

кода ( в этом случае его чаще называют обьектным языком ) ис-

пользовать какой-либо обобщенный машинный код, который затем

транслируется в код реальной машины. Получение промежуточного ко-

да возможно до или после распределения памяти. Если это происхо-

дит до распределения памяти, то операндами могут служить иденти-

фикаторы программы ( или их представления после лексического ана-

лиза ) и присваиваемые компилятором идентификаторы, причем в пос-

леднем варианте используются адреса времени прогона.

Одним из видов промежуточного кода являются четверки.

Например, выражение (-a+b)*(c+d) можно представить как чет-

верки следующим образом: -a = 1

1+b = 2

c+d = 3

2*3 = 4

Здесь целые числа соответствуют идентификаторам, присва-

иваемым компилятором. Четверки можно считать промежуточным

кодом высокого уровня. Такой код часто называют трехадресным

- два адреса для операндов ( кроме тех случаев, когда имеют

место унарные операции ) и один для результата. Другой вари-

ант кода - тройки ( двухадресный код ). Каждая тройка состоит

из двух адресов операндов и знака операции. Если сам операнд

является тройкой, то используется ее позиция, что исключает

необходимость иметь в каждой тройке адрес результата.

Выражение a+b+c*d можно представить в виде четверок:

a+b = 1

c*d = 2

1+2 = 3

и в виде троек:

a+b

c*d

1+2

Тройки компактнее четверок, но если в компиляторе есть

фаза оптимизации, которая пресылает операторы промежуточного

кода, их применение затруднительно. Наилучшее решение этой

проблемы - косвенные тройки, т.е. операнд, ссылающийся на ра-

нее вычисленную тройку, должен указывать на элемент таблицы

указателей на тройки, а не на саму эту тройку.

Как тройки, так и четверки можно распространить не толь-

ко на выражения, но и на другие конструкции языка. Например,

присваивание a := b в виде четверки представляется как

a := b = 1

a в виде тройки - как a := b

Аналогично условное предложение

IF a THEN b ELSE c FI

можно считать выражением с тремя операндами, которому требу-

ются четыре адреса как четверке и три - как тройке.

Не менее популярны в качестве промежуточного кода пре-

фиксная и постфиксная нотации. В префиксной нотации каждый

знак операции появляется перед своими опреандами, а в пост-

фиксной - после. В этом и состоит их отличие от обычной ( ин-

фиксной ) нотации, в которой обозначения двухместных операций

появляются между своими операндами. Например, инфиксное выра-

жение a+b в префиксной нотации примет вид + ab , а в пост-

фиксной - вид ab +.

Префиксная нотация известна также как польская запись, а

постфиксная - как обратная польская запись. С помощью этих

нотаций можно записывать более сложные выражения. Например,

выражение (a+b)*(c+d) в префиксной форме записывается следую-

щим образом: *+ab+cd

а в постфиксной так: ab+cd+*

Каждый знак опреации в префиксной нотации ставится не-

посредственно перед своими операндами, а в постфиксной после

них.

В префиксной и постфиксной нотациях скобки уже не требу-

ются, так здесь никогда не возникает сомнений относительно

того, какие операнды принадлежат к тем или иным знакам опера-

ций. В этих нотациях не существует приоритета знаков опера-

ций, хотя при преобразовании инфиксных выражений в префиксные

или постфиксные их приоритет, несомненно, нужно учитывать.

Перегруппировку в результате преобразования

(a+b)*(c+d)

в

ab+cd+*

можно осуществить с помощью стека. Алгоритм такого преобразо-

вания хорошо известен. Это преобразование можно выполнить

также на основании грамматики инфиксных выражений. В данном

случае оно сведется к трем действиям:

1) напечатать идентификатор, когда он встретится при

чтении инфиксного выражения слева направо;

2) поместить в стек знак операции, когда он встретится;

3) когда встретится конец выражения ( или подвыражения ),

выдать на печать тот знак операций, который находится в вер-

шине стека.

Этот метод подобен методу, который применяется для полу-

чения четверок. Префиксные и постфиксные выражения можно так-

же получить из представления выражения в виде бинарного дере-

ва. Чтобы получить представление префиксного выражения, дере-

во обходят сверху в порядке, определенном Кнутом:

посещение корня;

обход левого поддерева сверху;

обход правого поддерева сверху,

что дает

+*+abcd

Для получения постфиксного представления дерево обходят

снизу. По Кнуту это выглядит так:

обход левого поддерева снизу;

обход правого поддерева снизу;

посещение корня.

В результате имеем: ab+c*d+

Далее будем рассуждать в терминах промежуточного языка (

или обьектного ), состоящего из команд вида

тип-команды параметры

Тип-команды может быть, например, вызовом стандартного

обозначения операции, тогда параметрами могут быть имя знака

операции, адреса опреандов и адрес результата. Например,

STANDOP II+,A,B,C

Здесь II+ обозначает сложение двух целых чисел, а A, B,

C cлужат во время прогона адресами двух операндов и результа-

та. Для того чтобы в промежуточном коде можно было воспользо-

ваться адресами во время прогона, распределение памяти к это-

му времени должно быть уже закончено. При распределении памя-

ти необходимо знать, какой обьем памяти занимает целое, ве-

щественное и другие значения на той машине, для которой выда-

ется обьектный код. Это означает, что промежуточный код не

является в строгом смысле интерфецсом между не зависящей и

зависящей от машины частями компилятора. Тем не менее если

речь идет о переводе фронтальной части компилятора ( т.е.

части, транслирующей исходный код в промежуточный ) с одной

машины на другую, то единственное, что здесь может потребо-

ваться, - это изменение нескольких констант.

Промежуточный код пишется на относительно низком уровне.

Он аналогичен коду, использованному для реализации Алгола 68.

Обычно выдвигается условие, чтобы промежуточный код отражал

структуру реализуемого языка.

Промежуточный код напоминает префиксную нотацию в том

смысле, что знак операции всегда предшествует своим операн-

дам. Но он имеет менее общий характер, так как сами операнды

не могут быть префиксными выражениями. При получении промежу-

точного кода для хранения адресов операндов до тех пор, пока

не будет напечатан знак операции, используется стек. Посколь-

ку знак операции можно установит ( во многих языках ) лишь

после того, как станут известны его опреанды, стек служит

также для хранения каждого знака операции на то время, пока

не определены оба операнда.

Адрес на время прогона обычно соотносится со стеком, и

каждый такой адрес можно представить тройкой вида

( тип-адреса, номер блока, смещение ).

Тип-адреса может быть прямым или косвенным ( т.е. адрес

может содержать значение или указатель на значение ) и ссы-

латься на рабочий стек или стек идентификаторов. Он может

быть также литералом или константой. Номер блока позволяет

найти номер уровня блока в таблице блоков, что обеспечивает

доступ к конкретной рамке стека через диспдей. В сдучае лите-

рала или константы номер блока не используется. Смещение (

для адреса стека ) показывает смещение значения конкретной

рамки по отношению к началу стека идентификаторов или рабоче-

го стека. Если тип-адрес представляет собой литерал, то сме-

щение выражается самим значением, а если тип-адреса - конс-

танта, то смещение нужно найти в таблице констант по заданно-

му им адресу. В том случае, когда в каждой рамке стека рабо-

чий стек помещается сразу же над стеком идентификаторов, сме-

щения адресов рабочего стека по отношению к началу рамки мож-

но рассчитывать, как только станет известным размер стека

идентификаторов для конкретной рамки ( т.е. во время прохода,

следующего за проходом, при котором происходит распределение

памяти ).

Адреса во время прогона для идентификаторов определяются

в процессе распределения памяти и хранятся в таблице символов

вместе с информацией о типе и т.п.

Кроме рассмотренных, существуют и другие команды проме-

жуточного кода ( ICI по Бранкару ):

SETLABEL L1

для установки метки и

ASSIGN type, add1, add2

для присваивания. Тип необходим как параметр, чтобы опреде-

лить размер значения, переписываемого из add1 в add2. В Алго-

ле 68 может потребоваться просмотр типа ( вида ) при трансля-

ции этой команды в фактический код машины, если значения бу-

дут содержать динамические части, поэтому во время генерации

машинного кода нужна таблица видов.

Структуры данных для генерации кода

Как упоминалось выше, для хранения адресов операндов на

то время, пока их нельзя будет выдать как параметры ICI, не-

обходим стек значений. В этом стеке, который Бранкар называет

нижним стеком, можно хранить также и другую информацию. Нап-

ример, значение может быть связано со своими

а) адресом времени прогона;

б) типом;

в) областью действия,

помимо той информации, которая имеет значение для диагности-

ки. Это - статическая информация, так как ( по крайней мере,

для большинства языков ) ее можно получить во время компиля-

ции. Так, при компиляции может быть известно если не факти-

ческое значение, то во всяком случае адрес целого числа.

При трансляции А + В первыми помещаются в нижний стек

статические свойства А. Любой элемент нижнего стека можно

представить в виде структуры, имеющей поле для каждой из сво-

их статических характеристик. В случае идентификаторов стати-

ческие характеристики находятся из таблицы символов. Затем в

стек знаков операции помещается знак операции +, и в нижний

стек добавляются статические характеристики В. Знак операции

берется из стека знаков операций, а его два операнда - из

нижнего стека. Типыоперандов используются для идентификации

знака операции, после чего генерируется код. И наконец, в

нижний стек помещаются статические характеристики результата.

Этот процесс можно распространить и на более сложные вы-

ражения, например нп те, которые генерируются грамматикой с

правилами

EXP -> TERM |

EXP + TERM |

EXP - TERM

TERM -> FACT |

TERM * FACT |

TERM / FACT

FACT -> constant |

identifier |

(EXP)

После чтения идентификатора или константы, знака опера-

ции и второго операнда необходимо выполнить следующие дейс-

твия:

А1. Послечтения идентификатора или константы ( т.е. лис-

та синтаксического дерева ) поместить в нижний стек

соответствующие статические характеристики.

А2. После чтения оператора поместить символ операции в

стек знаков операций.

А3. После чтения правого операнда ( который может быть

выражением ) извлечь из стеков знак операции и его два опе-

ранда, генерировать соответствующий код, так как знак опера-

ции идентифицирован, и поместить в стек статические характе-

ристики результата. Тип результата становится известным во

время идентификации знака операции, например сложение двух

целых чисел всегда дает целое число.

При включении в грамматику этих действий она примет сле-

дующий вид:

EXP -> TERM

EXP+TERM

EXP-TERM

TERM -> FACT

TERM*FACT

TERM/FACT

FACT -> constant

identifier

(EXP)

Нижний стек частично используется для передачи информа-

ции о типе вверх по синтаксическому дереву. Рассмотрим син-

таксическое дерево, соответствующее выражению:

+

^

/ \

/ \

/ \

* / \ *

/\ /\

/ \ / \

/ \ / \

a b x y

a * b + x * y

Если значения a и b имеют тип целого, а х и у - тип ве-

щественного значения, компилятор может заключить,

воспользовавшись информацией нижнего стека, что "+" в вершине

дерева представляет сложение целого и вещественного значений.

Мы можем переписать выражение, расставив действия А1, А2 и А3

в том порядке, в каком они будут вызываться при трансляции

этого выражения:

а*b+x*y

Действие А3 соответствует применению знака операции. Из

изложенного выше вытекает, что каждый вызов А3 соответствует

тому месту, где появился бы знак операции в постфиксной фор-

ме. Стек знаков опреаций, по существу, служит для формирова-

ния постфиксной нотации. Поэтому последовательность действий

при трансляции данного выражения должна быть следующей:

А1. Поместить статические характеристики а в нижний

Характеристики

Тип файла
Документ
Размер
1,13 Mb
Тип материала
Учебное заведение
Неизвестно

Список файлов реферата

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6508
Авторов
на СтудИзбе
302
Средний доход
с одного платного файла
Обучение Подробнее