сист пр об ч 3 (1085772)
Текст из файла
6.1.2. ЗАДАЧА № 2—РАСПОЗНАВАНИЕ СИНТАКСИЧЕСКИХ ЕДИНИЦ И ИНТЕРПРЕТАЦИЯ ИХ ЗНАЧЕНИЙ
После того как программа была разбита на лексические единицы или стандартные символы, компилятор должен:
1. Распознать фразы (синтаксические конструкции); каждая
фраза есть семантическая единица и является строкой лексиче
ских единиц, имеющей смысловое значение;
2. Интерпретировать значение найденных конструкций.
Первый из этих двух шагов связан исключительно с распо-
знаванием, т. е. с выделением базовых синтаксических конструк-
Базовые синтаксические Лексические единицы
конструкции
wcm : procedure ( RATE , START ,









FINISH ) ;


DECLARE ( COST , RATE , START , FINISH ) FIXED











BINARY ( 31 ) STATIC ;





BINARY ( 31 ) STATIC ;
Оператор декларации
COST = RATE * ( START - FINISH ) + 2 * RATE *














( START - FINISH - 100 ) ;







RETURN ( COST ) ;




END ;

Рис. 8.4. Синтаксический анализ — разбиение программы на синтаксические
единицы.
ций в исходной программе. Этот процесс известен как синтаксический анализ. В нашем примере в качестве фраз мы произвольно взяли операторы языка. Вся программа просматривается и разделяется на фразы, как показано на рис. 8.4.
При синтаксическом анализе отмечаются также синтаксические ошибки и осуществляются некоторые действия, позволяющие продолжить поиск других ошибок. Некоторые компиляторы пробуют предугадать ошибки программиста и исправляют их.
После того как синтаксис оператора определен, следующий шаг состоит в интерпретации его значения (семантики). Каждой синтаксической конструкции соответствует определенное значение. Оно может быть выражено в форме реальных кодов либо в промежуточной форме.
Существует много способов распознавания базовых конструкций (синтаксический анализ) и интерпретации их значений. Во второй части этой главы мы рассмотрим некоторые общие методы. Все они используют правила (редукции), которые определяют синтаксис исходного языка. Эти редукции определяют базовые синтаксические конструкции и соответствующую компиляторную программу (программу интерпретации), которая должна выполняться при распознавании конструкции. Эти программы интерпретируют значение конструкций и генерируют либо код, либо промежуточную форму конструкции. Например, редукция может быть такая: «если за идентификатором следует знак = , необходимо вызвать подпрограмму
‘ ARIFMETICSTM’».
8.1.3. ПРОМЕЖУТОЧНАЯ ФОРМА
После того как синтаксическая конструкция определена, компилятор для каждой конструкции может генерировать объектный код. Однако обычно исходная программа сначала преобразуется в некоторую промежуточную форму. Промежуточная форма имеет два преимущества:
-
Облегчает оптимизацию объектного кода.
-
Позволяет логически отделить машинно-независимые фазы (лексический анализ, синтаксический анализ и интерпретацию) от машинно-зависимых фаз (генерация кода и сборка).
При использовании промежуточной формы возникают два вопроса: (1) какова должна быть эта форма и (2) каковы правила преобразования исходной программы в эту форму? Форма зависит от синтаксических конструкций: например, может быть различной для арифметических, неарифметических или неиспол-няемых операторов.
8.1.3.1. Арифметические операторы
Промежуточной формой арифметического оператора является дерево грамматического разбора. С помощью формальных методов, рассмотренных в предыдущей главе (например, общее синтаксическое дерево в упражнении 1 гл. 7), можно получить дерево грамматического разбора, изображенное на рис. 8.5. Правила преобразования арифметического оператора в дерево грамматического разбора следующие:
-
Любая переменная является терминальным узлом дерева.
-
Операции порождают (в порядке, определяемом правилами алгебры) двоичное дерево, в котором левая ветвь соответствует первому операнду, а правая — второму операнду,
Дерево арифметического оператора нашей программы представлено на рис. 8.5.
Хотя дерево и удобно для визуального представления структуры оператора, непосредственное его использование компилятором затруднительно.
В качестве промежуточной формы компилятор использует линейное представление дерева грамматического разбора в виде
матрицы. В матрице операции располагаются в порядке их исполнения. Каждая строка матрицы содержит операцию и два операнда.
COST = RATE * ( START - FINISH ) + 2 * RATE *













( START - FINISH - 100 ) ;







=
COST +
*
RATE -
START *
FINISH * -
2 RATE
-
START FINISH
Рис. 8.5. Дерево — промежуточная форма арифметического оператора нашей
программы.
Операнды представляются стандартными символами, обозна-
чающими переменные, литералы или другие строки матрицы Mi
(i — номер строки матрицы). Матрица, которая генерируется для арифметического оператора, показана на рис. 8.6. (Для облегчения чтения в матрице пишутся сами символы, а не их стандартное представление.)
Номер строки матрицы | Операция | Операнд 1 | Операнд 2 |
1 | - | START | FINISH |
2 | * | RATE | M1 |
3 | * | 2 | RATE |
4 | - | START | FINISH |
5 | - | M4 | 100 |
6 | * | M3 | M5 |
7 | + | M2 | M6 |
8 | = | COST | M7 |
Рис 8.6. Матрица для арифметического оператора.
Дерево (рис. 8.5) и матрица (рис. 8.6) являются эквивалентными представлениями оператора присваивания. Читатель может построить дерево такого оператора, используя правила элементарной алгебры. Процесс построения дерева или матрицы арифметического оператора рассматривается во многих книгах по компиляторам. Мы оставляем это как упражнение для читателя (см. упражнение 1 в гл. 7).
8.1.3.2. Неарифметические операторы
Задачаn создания промежуточной формы для неарифметических исполняемых операторов аналогична той же задаче для арифметических операторов. Операторы DO, IF, GO TO и т. д.
Исходная программа | Матрица | ||
Операция | Операнд 1 | Операнд 2 | |
R | RETURN | COST | |
E | END |
Рис. 8.7. Часть матрицы для операторов RETURN и END
.
все могут быть заменены последовательным упорядочиванием отдельных элементов матрицы (рис. 8.7). Соответствующие операции в матрице определяются последующими фазами компилятора так, чтобы можно было получить правильный код.
8.1.3.3. Неисполняемые операторы
Неисполняемые операторы, подобные DECLARE, дают компилятору информацию о переменных и связанной с ними памяти. Для них не существует промежуточной формы. Информация, содержащаяся в неисполняемых операторах, переносится в таблицы для использования другими блоками компилятора. Например, с помощью оператора DECLARE нашей программы интерпретирующая фаза определит тип данных, точность и тип памяти (FIXED BINARY, 31 бит, SТАТIС) в таблице идентификаторов для каждой из переменных СОSТ, RАТЕ, SТАRТ и FINISH (как показано на рис. 8.8).
В языках высокого уровня, подобных ПЛ/1, в некоторых случаях распределение памяти и определение переменных откладываются до времени выполнения программы, поэтому часть таблиц используется также объектной программой. Так что некоторая описательная информация передается и объектной программе.
До сих пор мы рассматривали лексический анализ, синтаксический анализ и интерпретацию (семантику). Теперь рассмотрим последние две задачи, связанные с реализацией примера программы на языке ПЛ/1.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.