Л.Е. Карпов - Системы программирования (1114903), страница 8
Текст из файла (страница 8)
В обычных языках программирования лексемами являются числа(десятичные целые, вещественные), идентификаторы, служебные слова, разделители.Задачей лексического анализатора является замена разнообразных элементов текстастандартно выглядящими лексемами, которые в дальнейшем будет легче обрабатыватьв других частях компилятора. Лексический анализ сопровождается исключениемнезначащих фрагментов текстов программ, например, комментариев.
Для тех языков, вкоторых имеются макросредства, дополнительно выполняется расширениемакровызовов. Подробнее задачи и проблемы лексического анализа рассматриваются впособии “Формальные грамматики и языки. Элементы теории трансляции”.Синтаксический и семантический анализаторы. Про гр амма должна бытьпроверена на синтаксическую и семантическую правильность (должно быть проверенособлюдение контекстных условий), разделена на составные части, для каждой изкоторых должно быть сформировано внутреннее представление. В таблицытранслятора должна быть занесена вся информация, которую можно извлечь изобрабатываемой программы.
Подробнее задачи и проблемы синтаксического исемантического анализа рассматриваются в разделе 3 .3 .2 и в пособии “Формальныеграмматики и языки. Элементы теории трансляции”.Внутреннее представление исходной программы. Внутреннее представлениеисходной программы в компиляторе в наибольшей степени зависит от той обработки,которой должна подвергнуться программа. Некоторые виды внутреннегопредставления больше подходят для фиксации структуры компилируемой программы,другие ориентированы на проведение оптимизирующих преобразований, третьинаиболее удобны при синтезе (генерации) результата компиляции.
Более подробновнутреннее представление программ в компиляторах рассматривается в разделе 3.3.3 ив пособии “Формальные грамматики и языки. Элементы теории трансляции”.Фазы оптимизации программ. Оптимизация – важнейшая задача компилятора.Языки высокого уровня, не связанные напрямую с особенностями конкретнойаппаратуры, на которой должны выполняться программы, без оптимизации не могутиспользоваться для создания эффективных программ. Оптимизация программ можетпроводиться в интересах различных свойств программ.
Обычно используют двестратегии оптимизации: оптимизация в целях повышения скорости работы программыи оптимизация в целях уменьшения размеров программ. Методы, используемые приреализации этих стратегий часто противоположны, хотя некоторые из них близки другк другу. Более подробно проблемы оптимизации программ в компиляторахрассматриваются в разделе 3.3.4.Фазы синтеза программ.
Второй главной работой компилятора являетсягенерация результирующей программы. На выходе компилятора должна бытьпостроена последовательность символов (“цепочка”) выходно ог языка по темправилам, которые предлагаются языком машинных команд или языком ассемблера. В29случае машинных команд распознавателем этой последовательности символов будетвыступать целевая вычислительная система, для которой создается результирующаяпрограмма.Распределение памяти и регистров.
Даже в ассемблерах можно встретитьфрагменты, выполняющие в том или ином виде распределение памяти и регистров. Темболее, подобные действия по формированию зон или блоков памяти, определениюсмещений в этих зонах, приписке регистров некоторым элементам данных,необходимы в компиляторах. При проведении таких действий производитсякомпоновка данных в блоки, выравнивание данных на границы физических элементовпамяти (байтов, слов, страниц), а также по регистрам специального назначения(векторным, регистрам устройства работы с вещественными числами). Более детальнораспределение памяти рассматривается в разделе 3.3.5.Генерация команд и машинно-зависимая оптимизация.
Этап генерациикоманд (кода) проводится в ассемблерах и компиляторах, значительно реже винтерпретаторах. На этом этапе производится окончательное преобразованиевнутреннего представления транслируемой программы к записи на машинном языкеили на языке ассемблера.В интерпретаторе (точнее в трансляторе со смешанной стратегией трансляции)эта часть заменяется программой, которая интерпретирует внутреннее представлениеисходной программы. Однако возникновение программы, готовой к интерпретации иливыполнению в результате работы только компилятора, возможно не всегда.
Многиесовременные языки, среди которых Си, Си++, Java, предлагают другую концепциюпрограммы, основанную на понятии “единицы трансляции”. Использование этихязыков предполагает, что при запуске компилятора компилируется только некотораячасть полной программы, а остальные части добавляются к ней по мере готовностидругими компонентами системы программирования, например, редактором связей.В подобных случаях интерпретацию программы также нельзя проводитьнепосредственно после ее компиляции.
Необходимо сначала подключить к программенедостающие фрагменты, одни из которых (может быть) надо сначалаоткомпилировать, а другие (может быть) добавить из набора уже откомпилированныхпрограмм, либо из библиотек.Более детально проблемы генерации кода рассматриваются в разделе 3.3.6.3.3.1.2. Однопроходный компиляторРазобранная схема работы компилятора является концептуальной. Многиекомпиляторы, однако, построены с отступлениями (иногда значительными) отрассмотренной схемы. Фазы компиляции могут разбиваться на отдельныесоставляющие или, напротив, объединяться друг с другом.
Может даже менятьсяпорядок их выполнения.Выбор той или иной схемы определяется многими обстоятельствами. Одним изкритериев является объем доступной оперативной памяти. Если памяти недостаточно,разработчикам приходится разбивать процесс компиляции на части, передаваяинформацию от одной части к другой через внешнюю память, в которую записываетсяпромежуточное представление транслируемой программы. Существуют и другиекритерии, например, планируемая скорость работы транслятора, степень оптимизациипрограмм.При выполнении каждого прохода компилятору доступна вся информация,накопленная в информационных таблицах на предыдущих проходах. При выполнении30очередного прохода компилятор может также вновь обратиться к исходному текступрограммы.
Пользователю становятся доступными только результаты самогопоследнего прохода – в виде объектной программы, сформированной компилятором,никакие промежуточные результаты компиляции пользователю не видны.Поскольку процедуры чтения из внешней памяти и записи на внешнюю памятьимеют относительно невысокую скорость, разработчики компиляторов всегдастремятся уменьшить количество проходов в своих компиляторах. Для языковпрограммирования, которые строились с учетом возможного упрощения процессатрансляции, удается строить такую схему построения компилятора:Начальные установкиИсходнаяпрограммаТекстЛексическийанализаторОбращение залексемойСинтаксическийанализаторЛексемаВозвратуправленияЗавершениеформированияпрограммыСинтаксическая конструкцияСемантический анализатор,распределитель памяти,генератор командТекст или кодОбъектная программаЛексический анализатор в данном случае работает как сопрограмма дляпрограммы синтаксического анализатора.
Аналогично может работать программасемантического анализа и генератора команд.В современных компиляторах лексический и синтаксический анализаторы – этовзаимосвязанные части общего процесса. Возможны два принципиально различныхметода организации взаимосвязи лексического и синтаксического анализа –последовательный и параллельный.При последовательном варианте лексический анализатор просматривает весьтекст исходной программы от начала до конца и преобразует его в таблицу лексем.Таблица лексем заполняется вся и полностью, компилятор использует ее дляпоследующих фаз компиляции, но не изменяет. Если в процессе работы лексическийанализатор не смог правильно определить тип лексемы, считается, что программасодержит ошибку.
Получающийся в данном случае компилятор никогда не может бытьоднопроходным.Последовательная работа лексического и синтаксического анализаторовпредставляет собой самый простой вариант их взаимодействия. Она проще в31реализации и в определенных условиях обеспечивает более высокую скорость работыкомпилятора, чем параллельное взаимодействие.ИдентификаторыЛексическийанализатор(сканер)ИсходнаяпрограммаТаблицаидентификаторов(таблица имен)ЛексемыСинтаксическийанализаторОбращение залексемойТаблица лексемОчереднаялексема иидентификаторыПри параллельном варианте лексический анализ текста исходной программывыполняется поэтапно.
Лексический анализатор выделяет очередную лексему висходном тексте и сразу передает ее синтаксическому анализатору. После того, каксинтаксический анализатор успешно выполнит разбор очередной законченнойконструкции исходного языка (обычно такой конструкцией является отдельныйоператор исходного языка), лексический анализатор помещает найденные лексемы втаблицу лексем и в таблицу идентификаторов, а затем продолжает разбор дальше в томже порядке. Параллельное взаимодействие лексического и синтаксическогоанализаторов строится по такой схеме:ИдентификаторыЛексическийанализатор(сканер)ИсходнаяпрограммаОчереднаялексемаТаблицаидентификаторов(таблица имен)Обращение залексемойСинтаксическийанализаторПреобразование входного языка. Вторая задача лексического анализатора естьвыполнение действий, связанных с обнаружением и распознаванием той или инойлексемы.