Методические указания (1114907), страница 7
Текст из файла (страница 7)
Таблица синтаксического анализа состоит из двух частей – функций действий синтаксического анализа action и функции переходов goto. Управляющая программа LR-анализатора функционирует следующим образом. Она определяет sm, текущее состояние на вершине стека, и ai, текущий входной символ. Затем программа обращается к action[sm, ai], ячейке таблицы действий синтаксического анализа, определяемой состоянием sm и символами ai, которая может иметь одно из четырех значений:
-
перенос s, где s – состояние;
-
свертка в соответствии с продукцией A -> β;
-
допуск (accept);
-
ошибка (error);
Рис. 4.1. Модель LR-анализатора
Функция goto получает в качестве аргументов состояние и символ грамматики и возвращает новое состояние.
Конфигурация LR-анализатора представляет собой пару, первый компонент которой – содержимое стека, а второй – непросмотренная часть входного потока: (s0X1s1X2s2…Xmsm, aiai+1…an$).
Следующий шаг синтаксического анализатора определяется текущим входным символом ai и состоянием на вершине стека sm в соответствии со значением ячейки таблицы action[sm, ai]. Конфигурации, получаемые после каждого из четырех типов действий следующие:
-
Если action[sm, ai] = “перенос s”, синтаксический анализатор выполняет перенос, переходя в конфигурацию (s0X1s1X2s2…Xmsmais, ai+1…an$). Синтаксический анализатор переносит в стек текущий входной символ ai и очередное состояние s, определяемое значением action[sm, ai]; текущим входным символом становится ai+1.
-
Если action[sm, ai] = “свертка A -> β”, то синтаксический анализатор выполняет свертку в конфигурацию (s0X1s1X2s2…Xm-rsm-rAs, aiai+1…an$), где s = goto[sm-r, ai], a r – длина β, правой части продукции. Здесь синтаксический анализатор вначале снимает со стека 2r символов (r символов состояний и r символов грамматики), выводя на вершину стека состояние sm-r. Затем вносит в стек A (левую часть продукции) и s, запись из ячейки goto[sm-r, A]. Текущий входной символ при этом не изменяется. Последовательность снимаемых со стека символов грамматики Xm-r+1…Xm всегда соответствуют β, правой части продукции свертки.
-
Если action[sm, ai] = “допуск”, синтаксический анализ завершается.
-
Если action[sm, ai] = “ошибка”, синтаксический анализатор обнаружил ошибку и вызывает подпрограмму восстановления после нее.
Полностью алгоритм LR-анализа приведен ниже. Все LR-анализаторы ведут себя одинаково; единственная разница между ними заключается в таблицах action и goto.
Вход. Входная строка w и таблица LR-анализа с функциями action и goto для грамматики G.
Выход. Если w ϵ L(G), выдается восходящий разбор для w; в противном случае выводится сообщение об ошибке.
Алгоритм. Изначально синтаксический анализатор содержит в стеке начальное состояние s0, а во входном буфере – w$. Затем анализатор выполняет приведенный ниже алгоритм до тех пор, пока не будет достигнуто успешное завершение анализа или не обнаружена ошибка.
Установить указатель ip на первый символ w$;
repeat forever begin
Пусть s – состояние на вершине стека, а a – символ, на который указывает ip
if action[s,a] = “перенос s” then begin
Поместить в стек a, затем s’; переместить ip к следующему входному символу
end
else if action[s,a] = “свертка A -> β” then begin
Снять со стека 2*|β| символов. Пусть s’ – текущее состояние на вершине стека. Поместить в стек A, затем goto[s’,A]; вывести продукцию A -> β.
end
else if action[s,a] = “допуск” then
return
else error()
end
Пример части таблицы LR-анализа.
Состояние | action | goto | |||||||
id | + | * | ( | ) | $ | E | T | F | |
0 | s5 | s4 | 1 | 2 | 3 | ||||
1 | s6 | accept | |||||||
2 | r2 | s7 | r2 | r2 |
-
Поясним обозначения в данной таблице.
si означает перенос и i-е состояние на вершине стека, -
rj означает свертку в соответствии с продукцией номер j,
-
accept означает допуск входной строки,
-
пустая ячейка означает ошибку,
-
В части action находятся терминальные символы грамматики, в части goto, соответственно, нетерминальные.
Восстановление после ошибок при LR-анализе.
LR-анализатор обнаруживает ошибку при обращении к таблице action синтаксического анализа при нахождении там записи об ошибке (при обращении к таблице goto ошибки не выявляются).
Восстановление на уровне фразы реализуется путем проверки каждой ошибочной записи в таблице LR-анализа и принятия решения (на основе знания особенностей языка) о том, какая наиболее вероятная ошибка программиста могла привести к данной ситуации. После этого можно построить подходящую процедуру восстановления после ошибки; возможно, при этом придется изменить вершину стека и/или первые символы входного потока способом, соответствующим данной записи ошибки.
Таким образом, мы можем заполнить каждую пустую ячейку в таблице action указателем на программу обработки ошибок, которая будет выполнять некоторые действия, определенные разработчиком компилятора. Эти действия могут включать вставку символов в стек или входной поток и удаление их оттуда или изменение и перестановку входных символов, как и в случае синтаксического анализатора приоритета операторов. Как и в упомянутом случае, мы не должны допустить возможности зацикливания LR-анализатора. Стратегия, гарантирующая отсутствие зацикливания, требует либо удаления (переноса) из входного потока по меньшей мере одного символа, либо уменьшения стека или достижения конца входного потока. Снятие со стека состояния над нетерминалом следует избегать, поскольку такое изменение удаляет из стека успешно разобранную конструкцию.
Условие:
-
Определить значение функций FIRST и FOLLOW для разработанной грамматики.
-
Построить множество пунктов.
-
Построить диаграмму переходов.
-
Построить таблицу SLR анализатора c учетом вариантов восстановления после ошибок.
-
Проверить правильность построения на трех примерах (один правильный, два неправильных).
Варианты:
№ | Формулировка варианта задания |
| S -> Aa A -> Ab | Bb B -> cB | ε |
| S -> ABC A -> BC | a B -> A | b C -> c | ε |
| S -> AB A -> aAb | Ab | ε B -> bB | b |
| S -> aAb A -> BC | bc B -> Aa C -> c | ε |
| S -> AS | c A -> Aa | Ca C -> cA | c |
| S -> BS | c A -> cB | c B -> Ba | Aa |
| S -> ABc A -> aAb | Ab | ε B -> bB | bA |
| S -> Aa A -> Ac | Bb | ε B -> cB | ε |
| S -> aBS | c A -> cB | c B -> Ba | Aa | ε |
| S -> AC | c A -> Aa | Ca C -> cA | c |
| S -> SA | c A -> Aa | Ca C -> cA | c |
| S -> aAb A -> BS | bc B -> AaC C -> c | ε |
| S -> aB | c A -> cB | c B -> Ba | Aa | ε |
| S -> ABC A -> BC | a B -> A | b C -> c | ε |
| S -> AB A -> aAb | Ab | ε B -> bB | b |
| S -> aAb A -> BC | bc B -> Aa C -> c | ε |
| S -> AS | c A -> Aa | Ca C -> cA | c |
| S -> BS | c A -> cB | c B -> Ba | Aa |
| S -> ABc A -> aAb | Ab | ε B -> bB | bA |
| S -> Aa A -> Ac | Bb | ε B -> cB | ε |
| S -> aBS | c A -> cB | c B -> Ba | Aa | ε |
| S -> AC | c A -> Aa | Ca C -> cA | c |
| S -> AC | c A -> Aa | Ca C -> cA | c |
| S -> SA | c A -> Aa | Ca C -> cA | c |
| S -> aAb A -> BS | bc B -> AaC C -> c | ε |
| S -> aB | c A -> cB | c B -> Ba | Aa | ε |
| S -> ABC A -> BC | a B -> A | b C -> c | ε |
| S -> AB A -> aAb | Ab | ε B -> bB | b |
| S -> aAb A -> BC | bc B -> Aa C -> c | ε |
| S -> AS | c A -> Aa | Ca C -> cA | c |
Пример построения таблицы SLR-анализатора:
-
Исходная грамматика для декларации функции:
-
D -> i(P);
-
P -> iF
-
P -> ε
-
F -> ,iF
-
F -> ε
-
Построим функции FIRST и FOLLOW для грамматики, заданной в условии (подробнее построение этих функций описано в задаче 3).
FIRST(D) = {i} FOLLOW(D) = {$}
FIRST(P) = {i, ε} FOLLOW(P) = {)}