А.В. Ахо, М.С. Лам, Р. Сети, Дж. Д. Ульман - Компиляторы - принципы, технологии и инструментарий (1114947), страница 162
Текст из файла (страница 162)
Цикл должен иметь единственный входной узел, называемый заголовком ()зеадег). Этот входной узел доминирует над всеми узлами цикла, иначе он не является единственной точкой входа в цикл. 2. Должно существовать обратное ребро, ведущее в заголовок цикла. В противном случае поток управления не сможет вернуться в заголовок непосредственно из "цикла", т.е. данная структура циклом в таком случае не является.
Для данного обратного ребра и — д определим естественный цикл ребра (па!пга! !оор о1 Йе ебйе) как д плюс множество узлов, которые могут достичь и, не проходя через 0. Узел д является заголовком цикла. 9.6. Циклы в графах потоков 797 Алгоритм 9.42. Построение естественного цикла обратной дуги Вход; граф потока С и обратная дуга и — д.
Выход: множество !оор, состоящее из всех узлов естественного цикла и — б. Метод: пусть !оор представляет собой 1п,г!). Пометим г! как "посещенный", чтобы поиск не проходил дальше д. Выполним поиск в глубину на обратном графе потока, начиная с хь Внесем все посещенные при этом поиске узлы в !оор. Такая процедура позволяет найти все узлы, достигающие п, минуя 4. а Пример 9.43. На рис.
9.38 имеется пять обратных ребер, заголовки которых доминируютнадхвостами:10- 7,7- 4,4- 3,8- Зи9- 1.Эторебра,которые могут формировать циклы в графе потока. Обратное ребро 10 — 7 имеет естественный цикл !7, 8, 10), поскольку 8 и 1О— единственные узлы, которые достигают 1О, не проходя через 7. Обратное ребро 4 — 7 имеет естественный цикл, состоящий из 14, 5, 6, 7, 8, 101, а следовательно, включающий цикл для ребра 10 — 7.
Таким образом, послелний рассматривается как внутренний цикл, содержащийся в первом. Естественные циклы для ребер 4 — 3 и 8 — 3 имеют один и тот же заголовок— узел 3, а также одно и то же множество узлов 13, 4, 5, 6, 7, 8, 10). Следовательно, эти два цикла надо объединить в один.
Этот цикл содержит два меньших цикла, рассмотренных ранее. Наконец, ребро 9 — 1 в качестве естественного цикла имеет весь граф потока, а потому является внешним циклом. В нашем примере четыре цикла вложены один в другой. Однако типичной является ситуация, когда имеются два цикла, ни один из которых не является подмножеством другого. а В приводимых графах потоков, поскольку все отступающие ребра являются обратными, с каждым отступающим ребром можно связать естественный цикл.
Это утверждение для неприводимых графов несправедливо. Например, неприводимый граф потока на рис. 9.45 имеет цикл, состоящий из узлов 2 и 3. Ни одно из ребер в цикле не является обратным„так что этот цикл не подпадает под определение естественного. Таким образом, мы не идентифицируем данный цикл как естественный, так что он не оптимизируется как таковой. Такое решение приемлемо, поскольку наш анализ циклов может оказаться существенно проще в предположении, что все циклы имеют по одному входному узлу (тем более что на практике неприводимые программы встречаются очень редко). Рассматривая в качестве "циклов" только естественные циклы, мы получаем полезное свойство, что если только два узла не имеют общего заголовка, то они либо непересекающиеся, либо один из них вложен в другой.
Так мы получаем естественное понятие наиболее глубоко вложенного внутреннего цикла (1ппеппоз1 !оор) — это цикл, в который не вложен никакой другой цикл. 798 Глава 9. Машинно-независимые оптимизации Когда два естественных цикла имеют один и тот же заголовок, как на рис. 9.46, сложно сказать, какой из циклов является вложенным. Таким образом, мы будем считать, что когда два естественных цикла имеют один и тот же заголовок, то ни один из них не содержится в другом, — они объединяются и рассматриваются как единый цикл. 3 4 Рис. 9.46. Два цикла с одним и тем же заголовком Пример 9.44. На рис.
9.46 естественными циклами для обратных ребер 3 — 1 и 4 — 1 являются соответственно (1, 2, 3) и (1, 2, 4). Мы объединим их в единый цикл (1,2,3,4). Однако если бы на рис. 9.46 имелось обратное ребро 2 — 1, то его естественным циклом был бы цикл (1, 2) — третий цикл с заголовком 1.
Это множество узлов является истинным подмножеством (1,2,3,4), так что его не надо объединять с другими естественными циклами; оно рассматривается как внутренний цикл, вложенный в другой. о 9.6.7 Скорость сходимости итеративных алгоритмов потоков данных Теперь мы готовы рассмотреть скорость сходимости итеративных алгоритмов. Как говорилось в разделе 9.3.3, максимальное количество итераций, которые может выполнить алгоритм, равно произведению высоты решетки на количество узлов в графе потока.
Во многих анализах потоков данных можно так упорядочить вычисления, что алгоритм будет сходиться за существенно меньшее количество итераций. Интересующее нас свойство заключается в возможности распространения всех важных событий к узлу по некоторому ациклическому пути. Среди рассматривавшихся анализов потоков данных таким свойством обладают достигающие определения, доступные выражения и активные переменные, но не распространение констант. Сформулируем сказанное более конкретно. ° Если определение г1 находится в пч ~В], то существует некоторый ациклический путь из блока, содержащего 4, в В, такой, что И находится во всех пч и Оит вдоль этого пути.
799 9.6. Циклы в графах потоков ° Если выражение х + у нс доступно на входе в блок В, то существует некоторый ациклический путь, демонстрирующий, что либо путь идет от входного узла и не включает инструкции, уничтожающие или генерирующие х+ у, либо путь идет от блока, который уничтожает т. + у, и вдоль этого пути нет последующей генерации х + у. ° Если переменная х активна на выходе из блока В, то существует ацикли- ческий путь от В к использованию к, вдоль которого нет определений х. Мы должны проверить, что в каждом из этих случаев пути с циклами ничего не добавляют. Например, если использование х достигается ог конца блока В вдоль пути с циклом, мы можем убрать этот цикл, чтобы найти более короткий путь, вдоль которого т все равно достигается из В.
Распространение констант, напротив, этим свойством не обладает. Рассмотрим простую программу, в которой имеется один цикл, содержащий базовый блок с инструкциями а=Ь Ъ=с с=1 амоко 1 При первом посещении базового блока с принимает константное значение 1, но и а, и 6 не определены. При втором проходе по циклу мы находим, что и 6, и с принимают константное значение 1. И только на третьем проходе константное значение с, равное 1, достигает переменной а. Если вся полезная информация распространяется вдоль ацнклических путей, мы имеем возможность подобрать порядок посещения узлов в итеративных алгоритмах потоков данных так, чтобы после относительно небольшого количества проходов по узлам мы могли быть уверены, что информация прошла по всем ациклическим путям.
Вспомним из раздела 9.6.3, что если а — 6 — ребро, то номер 6 при упорядочении в глубину меньше номера а, только если это ребро — отступающее. В случае задач потоков данных в прямом направлении желательно посещать узлы в соответствии с их упорядочением в глубину. В частности, модифицируем алгоритм на рис.
9.23, а, заменяя строку 4, в которой выполняется обход базовых блоков графа потока, строкой 1ог(каждый базовый блок В, отличный от входного, в порядке в глубину) ( Пример 9.45. Предположим, что у нас имеется путь, вдоль которого распростра- няется определение г1 3 — 5 — ~ 19 — 35 — 15 — ~ 23 — 45 — 4 -~ 10 — 17 800 Глава 9. Машинно-независимые оптимизации Причина неприводимости графов потоков Имеется одно место, где в общем случае нельзя ожидать приводимости графов потоков.
Если обратить ребра графа потока программы, как это делалось в алгоритме 9.42 при поиске естественных циклов, то можно не получить приводимый граф. Интуитивно причина этого в том, что в то время как в типичной программе циклы имеют один вход, зачастую у них может оказаться несколько выходов, которые становятся входами при обращении ребер. Целые числа в нем указывают номера блоков пути при упорядочении в глубину. Тогда при первом проходе цикла в строках 4-6 на рис. 9.23, и определение г! будет распространяться от о33т [3] в пч [5], оттуда — в о!7т [5] и так до ог3т [35).
Оно не сможет достичь !м [16) в этом проходе, поскольку !б предшествует 35, и пч [16) должно быть вычислено к тому времени, когда д помещается в о!77 [35]. Однако на следующем проходе при вычислении пч [16) г7 будет включено в это множество, поскольку оно находится в огзт [35).