В.Г. Баула - Введение в архитектуру ЭВМ и системы программирования (1110549), страница 23
Текст из файла (страница 23)
Перечислим сначала те преимущества, которые предоставляет модульное программирование. Во-первых, как мы уже отмечали, это возможность писать модули на разных языках программирования. Во-вторых, модуль является естественной единицей локализации имён: как мы говорили, внутри модуля на Ассемблере все имена должны быть различны (уникальны),1 что не очень удобно, особенно когда модуль большой по объёму или совместно пишется разными программистами. Как и в блоке программы на языке Паскаль, имена локализованы в модуле на Ассемблере и не видны из другого модуля, если только это не указано явно с помощью специальных директив.
Следующим преимуществом модульного программирования является локализация места ошибки: обычно исправление ошибки внутри одного модуля не влечёт за собой исправление других модулей (разумеется, это свойство будет выполняться только при хорошем разбиении программы на модули, с малым числом связей между модулями, о чём мы будем говорить далее). Это преимущество особенно сильно сказывается во время отладки программы. Например при внесении изменений только в один мз нескольких десятков модулей прграммы, только он и должен быть заново проверен программой Ассемблером и переведён на язык машины.2 Обычно говорят о малом времени перекомпиляции всей программы при исправлении ошибки в одном модуле, что сильно ускоряет процесс отладки всей программы.
Разумеется, за всё надо платить, у модульного программирования есть и свои слабые стороны. Во-первых, модули не являются совсем независимыми друг от друга: между ними существуют связи, то есть один модуль иногда может использовать переменные и программный код другого модуля. Необходимость связей между модулями естественно вытекает из того факта, что модули совместно решают одну общую задачу, при этом каждый модуль выполняет свою часть задачи. Связи между модулями на Ассемблере должны быть явно заданы при описании этих модулей.
Во-вторых, теперь перед счётом программы необходим особый этап сборки программы из составляющих её модулей. Этот процесс достаточно сложен, так как кроме собственно сборки программы из модулей, необходимо проконтролировать и установить все связи между модулями.3 Сборки программы из модулей производится специальной системной программой, которая называется редактором внешних связей между модулями.
В-третьих, так как теперь наш Ассемблер никогда не видит всей исходной программы одновременно, то, следовательно, и не может получить полностью готовую к счёту программу на машинном языке. Более того, в каждый момент времени он видит только один модуль, и не может проконтролировать, правильно ли установлены связи между модулями. Ошибка в связях теперь выявляется на этапе сборки программы из модулей, а иногда только на этапе счёта, если используется так называемое динамическое связывание модулей, обо всём этом мы будем говорить далее. Позднее обнаружение ошибок связи между модулями может существенно замедлить процесс отладки программы.
Несмотря на отмеченные недостатки, преимущества модульного программирования так велики, что сейчас это главный способ разработки программного обеспечения. Теперь мы начнём знакомиться с особенностями написания модульной программы на языке Ассемблера.
10.1. Модульное программирование на Ассемблере.
Как мы уже говорили, программа на Ассемблере может состоять из нескольких модулей. Исходным (или входным) программным модулем на Ассемблере называется текстовый файл, состоящий из предложений языка Ассемблер и заканчивающийся специальной директивой с именем end – признаком конца модуля.
Среди всех модулей, составляющих программу, должен быть один и только один модуль, который называется головным модулем программы. Признаком головного модуля является параметр-метка у директивы end конца модуля, в учебниках такую метку часто называют именем Start, хотя это, как мы отмечали, несущественно и можно выбрать любое подходящее имя. Эта метка должна быть меткой команды, которая находится в одном из сегментов головного модуля. Именно этот сегмент по определению будет кодовым сегментом и содержать первую выполняемую команду всей программы. Перед началом счёта программы загрузчик установит на начало этого кодового сегмента регистр CS, а в счётчик адреса IP запишет смещение указанной метки начальной команды в сегменте кода.
Как уже отмечалось, модули не могут быть абсолютно независимыми друг от друга, так как решают разные части одной общей задачи, и, следовательно, хотя бы время от времени должны обмениваться между собой информацией. Таким образом, между модулями существуют связи. Говорят, что между модулями существуют связи по управлению, если один модуль может передавать управление (с возвратом или без возврата) на программный код в другом модуле. В архитектуре нашего компьютера для такой передачи можно использовать одну из команд перехода.
Кроме связей по управлению, между модулями могут существовать и связи по данным. Связи по данным предполагают, что один модуль может иметь доступ к областям памяти (переменным) в другом модуле. Частным случаем связи по данным является и использование одним модулем целочисленной константы, определённой в другом модуле (в Ассемблере такая константа может объявляться, например, директивой эквивалентности equ).
Связи между модулями реализуются в виде адресов, для нашей архитектуры это одно число (близкий адрес) или два числа (дальний адрес – значение сегментного регистра и смещения в сегменте).1 Действительно, чтобы выполнить команду из другого модуля, а также считать или записать значение в переменную, нужно знать месторасположение (адрес) этой команды или переменной. Заметим, что численные значения связей между модулями (значения адресов) невозможно установить на этапе компиляции модуля, так как будущее расположение модулей в памяти во время счёта неизвестно на этапе компиляции.
Связи между модулями будем называть статическими, если численные значения этих связей (т.е. адреса) известны до начала счёта программы (до выполнения её первой команды). В отличие от статических, значения динамических связей между модулями становятся известны только во время счёта программы. Вскоре мы приведём примеры статических и динамических связей, как по данным, так и по управлению.
На языке Ассемблера связи между модулями задаются с помощью специальных директив. Директива
public <список имён модуля>
объявляет перечисленные в директиве имена общедоступными, т.е. разрешает использование этих имён в других модулях. В некоторых модульных системах программирования про такие имена говорится, что они экспортируются в другие модули.2 В Ассемблере вместе с каждым именем экспортируется и его тип. Как мы уже знаем, для имён, использованных в директивах резервирования памяти, тип имени определяет длину области памяти, а для меток их тип равен –1 для близкой метки и –2 для дальней. Остальные имена (имена сегментов, имена констант в директивах эквивалентности и другие) имеют тип ноль. Тип имени в принципе позволяет проводить контроль использования этого имени в другом модуле. Все остальные имена модуля, кроме имён, перечисленных в директивах public, являются локальными и не видны извне (из других модулей).
Экспортируемые имена одного модуля не становятся автоматически доступными в других модулях. Для получения доступа к таким именам этот другой модуль должен, с помощью специальной директивы, явно объявить о своём желании использовать общедоступные имена первого модуля. Это делается с помощью директивы
extrn <имя:тип>,...,<имя:тип>
В этой директиве перечисляются внешние имена, которые используются в этом модуле, но не описаны в нём. Внешние имена должны быть описаны и объявлены общедоступными в других модулях. Вместе с каждым внешним именем объявляется и тип, который должно иметь это имя в другом модуле. Проверка того, что это имя в другом модуле на самом деле имеет такой тип, может проводиться только на этапе сборки из модулей готовой программы, о чём мы будем говорить далее.
Таким образом, для установления связи между двумя модулями первый модуль должен разрешить использовать некоторые из своих имён в других модулях, а второй модуль – явно объявить, что он хочет использовать внутри себя такие имена. В языке Ассемблера общедоступные имена называются входными точками модуля, что хорошо отражает суть дела, так как только в эти точки возможен доступ к модулю извне (из других модулей). Внешние имена модуля называются внешними адресами, так как это адреса областей памяти и команд, а также значения констант в других модулях.
Все программы, которые мы писали до сих пор, на самом деле состояли из двух модулей, но один из них с именем ioproc мы не писали сами, он поставлялся нам в готовом виде. Этот второй модуль содержит процедуры ввода/вывода, к которым мы обращаемся с помощью наших макрокоманд (inint, outint и других). Теперь настало время написать программу, которая будет содержать два наших собственных модуля, и модуль ioproc (так как без ввода/вывода нам, скорее всего, не обойтись).
В качестве примера напишем программу, которая вводит массив A знаковых целых чисел и выводит сумму всех элементов этого массива. Ввод массива и вывод результатов будет выполнять головной модуль нашей программы, а подсчёт суммы элементов массива будет выполнять процедура, расположенная во втором модуле программы. Для иллюстрации использования связей между модулями мы не будем делать процедуру суммирования полностью со стандартными соглашениями о связях, она будет использовать глобальные имена для получения своих параметров, выдачи результата работы и диагностики об ошибке.
Текстовый файл, содержащий первый (головной) модуль нашей программы, мы, не долго думая, назовём p1.asm, а файл второго модуля с процедурой суммирования – p2.asm. Ниже приведён текст первого модуля.
; p1.asm
; Ввод массива, вызов внешней процедуры
include io.asm
St segment stack
dw 64 dup (?)
St ends
N equ 1000
Data segment public
A dw N dup (?)
public A,N; Входные точки
extrn Summa:word; Внешняя переменная
Diagn db 'Переполнение!',13,10,'$'
Data ends
Code segment public
assume cs:Code,ds:Data,ss:St
Start:mov ax,Data
mov ds,ax
mov cx,N
sub bx,bx; индекс массива
L: inint A[bx];Ввод массива A
add bx,type A
loop L
extrn Sum:far; Внешнее имя
call Sum; Процедура суммирования
outint Summa
newline
; А теперь вызов с ошибкой
mov A,7FFFh; Maxint
mov A+2,1; Для переполнения
call Sum
outint Summa; Сюда возврата не будет
newline
finish ; Вообще-то не нужен
public Error; Входная точка
Error:lea dx,T
outstr
finish
Code ends
end Start; головной модуль
В нашем головном модуле три входные точки с именами A,N и Error и два внешних имени: Sum, которое имеет тип дальней метки, и Summa, которое имеет тип слова. Работу программы подробно рассмотрим после написания текста второго модуля с именем p2.asm.
Comment * модуль p2.asm
Суммирование массива, контроль ошибок
include io.asm не нужен – нет ввода/вывода
Используется стек головного модуля
В конечном end не нужна метка Start
*
Data segment public
Summa dw ?
public Summa; Входная точка
extrn N:abs; Внешняя константа
extrn A:word; Внешний адрес
Data ends
Code segment public
assume cs:Code,ds:Data
public Sum; Входная точка
Sum proc far
push ax
push cx
push bx; сохранение регистров
xor ax,ax; ax:=0
mov cx,N
xor bx,bx; индекс 1-го элемента