BAULA1 (1110624), страница 9
Текст из файла (страница 9)
нельзя – она требует несуществующего формата команды пересылки mov m8,m8 . Здесь, однако, хорошо подходит наша новая команда пересылки короткого целого числа movsb, с её помощью заключённый в рамку фрагмент программы можно записать в виде:
jcxz L1
cld
L: movsb
loop L
Теперь в нашем цикле пересылки массива осталось всего две команды, следовательно сложность нашего алгоритма снизилась до 4*N операций обмена. Для дальнейшего ускорения выполнения таких циклов в язык машины была включена специальная команда цикла rep, которая называется префиксом повторения. Она похожа на команду loop, но не имеет явного операнда – метки перехода на начало цикла. Эта метка не нужна, так как в теле цикла rep может находиться только одна, непосредственно следующая за ней команда, другими словами, пара команд
rep <строковая команда>
выполняется по схеме
while cx<>0 do begin
dec(cx); <строковая команда>
end;
С использованием этой новой команды цикла заключенный в рамку фрагмент нашей программы пересылки массива можно записать уже совсем кратко в виде:
cld
rep movsb
Заметим, что хотя rep и является служебным словом (кодом операции), но его часто пишут на месте метки (в качестве первого поля предложения Ассемблера), так как служебное слово нельзя спутать с именем, заданным пользователем. Пара команд rep movsb является тесно связанной, они вместе выбираются на регистр команд центрального процессора, так что в цикле пересылки массива нет необходимости обращаться в память за командами. Теперь сложность нашего алгоритма снизилась до теоретического минимума в 2*N операций, т.е. это позволило значительно поднять эффективность пересылки массива.1
Разберёмся теперь с назначением флага направления DF. Отметим сначала, что этот флаг позволяет производить пересылку массива в прямом направлении (от первого элемента к последнему) при значении DF=0 и в обратном направлении (от последнего элемента массива к его первому элементу) при DF=1, отсюда и название флага – флаг направления пересылки массива.
Пересылка массива в обратном направлении – не прихоть программиста, а часто единственный способ правильного присвоения значений массивов. Правда следует сразу сказать, что флаг направления влияет на правильное присваивание одному массиву значения другого массива только в том случае, если эти массивы перекрываются в памяти (т.е. один массив полностью или частично занимает то же место в памяти, что и второй массив). В качестве примера на рис. 9.1 показано два случая перекрытия массивов A и B в памяти. Из этого рисунка видно, что для случая 9.1 а) необходима пересылка в прямом направлении с флагом DF=0, а для случая 9.1 б) правильный результат присваивания массивов получается при обратном направлении пересылки элементов массива с флагом DF=1.
Массив В | Массив А | |||||
| ||||||
| ||||||
| Массив В | |||||
| . . . | |||||
| ||||||
| . . . | |||||
а). Должно быть DF=0 | б). Должно быть DF=1 | |||||
Рис. 9.1. Два случая перекрытия массивов в памяти при пересылке. |
Перекрытие массивов при пересылке часто встречается в практике программирования. Типичным примером является работа текстового редактора, когда при операции вставки и удаления фрагментов текста приходится раздвигать или сжимать редактируемый текст.
Упражнение. Определите, какие значения должен иметь флаг направления DF при операции встаки и при операции удаления участка редактируемого текста.
Продолжим изучение строковых команд. Команды сравнения двух операндов cmpsb и cmpsw имеют тот же формат память-память, что и команды movsb и movsw. Команды cmpsb и cmpsw выполняются по схеме:
cmp <ds,si>,<es,di>; φ(di); φ(si)
т.е. производится сравнение между собой двух коротких или длинных целых чисел и соответствующим образом устанавливаются флаги (так же, как при выполнении команды сравнения).
Как мы знаем, команды сравнения необходимы для работы команд условного перехода. С командами сравнения cmpsb и cmpsw удобно использовать команды-префиксы повторения repe/repz и repne/repnz. Эти команды похожи на команду rep, но обеспечивают возможность досрочного выхода из цикла по значению флага ZF=0 (для команд repe/repz) и ZF=1 (для команд repne/repnz).
В качестве примера рассмотрим следующую задачу. Как мы знаем, строки текста можно сравнивать между собой не только на равенство и неравенство, но и с помощью других операций отношения (больше, меньше и т.д.). При этом строки считаются упорядоченными в так называемом лексикографическом порядке (а по-простому – как в словаре). С помощью строковых команд и префиксов повторения операцию сравнения двух строк можно так реализовать на Ассемблере (правда, здесь строки одинаковой длины, сравнение строк разной длины реализуется более сложно):
N equ 20000
Data segment
X db N dup (?)
Y db N dup (?)
. . .
Data ends
Code segment
assume cs:Code,ds:Data,es:Data,ss:Stack
. . .
mov cx,N
cld
lea si,X
lea di,Y
repe cmpsb
je EQ; Строки X и Y равны
jb LT; Строка X меньше Y
ja GT; Срока X больше Y
В нашем примере сравниваемые строки для простоты расположены в одном сегменте (сегменте данных). Как видим, основная часть работы – последовательное сравнение в цикле символов двух строк до первых несовпадающих символов или до конца строк – выполняется двумя тесно связанными командами repe cmpsb .
Остальные строковые команды имеют формат регистр-память, но они тоже ориентированы на задачи обработки строк (массивов) коротких и длинных целых чисел. Команды сканирование строки являются командами сравнения и, при использовании в цикле, хорошо подходят для поиска в строке заданного короткого (scasb) или длинного (scasw) целого значения. Эти команды отличаютсяя только битом размера аргументов w и имеет два неявных операнда op1 и op2, где op1=al для w=0, и op1=ax для w=1, а второй неявный операнд op2=<es,di> является соответственно байтом или словом. Если обозначить буквой r соответственно регистры al или ax, то схему выполнения команд сканирования строки можно записать так:
cmp r,<es,di>; φ(di)
Для иллюстрации использования команды сканирования напишем фрагмент программы для реализации следующей задачи: в массиве длинных целых чисел найти номер последнего нулевого элемента (пусть элементы нумеруются с единицы). Если в массиве нет нулевых элементов, то будем в качестве ответа выдавать номер ноль.
N equ 20000
D segment
. . .
X dw N dup (?)
. . .
D ends
C segment
assume cs:C,ds:D,es:D,ss:Stack
Start:mov ax,D
mov ds,ax
mov es,ax
. . .
mov cx,N; Число элементов
sub ax,ax; Образец для поиска=0
lea si,X+2*N-2; Последний элемент
std ; Обратный просмотр
repne scasw
jnz NoZero; Нет нулевых элементов
inc cx; Номер последнего нулевого
NoZero:outword cx
Заметим, что выход из нашего цикла возможен при попадании на нулевой элемент массива, при исчерпании счётчика цикла, а также при совпадении обоих этих условий. Следовательно, после команд repne scasw необходимо проверить, имел ли место случай просто выхода из цикла без нахождения нулевого элемента, что мы и сделали командой условного перехода jnz NoZero .
Следующими рассмотрим команды загрузки элемента строки, которые являются командами пересылки и, при использовании в цикле, хорошо подходят для эффективной последовательной загрузки на регистр коротких (lodsb) или длинных (lodsw) элементов целочисленного массива. Эти команды отличаются только битом размера аргументов w, и имеют два неявных операнда op1 и op2, где op1=al для w=0, и op1=ax для w=1, а второй неявный операнд op2=<ds,si> является соответственно байтом или словом. Если обозначить буквой r регистры al или ax, то схему выполнения этих команд можно записать так:
mov r,<ds,si>; φ(si)
В качестве примера использования команды загрузки напишем фрагмент программы для реализации следующей задачи: найти сумму тех элементов беззнакового массива коротких целых чисел, значения которых больше 100. Если в массиве нет таких элементов, то будем в качестве ответа выдавать число ноль.
N equ 10000
D segment
. . .
X db N dup (?)
. . .
D ends
C segment
assume cs:C,ds:D,ss:Stack
Start:mov ax,D
mov ds,ax
. . .
mov cx,N; Число элементов
sub dx,dx; Сумма=0
lea si,X; Адрес первого элемента
cld ; Прямой просмотр
L: lodsb
cmp al,100
jbe NoSum
add dl,al; Суммирование
adc dh,0; Прибавление CF
NoSum:loop L
outword dx
При суммировании коротких целых чисел мы получаем в качестве результата длинное целое число на регистре dx.
Последними в этом формате SS рассмотрим команды сохранения элемента строки, которые являются командами пересылки и, при использовании в цикле, хорошо подходят для эффективного присваивания всем элементам массива заданного короткого (stosb) или длинного (stosw) целого значения. Эти команды отличаются только битом размера аргументов w, и имеют два неявных операнда op1 и op2, где второй неявный операнд op2=al для w=0, и op2=ax для w=1, а первый неявный операнд op1=<es,di> является соответственно байтом или словом. Если обозначить буквой r регистры al или ax, то схему выполнения команд можно записать так:
mov <es,di>,r; φ(di)