Лекции Баулы (1110628), страница 7
Текст из файла (страница 7)
A = A; * A = ; A * = ; и т.д.
При изучении архитектуры ЭВМ вещественные числа не будут представлять для нас большого интереса и поэтому (а также из-за недостатка времени) операции над вещественными числами мы изучать не будем.
Целые числа
Каждое хранимое в памяти целое число может трактоваться программистом как знаковое и беззнаковое (неотрицательное). По внешнему виду невозможно определить, какое число храниться в определённом месте памяти, только сам программист может знать, как от рассматривает это число. Таким образом, определены две машинные системы счисления, для представления знаковых и беззнаковых чисел соответственно.
Беззнаковые (неотрицательные) числа представляются в уже известной Вам двоичной системе счисления, такое представление называется прямым кодом неотрицательного числа. Например, десятичное число 13, хранимое в одном байте, будет записано как прямой код 00001101.
Если инвертировать прямой код (т.е. заменить все "1" на "0", а все "0" на "1"), то получим так называемый обратный код числа. Например, обратный код числа 13 равен 11110010.
Для представления отрицательных знаковых чисел используется так называемый дополнительный код. Например, получим дополнительный код числа –13.
Прямой код = 00001101
Обратный код = 11110010
Дополнительный код = 11110011
Итак, в знаковой системе счисления отрицательные числа представляются в дополнительном коде, а неотрицательные – в прямом коде. Заметим, что при знаковой трактовке целых чисел крайний правый бит определяет знак числа ("1" для отрицательных чисел). Этот бит называется знаковым битом целого числа.
Процесс перехода из прямого кода в дополнительный и обратно с технической точки зрения очень прост и может быть легко реализован в центральном процессоре.
Очень важно понять, что все арифметические операции над знаковыми и беззнаковыми целыми числами производятся абсолютно по одинаковым алгоритмам, что естественно, потому что центральный процессор "не знает", какие это числа "на самом деле". В то же время, с точки зрения программиста, результаты таких операций могут быть разными для знаковых и беззнаковых чисел.
Рассмотрим примеры сложения двух чисел длиной в байт. В первом столбике записано внутреннее двоичное представление чисел, а во втором и третьем – беззнаковое и знаковое десятичное представления этих же чисел.
-
Пример 1.
Б/з. | Зн. | |
11111100 | 252 | –4 |
00000101 | 5 | 5 |
1|00000001 | 1 | 1 |
Из этого примера видно, что для знаковой трактовки чисел операция сложения выполнена правильно, а при рассмотрении чисел как беззнаковые результат будет неправильным, так как мы получим девятизначное двоичное число, не "умещающееся" в один байт. Так как центральный процессор "не знает", как программист будет трактовать складываемые числа, то от "на всякий случай" сигнализирует о том, что при сложении беззнаковых чисел произошла ошибка. Для обозначения таких (и некоторых других) ситуаций в архитектуре введено понятие флагов. Каждый флаг занимает один бит в специальном регистре флагов (FLAGS). В данном случае флаг CF (carry flag) примет значение, равное единице (иногда говорят – флаг поднят). Рассматривая результат в знаковых числах, мы получили правильный ответ, в связи с чем соответствующий флаг OF (overflow flag) будет положен равным нулю (опущен).
-
Пример 2.
Б/з. | Зн. | |
01111001 | 121 | 121 |
00001011 | 11 | 11 |
10000100 | 132 | -124 |
В данном примере ошибка будет, наоборот, в случае со знаковой трактовкой складываемых чисел, поэтому флаги CF и OF принимают соответственно значения 0 и 1.
-
Пример 3.
11110110 | 246 | –10 |
10001001 | 137 | –119 |
101111111 | 383 | +127 |
В данном случае результат будет ошибочен как при беззнаковой, так и при знаковой трактовке складываемых чисел. Содержимое флагов: CF = OF = 1.
Представление отрицательных чисел в дополнительном коде не очень удобно для программистов, однако позволяет существенно упростить арифметико-логическое устройство. Заметим, например, что вычитание можно выполнять как сложение с дополнительным кодом числа.
Сегментация памяти
Память нашей ЭВМ имеет уже знакомую нам сегментную организацию. В любой момент времени для младшей модели определены четыре сегмента (хотя для старших моделей число сегментов может быть и больше). Это означает, что есть четыре сегментных регистра, которые указывают на определённые области памяти. Извлекать из памяти числа или команды можно только относительно одного из них этих регистров. Таким образом, физический адрес вычисляется по формуле A := (B + d) mod 220, где B – база, а d – смещение. Физический адрес берётся по модулю 220, чтобы он не вышел за максимальный адрес памяти.
В качестве мнемонических обозначений сегментных регистров выбраны следующие: кодовый сегментный регистр (CS), сегментный регистр данных (DS), сегментный регистр стека (SS) и дополнительный сегментный регистр (ES). Каждый из них может адресовать сегмент памяти длиной до 216 байт (напомним, что вся память состоит из 220 ячеек). Стоит отметить, что сегментные регистры являются специализированными, предназначенными только для хранения адресов сегментов, поэтому арифметические операции над их содержимым не предусмотрены. Так как адрес в приведённой формуле берётся по модулю 220, очевидно, что память «замкнута в кольцо». Таким образом, в одном сегменте могут находиться ячейки с самыми большими и самыми маленькими адресами основной памяти.
Мнемонические обозначения регистров
В силу того, что в ЭВМ все регистры имеют безликие адреса, аналогичные ячейкам основной памяти, программисты предпочитают использовать мнемонические обозначения регистров. Регистры общего назначения, каждый из которых может складывать, вычитать и просто хранить данные, а некоторые – умножать и делить, обозначают следующими именами: AX, BX, CX, DX. Для обеспечения многообразия форматов данных каждый из них разбит на две части по 8 бит каждая (биты нумеруются немного непривычно справа-налево, начиная с нуля):
15 | 7 | 0 | ||||
AX | AH | AL | ||||
BX | BH | BL | ||||
CX | CH | CL | ||||
DX | DH | DL | ||||
16 бит |
Каждый из регистров AH, AL, BH, BL, CH, CL, DH и DL может быть использован как самостоятельный регистр, на которых возможно выполнять операции сложения и вычитания.
Существуют также четыре регистра SI, DI, SP и BP, которые также могут использоваться для проведения сложения и вычитания, но уже не делятся на половинки:
15 0 | |
SI | |
DI | |
SP | |
BP | |
16 бит |
Кроме перечисленных выше регистров программист имеет дело с регистром IP (instruction pointer), который называется счётчиком адреса и содержит адрес (точнее, смещение относительно сегментного регистра CS) следующей исполняемой команды.
16 бит | |
IP |
И, наконец, как уже упоминалось, архитектурой изучаемой ЭВМ предусмотрен регистр флагов FLAGS. Он содержит шестнадцать одноразрядных флагов – например, ранее упоминавшиеся флаги CF и OF.
16 бит | |||||
FLAGS | … | CF | … | OF | … |
Все биты в регистрах пронумерованы: в шестнадцатибитных – от 0 до 15, в восьмибитных – от 0 до 7.
Все упомянутые имена регистров являются служебными в языке Ассемблера. Как и в языке Паскаль, в языке Ассемблера принято соглашение по синтаксису имён: регистр символов не различается, таким образом, AX, Ax, aX и ax обозначают один и тот же регистр.
Рассмотрим теперь способ хранения чисел в памяти ЭВМ. Запишем, например, шестнадцатеричное число 1234h в какой-нибудь 16-тиразрядный регистр (каждая шестнадцатеричная цифра занимает по 4 бита):
1 | 2 | 3 | 4 |
Теперь поместим это число в память в ячейки с номерами, например, 100 и 101. Так вот: в ячейку с номером 100 запишется число 34h, а в ячейку 101 – 12h. Говорят, что число представлено в основной памяти (в отличие от регистров) в перевёрнутом виде. Это связано с тем, что в младших моделях ЭВМ при каждом обращении к памяти читался один байт. Чтобы считать слово, было необходимо дважды обратиться к памяти, поэтому было удобно (например, для проведения операция сложения "в столбик") получать сначала младшие цифры числа, а затем – старшие. В современной архитектуре за одно обращение из памяти получают сразу 4, 8 или 16 байт, но из-за совместимости моделей семейства пришлось оставить перевёрнутое представление (и чисел и команд! – вспомним принцип Фон-Неймана) и в старших моделях.
Структура команд
Теперь рассмотрим структуру машинных команд самых распространённых форматов регистр-регистр и регистр-память.
-
Формат регистр–регистр.
6 бит | 1 бит | 1 бит | 1 бит | 1 бит | 3 бита | 3 бита |
КОП | D | w | 1 | 1 | R1 | R2 |
Команды этого формата занимают 2 байта. Первая часть команды – код операции – занимает в команде 6 бит, за ним следуют однобитные поля d и w, где d – бит направления, а w – бит размера аргумента, последующие два бита для этого формата равны 1, а последние две части по 3 бита каждая указывают на регистры – операнды.
Стоит подробнее рассмотреть назначение битов d и w. Бит d задаёт направление выполнения команды, а именно:
<R1> := <R1> <R2> при d = 0
<R2> := <R2> <R1> при d = 1.
Бит w задаёт размер регистров-операндов, имена которых можно определить по следующей схеме:
R1,2 | w = 1 | w = 0 |
000 | AX | AL |
001 | CX | CL |
010 | DX | DL |
011 | BX | BL |
100 | SP | AH |
101 | BP | CH |
110 | SI | DH |
111 | DI | BH |
В младших ЭВМ в таком формате возможна работа лишь с упомянутыми в таблице регистрами. В последующих же моделях семейства возможности этого формата были расширены, но за счёт увеличения длины команды.