Максимов Н.В., Партыка Т.Л., Попов И.И. Архитектура ЭВМ и вычислительных систем (2005) (1186253), страница 9
Текст из файла (страница 9)
Кроме этого, учитываются управляющие («непечатные») символы.Кодирующие (обозначающие) элементы выходного алфавита называются знаками; количество различных знаков в выходном алфавите назовем значностью (-арностью, -ичностью)', количество знаковв кодирующей последовательности для одного символа — разрядностью кода; последовательным кодом является такой, в котором знаки следуют один за другим во времени (например, радио- или оптические сигналы либо передача по двум проводам, 2-жильному кабелю), параллельным — тот, в котором знаки передаютсяодновременно (например, по четырем проводам, 4-жильному кабелю), образуя символ (т. е.
символ передается в один прием, в одинмомент времени).Применительно к азбуке Морзе (AM):• символами являются элементы языкового алфавита (буквыA—Z или А—Я) и цифровой алфавит (здесь — цифры 0—9);• знаками — «точка» и «тире» (или «+» и «-» либо «1» и «О», короче — два любых разных знака);• поскольку знаков два, AM является двузначным (бинарным,двоичным) кодом, если бы их было три, то мы имели бы делос троичным, тернарным, трехзначным кодом;42Глава 1. Вычислительные приборы и устройства...• поскольку число знаков в AM колеблется от 1 (буквы Е, Т) до5 (цифры), здесь имеет место код с переменной разрядностью(в AM часто встречающиеся в тексте символы обозначены более короткими кодовыми комбинациями, нежели редкие символы)Поскольку знаки передаются последовательно (электрическиеимпульсы, звуковые или оптические сигналы разной длины, соответствующие «точкам» и «тире»), AM есть последовательный код(можно представить себе некоторое табло, на котором одновременно вспыхивали бы сочетания лампочек, образующих точки и тире,представляющие передаваемый символ, но авторам не приходилосьслышать о подобных абсурдных приспособлениях)Первые опыты телеграфной и радиосвязи осуществлялись именно посредством AM, причем приемное устройство записывало импульсы переменной длины в виде «точек» и «тире» на движущуюсятелеграфную ленту, однако уже в начале XX в был осуществлен переход на 5-разрядный (5-битовый) телеграфный кодВ табл 1 8 приводится перечень наиболее известных кодов, некоторые из них использовались первоначально для связи, кодирования данных, а затем для представления информации в ЭВМ• код Бодо — 5-разрядный код, бывший в прошлом европейским стандартом для телеграфной связи (другое название —IA-1 — international alphabet #1),• М-2 (российское обозначение) или IA-2 (международное обозначение) — телеграфный код, предложенный Международным Комитетом по телефонии и телеграфии (МККТТ) и заменившийкод Бодо,• ASCII (American Standard Code for Information Interchange) —стандартный 7-битовый код для передачи данных, поддерживает 128 символов, включающих заглавные и строчные симвоТаблица 1 8 Разрядность некоторых наиболее известных кодовКодРазрядностьIA 2 (М2 МККТТ 2)5Baudot (Бодо)5ISO 1 (IA 5 ASCII 7 USASCII ANSI X3 4)7EBCDIC8ASCII 88Hollerith ( Перфокарты Холлерита)121.3.
Информация, кодирование, обработка в ЭВМ43лы латиницы, цифры, специальные значки и управляющиесимволы Этот код, к которому были добавлены некоторыенациональные символы (10 бинарных комбинаций), был принят Международной организацией по стандартизации (ISO)как стандарт ISO 7,• EBCDIC (Expanded Binary Coded Decimal Interchange Code) —8-разрядный код, предложенный фирмой IBM для машин серий IBM/360-375 (внутреннее представление данных в памяти), а затем распространившийся и на системы других производителей,• ASC1I-8 — 8-разрядный код, принятый для внутреннего ивнешнего представления данных в вычислительных системахВключает стандартную часть (128 символов) и национальную(128 символов) Соответственно в зависимости от национальной части, кодовые таблицы различаются (табл 1 9, 1 10,прил 4),• код Холлерита, предложенный для ПК (1913 г ), затем использовавшийся для кодирования информации перед вводом вЭВМ с перфокарт (рис 1 8)Одним из «последних слов» в процессе развития систем символьного кодирования является универсальный код UNICODE(UNIversal CODE) — стандарт 16-разрядного кодирования символовСтандарт UNICODE разработан техническим комитетом, в который вошли представители ряда ведущих фирм Он определяеткоды, обеспечивающие идентификацию различных символов букв,иероглифов, цифр и т д Код может использоваться вместо 7—8-битовых, в том числе и ASCII Поскольку в 16-разрядном UNICODEТаблица I 9 Некоторые кодовые таблицыНаименование кодовойстраницы (Code Page)Интерпретация кодовой страницыLatin- 1Международный стандарт (ISO 8859 1 ) для интерпретации 2 и половины( 1 28-256) кода ASCII таблица предназначена для латиницыLatin 8Международный стандарт (ISO 8859 8) для ивритаLatin СМеждународный стандарт (ISO 8859) для кириллицыCP437Стандарт IBM для интерпретации 2 и половины (128-256) кода ASCIIтаблица предназначена для греческого алфавитаCP850Стандарт IBM для восточноевропейских алфавитовCP852Стандарт IBM для греческого алфавитаCP 862Стандарт IBM для ивритаCP866Стандарт IBM для русской кириллицы44Глава 1.
Вычислительные приборы и устройства.,Таблица 1.10. Фрагменты некоторых кодовых таблицСимволIA-2БодоISO-7EBCDICASCII-8ХоллеритА031041С1А1900В190642С2А2880СОЕ1643СЗA3840D091Е44С4А4820а6181Е1b6282Е2с6383ЕЗd. (точка)1C05, (запятая)ОС09: (двоеточие)1Е? (вопрос)1000Г" II• I6484Е42Е4В4Е8422С6В4С2423В5Е5В40А3F6F5F206III IН,8.и !: ци *|) !|пIIIРис. 1.8. Перфокарта Холлеритаможно закодировать 65 536 символов вместо 128 в ASCII, то отпадает необходимость в создании модификаций таблиц кодов. Это существенно упрощает обработку текстовых файлов, хотя и несколькоувеличивает их размеры.UNICODE охватывает 28 000 букв, знаков, слогов, иероглифовнациональных языков мира, 30 000 мест в UNICODE зарезервировано.
Использование этого резерва дает возможность пользователямвводить математические или технические символы, а также создавать свои собственные символы.1.3. Информация, кодирование, обработка в ЭВМ45Единая стандартизация языковых форматов наводит порядок вмеждународном кодировании алфавитов различных языков.
Здесьучтено также то, что в таких языках, как иврит и арабский, текстпишется справа налево.При передаче данных часто используются избыточные коды, т. е.такие, которые за счет усложнения структуры позволяют повыситьнадежность передачи данных. К ним, в первую очередь, относятсякоды с обнаружением ошибок. Чаще всего это циклические избыточные коды. Простая разновидность такого кода — код с контролем по четности. Широко используется для обнаружения ошибок вблоках данных также код контроля циклической избыточностиCRC. Он определяется на основе содержимого блока данных передего передачей, включается в одно из полей блока, а затем повторновычисляется после передачи.
Несовпадение результатов свидетельствует об ошибке в передаваемом содержимом.Важное значение имеют коды с исправлением ошибок. Использование этих кодов позволяет с большой вероятностью не толькообнаруживать, но и исправлять возникшие при передаче ошибки(код Хемминга, позволяющий исправлять одиночные ошибки, появляющиеся в блоках данных).Кодирование и обработка чиселКроме кодирования символов, в ЭВМ очевидное и важное значение имеют кодирование и представление чисел.Системы счисления.
Мы привыкли считать предметы десятками,сотнями: десять единиц образуют десяток, десять десятков — сотню,десять сотен — тысячу и т. д. Это — десятичная система счисления,которая не является единственно возможной. Существуют, например, двенадцатеричная система счисления (счет идет на дюжины)или римская система счисления.Наиболее естественный способ представления числа в компьютерной системе заключается в использовании строки битов, называемой двоичным числом — числом в двоичной системе счисления (символ также может быть представлен строкой битов илисимвола).Система счисления — способ именования и изображения чиселс помощью символов, имеющих определенные количественные значения.
В зависимости от способа изображения чисел системы счисления делятся на:• непозиционные;• позиционные.f46Глава 1. Вычислительные приборы и устройства...Н е п о з и ц и о н н ы е с и с т е м ы с ч и с л е н и я В непозиционной системе цифры не меняют своего количественного значенияпри изменении их расположения в числе.Самый простой и очевидный пример — система счисления, гдеколичество обозначается I (палочкой / единицей).1 = 1;2 = 11;5 = 11111;10 = 1 1 I I I 1 I I I I.Пусть, далее следующие символы (цифры в гипотетическойсистеме счисления) соответствуют числам (десятичной системесчисления):Я-1;ss-12;х1 - 24;ГЦ) - 60;<8 - 365,и пусть есть правило, по которому число можно записать любойкомбинацией таких символов, чтобы сумма обозначаемых ими чисел была равна заданному числу.Тогда 444 можно записать по крайней мере тремя способами:^Д (365 + 60 + 12 + 6 + 1 ) ;(6 + 1 + 365 + 60 + 12),т.
е. ад^^п = ^яад^.Такая система счисления является непозиционной, так какцифры не меняют своего количественного значения при измененииих расположения в числе.П о з и ц и о н н ы е с и с т е м ы с ч и с л е н и я . В позиционнойсистеме счисления количественное значение каждой цифры зависитот ее места (позиции) в числе.Десятичная система счисления является позиционной, так какзначение каждой цифры зависит от ее места (позиции) в числе.Например,23 = 2 х 10 + 3;32 = 3 х 10 + 2и 23 Ф 32471.3. Информация, кодирование, обработка в ЭВМРимская система счисления является смешанной, так как значение каждой цифры частично зависит от ее места (позиции) в числе.Так, в числах:VII;VI;IVV обозначает 5, а I обозначает 1. Но, с другой стороны, важно, какцифры расположены относительно друг друга:VII = 5 + 1 + 1 = 7;VI = 5 + 1 = 6;IV = 5 - 1 - 4.О с н о в а н и е с и с т е м ы с ч и с л е н и я — количество (Р) различных цифр, используемых для изображения числа в позиционнойсистеме счисления.
Значения цифр лежат в пределах от 0 до Р- 1.В общем случае запись любого числа N в системе счисления соснованием Р будет представлять собой ряд (многочлен) вида:N= ат_{ х />"-' + ат_2 х Р"'-2 + ... + akxPk + ...12s... + а, х Р1 + а0 х Р° + ... + а_\ х Р~ + а_2 х Р + ... + а^ х P .