Бьерн Страуструп (Стpаустpуп - Книга о C++), страница 14
Описание файла
Документ из архива "Стpаустpуп - Книга о C++", который расположен в категории "". Всё это находится в предмете "информатика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "информатика" в общих файлах.
Онлайн просмотр документа "Бьерн Страуструп"
Текст 14 страницы из документа "Бьерн Страуструп"
дробной черты, имеют стандартные названия:
Конец строки NL(LF) \n
Горизонтальная табуляция HT \t
Вертикальная табуляция VT \v
Возврат BS \b
Возврат каретки CR \r
Перевод формата FF \f
Сигнал BEL \a
Обратная дробная черта \ \\
Знак вопроса ? \?
Одиночная кавычка ' \'
Двойная кавычка " \"
Нулевой символ NUL \0
Восьмеричное число ooo \ooo
Шестнадцатеричное число hhh \xhhh
Несмотря на их вид, все эти комбинации задают один символ. Тип
символьной константы - char. Можно также задавать символ с помощью
восьмеричного числа, представленного одной, двумя или тремя
восьмеричными цифрами (перед цифрами идет \) или с помощью
шестнадцатеричного числа
(перед шестнадцатеричными цифрами идет \x). Число шестнадцатеричных
цифр в такой последовательности неограничено. Последовательность
восьмеричных или шестнадцатеричных цифр завершается первым символом,
не являющимся такой цифрой. Приведем примеры:
'\6' '\x6' 6 ASCII ack
'\60' '\x30' 48 ASCII '0'
'\137' '\x05f' 95 ASCII '_'
Этим способом можно представить любой символ из набора символов
машины. В частности, задаваемые таким образом символы можно
включать в символьные строки (см. следующий раздел). Заметим, что
если для символов
используется числовая форма задания, то нарушается переносимость
программы между машинами с различными наборами символов.
2.4.4 Строки
Строка - это последовательность символов, заключенная в двойные кавычки:
"это строка"
Каждая строка содержит на один символ больше, чем явно задано:
все строки оканчиваются нулевым символом ('\0'), имеющим
значение 0. Поэтому
sizeof("asdf")==5;
Типом строки считается "массив из соответствующего числа символов",
поэтому тип "asdf" есть char[5]. Пустая строка записывается как
"" и имеет тип char[1]. Отметим, что для любой строки s выполняется
strlen(s)==sizeof(s)-1, поскольку функция strlen() не учитывает
завершающий символ '\0'.
Внутри строки можно использовать для представления невидимых
символов специальные комбинации с \. В частности, в строке можно
задать сам символ двойной кавычки " или символ \. Чаще всего из
таких символов оказывается нужным символ конца строки '\n', например:
cout << "звуковой сигнал в конце сообщения\007\n"
Здесь 7 - это значение в ASCII символа BEL (сигнал), который в
переносимом виде обозначается как \a.
Нет возможности задать в строке "настоящий" символ конца строки:
"это не строка,
а синтаксическая ошибка"
Для большей наглядности программы длинные строки можно разбивать
пробелами, например:
char alpha[] = "abcdefghijklmnopqrstuvwxyz"
"ABCDEFGHIJKLMNOPQRSTUVWXYZ";
Подобные, подряд идущие, строки будут объединяться в одну, поэтому
массив alpha можно эквивалентным образом инициализировать с помощью
одной строки:
"abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";
В строке можно задавать символ '\0', но большинство программ
не ожидает после него встречи с какими-либо еще символами. Например,
строку "asdf\000hjkl" стандартные функции strcpy() и strlen()
будут рассматривать как строку "asdf".
Если вы задаете в строке последовательностью восьмеричных цифр
числовую константу, то разумно указать все три цифры. Запись
этой строки и так не слишком проста, чтобы еще и раздумывать,
относится ли цифра к числу или является отдельным символом.
Для шестнадцатеричных констант используйте два разряда. Рассмотрим
следующие примеры:
char v1[] = "a\x0fah\0129"; // 'a' '\xfa' 'h' '\12' '9'
char v2[] = "a\xfah\129"; // 'a' '\xfa' 'h' '\12' '9'
char v3[] = "a\xfad\127"; // 'a' '\xfad' '\127'
2.4.5 Нуль
Нуль (0) имеет тип int. Благодаря стандартным преобразованиям ($$R.4)
0 можно использовать как константу целого типа, или типа с плавающей
точкой, или типа указателя. Нельзя разместить никакой объект, если
вместо адреса указан 0. Какой из типов нуля использовать, определяется
контекстом. Обычно (но необязательно) нуль представляется
последовательностью разрядов "все нули" подходящей длины.
2.5 Поименованные константы
Добавив к описанию объекта служебное слово const, можно превратить
этот объект из переменной в константу, например:
const int model = 90;
const int v[] = { 1, 2, 3, 4 };
Поскольку константе нельзя ничего присвоить, она должна быть
инициализирована. Описывая какой-либо объект как const, мы гарантируем,
что его значение не изменяется в области видимости:
model = 200; // ошибка
model++; // ошибка
Отметим, что спецификация const скорее ограничивает возможности
использования объекта, чем указывает, где следует размещать объект.
Может быть вполне разумным и даже полезным описание функции с типом
возвращаемого значения const:
const char* peek(int i) // вернуть указатель на строку-константу
{
return hidden[i];
}
Приведенную функцию можно было бы использовать для передачи строки,
защищенной от записи, в другую программу, где она будет читаться.
Вообще говоря, транслятор может воспользоваться тем фактом, что объект
является const, для различных целей (конечно, это зависит от
"разумности" транслятора). Самое очевидное - это то, что для
константы не нужно отводить память, поскольку ее значение известно
транслятору. Далее, инициализатор для константы, как правило (но не
всегда) является постоянным выражением, которое можно вычислить на
этапе трансляции. Однако, для массива констант обычно приходится
отводить память, поскольку в общем случае транслятор не знает,
какой элемент массива используется в выражении. Но и в этом случае
на многих машинах возможна оптимизация, если поместить такой массив
в защищенную от записи память.
Задавая указатель, мы имеем дело с двумя объектами: с самим указателем
и с указуемым объектом. Если в описании указателя есть "префикс"
const, то константой объявляется сам объект, но не указатель на него,
например:
const char* pc = "asdf"; // указатель на константу
pc[3] = 'a'; // ошибка
pc = "ghjk"; // нормально
Чтобы описать как константу сам указатель, а не указуемый объект,
нужно использовать операцию * перед const. Например:
char *const cp = "asdf"; // указатель-константа
cp[3] = 'a'; // нормально
cp = "ghjk"; // ошибка
Чтобы сделать константами и указатель, и объект, надо оба объявить
const, например:
const char *const cpc = "asdf"; // указатель-константа на const
cpc[3] = 'a'; // ошибка
cpc = "ghjk"; // ошибка
Объект может быть объявлен константой при обращении к нему с помощью
указателя, и в то же время быть изменяемым, если обращаться к
нему другим способом. Особенно это удобно использовать для параметров
функции. Описав параметр-указатель функции как const, мы запрещаем
изменять в ней указуемый объект, например:
char* strcpy(char* p, const char* q); // не может изменять *q
Указателю на константу можно присвоить адрес переменной, т.к. это
не принесет вреда. Однако, адрес константы нельзя присваивать указателю
без спецификации const, иначе станет возможным менять ее значение,
например:
int a = 1;
const int c = 2;
const int* p1 = &c; // нормально
const int* p2 = &a; // нормально
int* p3 = &c; // ошибка
*p3 = 7; // меняет значение c
2.5.1. Перечисления
Есть способ связывания имен с целыми константами, который часто более
удобен, чем описание с const. Например:
enum { ASM, AUTO, BREAK };
Здесь определены три целых константы, которые называются элементами
перечисления, и им присвоены значения. Поскольку по умолчанию значения
элементов перечисления начинаются с 0 и идут в возрастающем порядке,
то приведенное перечисление эквивалентно определениям:
const ASM = 0;
const AUTO = 1;
const BREAK = 2;
Перечисление может иметь имя, например:
enum keyword { ASM, AUTO, BREAK };
Имя перечисления становится новым типом. С помощью стандартных
преобразований тип перечисления может неявно приводиться к типу int.
Обратное преобразование (из типа int в перечисление) должно быть задано
явно. Например:
void f()
{
keyword k = ASM;
int i = ASM;
k = i // ошибка
k = keyword(i);
i = k;
k = 4; // ошибка
}
Последнее преобразование поясняет, почему нет неявного преобразования
из int в перечисление: большинство значений типа int не имеет
представления в данном перечислении.
Описав переменную с типом keyword вместо очевидного int, мы дали
как пользователю, так и транслятору определенную информацию о том,
как будет использоваться эта переменная. Например, для следующего
оператора
keyword key;
switch (key) {
case ASM:
// выполнить что-либо
break;
case BREAK:
// выполнить что-либо
break;
}
транслятор может выдать предупреждение, поскольку из трех возможных
значений типа keyword используются только два.
Значения элементов перечисления можно задавать и явно. Например:
enum int16 {
sign=0100000,
most_significant=040000,
least_significant=1
};
Задаваемые значения необязательно должны быть различными, положительными
и идти в возрастающем порядке.
2.6. Экономия памяти
В процессе создания нетривиальной программы рано или поздно наступает
момент, когда требуется больше памяти, чем можно выделить или
запросить. Есть два способа выжать еще некоторое количество памяти:
[1] паковать в байты переменные с малыми значениями;
[2] использовать одну и ту же память для хранения разных объектов
в разное время.
Первый способ реализуется с помощью полей, а второй - с помощью
объединений. И те, и другие описываются ниже. Поскольку назначение
этих конструкций связано в основном с оптимизацией программы, и
поскольку, как правило, они непереносимы, программисту следует
хорошенько подумать, прежде чем использовать их. Часто лучше изменить
алгоритм работы с данными, например, больше использовать динамически
выделяемую память, чем заранее отведенную статическую память.
2.6.1 Поля
Кажется расточительным использовать для признака, принимающего
только два значения ( например: да, нет) тип char, но объект типа
char является в С++ наименьшим объектом, который может независимо
размещаться в памяти. Однако, есть возможность собрать переменные
с малым диапазоном значений воедино, определив их как поля структуры.
Член структуры является полем, если в его определении после имени
указано число разрядов, которое он должен занимать. Допустимы
безымянные поля. Они не влияют на работу с поименованными полями,
но могут улучшить размещение полей в памяти для конкретной машины:
struct sreg {
unsigned enable : 1;
unsigned page : 3;
unsigned : 1; // не используется
unsigned mode : 2;
unsigned : 4; // не используется
unsigned access : 1;
unsigned length : 1;
unsigned non_resident : 1;
};
Приведенная структура описывает разряды нулевого
регистра состояния DEC PDP11/45 (предполагается, что поля в слове
размещаются слева направо). Этот пример показывает также другое
возможное применение полей: давать имена тем частям
объекта, размещение которых определено извне. Поле должно иметь
целый тип ($$R.3.6.1 и $$R.9.6), и оно используется аналогично другим
объектам целого типа. Но есть исключение: нельзя брать адрес поля.
В ядре операционной системы или в отладчике тип sreg мог бы
использоваться следующим образом:
sreg* sr0 = (sreg*)0777572;
//...
if (sr0->access) { // нарушение прав доступа
// разобраться в ситуации
sr0->access = 0;
}
Тем не менее,
применяя поля для упаковки нескольких переменных в один байт, мы
необязательно сэкономим память. Экономится память для данных, но
на большинстве машин одновременно возрастает объем команд,
нужных для работы с упакованными данными.
Известны даже такие программы, которые значительно сокращались в объеме,
если двоичные переменные, задаваемые полями, преобразовывались в
переменные типа char! Кроме того, доступ к char или int обычно
происходит намного быстрее, чем доступ к полю. Поля - это просто
удобная краткая форма задания логических операций для извлечения
или занесения информации в части слова.
2.6.2. Объединения
Рассмотрим таблицу имен, в которой каждый элемент содержит имя и
его значение. Значение может задаваться либо строкой, либо целым числом: