Бьерн Страуструп (Стpаустpуп - Книга о C++), страница 13
Описание файла
Документ из архива "Стpаустpуп - Книга о C++", который расположен в категории "". Всё это находится в предмете "информатика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "информатика" в общих файлах.
Онлайн просмотр документа "Бьерн Страуструп"
Текст 13 страницы из документа "Бьерн Страуструп"
(см. главу 7).
Размер объекта структурного типа не обязательно равен сумме
размеров всех его членов. Это происходит по той причине, что
на многих машинах требуется размещать объекты определенных типов,
только выравнивая их по некоторой зависящей от системы адресации
границе (или просто потому, что работа при таком выравнивании будет
более эффективной ). Типичный пример - это выравнивание целого по
словной границе. В результате выравнивания могут появиться "дырки" в
структуре. Так, на уже упоминавшейся машине автора sizeof(address)
равно 24, а не 22, как можно было ожидать.
Следует также упомянуть, что тип можно использовать сразу после его
появления в описании, еще до того, как будет завершено все описание.
Например:
struct link{
link* previous;
link* successor;
};
Однако новые объекты типа структуры нельзя описать до тех пор, пока не
появится ее полное описание. Поэтому описание
struct no_good {
no_good member;
};
является ошибочным (транслятор не в состоянии установить размер no_good).
Чтобы позволить двум (или более) структурным типам ссылаться друг на
друга, можно просто описать имя одного из них как имя некоторого
структурного типа. Например:
struct list; // будет определено позднее
struct link {
link* pre;
link* suc;
list* member_of;
};
struct list {
link* head;
};
Если бы не было первого описания list, описание члена link привело бы к
синтаксической ошибке.
Можно также использовать имя структурного типа еще до того, как тип будет
определен, если только это использование не предполагает знания размера
структуры. Например:
class S; // 'S' - имя некоторого типа
extern S a;
S f();
void g(S);
Но приведенные описания можно использовать лишь после того, как тип S
будет определен:
void h()
{
S a; // ошибка: S - неописано
f(); // ошибка: S - неописано
g(a); // ошибка: S - неописано
}
2.3.9 Эквивалентность типов
Два структурных типа считаются различными даже тогда, когда они имеют
одни и те же члены. Например, ниже определены различные типы:
struct s1 { int a; };
struct s2 { int a; };
В результате имеем:
s1 x;
s2 y = x; // ошибка: несоответствие типов
Кроме того, структурные типы отличаются от основных типов, поэтому
получим:
s1 x;
int i = x; // ошибка: несоответствие типов
Есть, однако, возможность, не определяя новый тип, задать новое имя
для типа. В описании, начинающемся служебным словом typedef, описывается
не переменная указанного типа, а вводится новое имя для типа.
Приведем пример:
typedef char* Pchar;
Pchar p1, p2;
char* p3 = p1;
Это просто удобное средство сокращения записи.
2.3.10 Ссылки
Ссылку можно рассматривать как еще одно имя объекта.
В основном ссылки используются для задания параметров и возвращаемых
функциями значений , а также для перегрузки операций (см.$$7).
Запись X& обозначает ссылку на X. Например:
int i = 1;
int& r = i; // r и i ссылаются на одно и то же целое
int x = r; // x = 1
r = 2; // i = 2;
Ссылка должна быть инициализирована, т.е.
должно быть нечто, что она может обозначать. Следует помнить, что
инициализация ссылки совершенно отличается от операции присваивания.
Хотя можно указывать операции над ссылкой, ни одна из них на саму ссылку
не действует, например,
int ii = 0;
int& rr = ii;
rr++; // ii увеличивается на 1
Здесь операция ++ допустима, но rr++ не увеличивает саму
ссылку rr; вместо этого ++ применяется к целому, т.е. к переменной ii.
Следовательно, после инициализации значение ссылки не может быть
изменено: она всегда указывает на тот объект, к которому была привязана
при ее инициализации. Чтобы получить указатель на объект,
обозначаемый ссылкой rr, можно написать &rr.
Очевидной реализацией ссылки может служить постоянный указатель,
который используется только для косвенного обращения. Тогда инициализация
ссылки будет тривиальной, если в качестве инициализатора указан адрес
(т.е. объект, адрес которого можно получить; см. $$R.3.7).
Инициализатор для типа T должен быть адресом. Однако, инициализатор
для &T может быть и не адресом, и даже не типом T. В таких случаях
делается следующее:
[1] во-первых, если необходимо, применяется преобразование типа
(см.$$R.8.4.3);
[2] затем получившееся значение помещается во временную переменную;
[3] наконец, адрес этой переменной используется в качестве инициализатора
ссылки.
Пусть имеются описания:
double& dr = 1; // ошибка: нужен адрес
const double& cdr = 1; // нормально
Это интерпретируется так:
double* cdrp; // ссылка, представленная как указатель
double temp;
temp = double(1);
cdrp = &temp;
Ссылки на переменные и ссылки на константы различаются по следующей
причине: в первом случае создание временной переменной чревато
ошибками, поскольку присваивание этой переменной означает присваивание
временной переменной, которая могла к этому моменту исчезнуть.
Естественно, что во втором случае подобных проблем не существует.
и ссылки на константы часто используются как параметры функций
(см.$$R.6.3).
Ссылка может использоваться для функции, которая изменяет значение своего
параметра. Например:
void incr(int& aa) { aa++; }
void f()
{
int x = 1;
incr(x); // x = 2
}
По определению передача параметров имеет ту же семантику, что и
инициализация, поэтому при вызове функции incr ее параметр aa
становится другим именем для x. Лучше, однако, избегать изменяющих
свои параметры функций, чтобы не запутывать программу. В большинстве
случаев предпочтительнее, чтобы функция возвращала результат явным
образом, или чтобы использовался параметр типа указателя:
int next(int p) { return p+1; }
void inc(int* p) { (*p)++; }
void g()
{
int x = 1;
x = next(x); // x = 2
inc(&x); // x = 3
}
Кроме перечисленного, с помощью ссылок можно определить функции,
используемые как в правой, так и в левой частях присваивания.
Наиболее интересное применение это обычно находит при определении
нетривиальных пользовательских типов. В качестве примера определим
простой ассоциативный массив. Начнем с определения структуры
pair:
struct pair {
char* name; // строка
int val; // целое
};
Идея заключается в том, что со строкой связывается некоторое целое значение.
Нетрудно написать функцию поиска find(), которая работает со структурой
данных, представляющей ассоциативный массив. В нем для каждой отличной от
других строки содержится структура pair (пара: строка и значение ). В
данном примере - это просто массив. Чтобы сократить пример, используется
предельно простой, хотя и неэффективный алгоритм:
const int large = 1024;
static pair vec[large+1];
pair* find(const char* p)
/*
// работает со множеством пар "pair":
// ищет p, если находит, возвращает его "pair",
// в противном случае возвращает неиспользованную "pair"
*/
{
for (int i=0; vec[i].name; i++)
if (strcmp(p,vec[i].name)==0) return &vec[i];
if (i == large) return &vec[large-1];
return &vec[i];
}
Эту функцию использует функция value(), которая реализует массив целых,
индексируемый строками (хотя привычнее строки индексировать целыми):
int& value(const char* p)
{
pair* res = find(p);
if (res->name == 0) { // до сих пор строка не встречалась,
// значит надо инициализировать
res->name = new char[strlen(p)+1];
strcpy(res->name,p);
res->val = 0; // начальное значение равно 0
}
return res->val;
}
Для заданного параметра (строки) value() находит объект,
представляющий целое (а не просто значение соответствующего целого) и
возвращает ссылку на него. Эти функции можно использовать, например, так:
const int MAX = 256; // больше длины самого длинного слова
main()
// подсчитывает частоту слов во входном потоке
{
char buf[MAX];
while (cin>>buf) value(buf)++;
for (int i=0; vec[i].name; i++)
cout << vec[i].name << ": " << vec [i].val<< '\n';
}
В цикле while из стандартного входного потока cin читается по одному
слову и записывается в буфер buf (см. глава 10), при этом каждый
раз значение счетчика, связанного со считываемой строкой, увеличивается.
Счетчик отыскивается в ассоциативном массиве vec с помощью функции
find(). В цикле for печатается получившаяся таблица различных слов из cin
вместе с их частотой. Имея входной поток
aa bb bb aa aa bb aa aa
программа выдает:
aa: 5
bb: 3
С помощью шаблонного класса и перегруженной операции [] ($$8.8)
достаточно просто довести массив из этого примера до настоящего
ассоциативного массива.
2.4 ЛИТЕРАЛЫ
В С++ можно задавать значения всех основных типов:
символьные константы, целые константы и константы с плавающей точкой.
Кроме того, нуль (0) можно использовать как значение указателя
произвольного типа, а символьные строки являются константами типа
char[]. Есть возможность определить символические константы.
Символическая константа - это имя, значение которого в его области
видимости изменять нельзя. В С++ символические константы можно задать
тремя способами: (1) добавив служебное слово const в определении,
можно связать с именем любое значение произвольного типа;
(2) множество целых констант можно определить как перечисление;
(3) константой является имя массива или функции.
2.4.1 Целые константы
Целые константы могут появляться в четырех обличьях: десятичные,
восьмеричные, шестнадцатеричные и символьные константы. Десятичные
константы используются чаще всего и выглядят естественно:
0 1234 976 12345678901234567890
Десятичная константа имеет тип int, если она умещается в память,
отводимую для int, в противном случае ее тип long. Транслятор должен
предупреждать о константах, величина которых превышает выбранный формат
представления чисел.
Константа, начинающаяся с нуля, за которым следует x (0x), является
шестнадцатеричным числом (с основанием 16), а константа, которая
начинающаяся с нуля, за которым следует цифра, является восьмеричным
числом (с основанием 8). Приведем примеры восьмеричных констант:
0 02 077 0123
Их десятичные эквиваленты равны соответственно: 0, 2, 63, 83.
В шестнадцатеричной записи эти константы выглядят так:
0x0 0x2 0x3f 0x53
Буквы a, b, c, d, e и f или эквивалентные им заглавные буквы
используются для представления чисел 10, 11, 12, 13, 14 и 15,
соответственно. Восьмеричная и шестнадцатеричная формы записи наиболее
подходят для задания набора разрядов, а
использование их для обычных чисел может дать неожиданный эффект.
Например, на машине, в которой int представляется как 16-разрядное
число в дополнительном коде, 0xffff есть отрицательное десятичное
число -1. Если бы для представления целого использовалось большее число
разрядов, то это было бы числом 65535.
Окончание U может использоваться для явного задания констант типа
unsigned. Аналогично, окончание L явно задает константу типа long.
Например:
void f(int);
void f(unsigned int);
void f(long int);
void g()
{
f(3); // вызов f(int)
f(3U); // вызов f(unsigned int)
f(3L); // вызов f(long int)
}
2.4.2 Константы с плавающей точкой
Константы с плавающей точкой имеют тип double. Транслятор должен
предупреждать о таких константах, значение которых не укладывается в
формат, выбранный для представления чисел с плавающей точкой. Приведем
примеры констант с плавающей точкой:
1.23 .23 0.23 1. 1.0 1.2e10 1.23e-15
Отметим, что внутри константы с плавающей точкой не должно быть пробелов.
Например, 65.43 e-21 не является константой с плавающей точкой, транслятор
распознает это как четыре отдельные лексемы:
65.43 e - 21
что вызовет синтаксическую ошибку.
Если нужна константа с плавающей точкой типа float, то ее можно получить,
используя окончание f:
3.14159265f 2.0f 2.997925f
2.4.3 Символьные константы
Символьной константой является символ, заключенный в одиночные кавычки,
например, 'a' или '0'. Символьные константы можно считать константами,
которые дают имена целым значениям символов из набора, принятого на
машине, на которой выполняется программа.
Это необязательно тот же набор символов, который есть на машине,
где программа транслировалась. Таким образом, если вы запускаете
программу на машине, использующей набор символов
ASCII, то значение '0' равно 48, а если машина использует код EBCDIC,
то оно будет равно 240. Использование символьных констант вместо их
десятичного целого эквивалента повышает переносимость программ.
Некоторые специальные комбинации символов, начинающиеся с обратной