Керниган и Ритчи - Язык программирования Си (793773), страница 27
Текст из файла (страница 27)
Это справедливобезотносительно к типу объекта, на который указывает р; n автоматически домножается на коэффициент,соответствующий размеру объекта. Информация о размере неявно присутствует в объявлении р. Если, кпримеру, int занимает четыре байта, то коэффициент умножения будет равен четырем.Допускается также вычитание указателей. Например, если р и q указывают на элементы одного массива иp<q, то q-p+1 есть число элементов от р до q включительно.
Этим фактом можно воспользоваться принаписании еще одной версии strlen:/* strlen: возвращает длину строки s */int strlen(char *s){char *p = s;while (*p != '\0' )p++;return p - s;}В своем объявлении р инициализируется значением s, т. е. вначале р указывает на первый символ строки. Накаждом шаге цикла while проверяется очередной символ; цикл продолжается до тех пор, пока не встретится'\0'. Каждое продвижение указателя р на следующий символ выполняется инструкцией р++, и разность ps дает число пройденных символов, т. е. длину строки. (Число символов в строке может быть слишкомбольшим, чтобы хранить его в переменной типа int. Тип ptrdiff_t, достаточный для хранения разности(со знаком) двух указателей, определен в заголовочном файле <stddef.h>.
Однако, если быть оченьосторожными, нам следовало бы для возвращаемого результата использовать тип size_t, в этом случаенаша программа соответствовала бы стандартной библиотечной версии. Тип size_t есть тип беззнаковогоцелого, возвращаемого оператором sizeof.)Арифметика с указателями учитывает тип: если она имеет дело со значениями float, занимающими большепамяти, чем char, и р — указатель на float, то р++ продвинет р на следующее значение float.
Этозначит, что другую версию alloc, которая имеет дело с элементами типа float, а не char, можно получитьпростой заменой в alloc и afree всех char на float. Все операции с указателями будут автоматическиоткорректированы в соответствии с размером объектов, на которые указывают указатели.Можно производить следующие операции с указателями: присваивание значения указателя другомууказателю того же типа, сложение и вычитание указателя и целого, вычитание и сравнение двух указателей,указывающих на элементы одного и того же массива, а также присваивание указателю нуля и сравнениеуказателя с нулем.
Других операций с указателями производить не допускается. Нельзя складывать двауказателя, перемножать их, делить, сдвигать, выделять разряды; указатель нельзя складывать со значениемтипа float или double; указателю одного типа нельзя даже присвоить указатель другого типа, не выполнивпредварительно операции приведения (исключение составляют лишь указатели типа void*).5.5. Символьные указатели функцииСтроковая константа, написанная в виде"Я строка"есть массив символов.
Во внутреннем представлении этот массив заканчивается нулевым символом '\0', покоторому программа может найти конец строки. Число занятых ячеек памяти на одну больше, чем количествосимволов, помещенных между двойными кавычками.Чаще всего строковые константы используются в качестве аргументов функций, как, например, вprintf("здравствуй, мир\п");Когда такая символьная строка появляется в программе, доступ к ней осуществляется через символьныйуказатель; printf получает указатель на начало массива символов. Точнее, доступ к строковой константеосуществляется через указатель на ее первый элемент.Строковые константы нужны не только в качестве аргументов функций. Если, например, переменнуюpmessage объявить какchar *pmessageто присваиваниеpmessage = "now is the time";поместит в нее указатель на символьный массив, при этом сама строка не копируется, копируется лишьуказатель на нее.
Операции для работы со строкой как с единым целым в Си не предусмотрены.Существует важное различие между следующими определениями:char amessage[] = "now is the time"; /* массив */char *pmessage = "now is the time"; /* указатель */amessage — это массив, имеющий такой объем, что в нем как раз помещается указаннаяпоследовательность символов и '\0'.
Отдельные символы внутри массива могут изменяться, но amessageвсегда указывает на одно и то же место памяти. В противоположность ему pmessage есть указатель,инициализированный так, чтобы указывать на строковую константу. А значение указателя можно изменить, итогда последний будет указывать на что-либо другое. Кроме того, результат будет неопределен, если выпопытаетесь изменить содержимое константы.Дополнительные моменты, связанные с указателями и массивами, проиллюстрируем на нескольковидоизмененных вариантах двух полезных программ, взятых нами из стандартной библиотеки. Первая изних, функция strcpy(s, t), копирует строку t в строку s. Хотелось бы написать прямо s=t, но такойоператор копирует указатель, а не символы.
Чтобы копировать символы, нам нужно организовать цикл.Первый вариант strcpy, с использованием массива, имеет следующий вид:/* strcpy: копирует t в s; вариант с индексируемым массивом*/void strcpy(char *s, char *t){int i;i = 0;while ((s[i] = t[i]) != '\0' )i++;}Для сравнения приведем версию strcpy с указателями:/* strcpy: копирует t в s: версия 1 (с указателями) */void strcpy(char *s, char *t){while ((*s = *t) != '\0' ) {s++;t++;}}Поскольку передаются лишь копии значений аргументов, strcpy может свободно пользоватьсяпараметрами s и t как своими локальными переменными.
Они должным образом инициализированыуказателями, которые продвигаются каждый раз на следующий символ в каждом из массивов до тех пор,пока в копируемой строке t не встретится '\0'.На практике strcpy так не пишут. Опытный программист предпочтет более короткую запись:/* strcpy: копирует t в s; версия 2 (с указателями) */void strcpy(char *s, char *t){while ((*s++ = *t++) != '\0');}Приращение s и t здесь осуществляется в управляющей части цикла. Значением *t++ является символ, накоторый указывает переменная t перед тем, как ее значение будет увеличено; постфиксный оператор ++ неизменяет указатель t, пока не будет взят символ, на который он указывает.
То же в отношении s: сначаласимвол запомнится в позиции, на которую указывает старое значение s, и лишь после этого значениепеременной s увеличится. Пересылаемый символ является одновременно и значением, котороесравнивается с '\0' . В итоге копируются все символы, включая и заключительный символ '\0'.Заметив, что сравнение с '\0' здесь лишнее (поскольку в Си ненулевое значение выражения в условиитрактуется и как его истинность), мы можем сделать еще одно и последнее сокращение текста программы:/* strcpy: копирует t в s; версия 3 (с указателями) */void strcpy(char *s, char *t){while (*s++ = *t++);}Хотя на первый взгляд то, что мы получили, выглядит загадочно, все же такая запись значительно удобнее, иследует освоить ее, поскольку в Си-программах вы будете с ней часто встречаться.Что касается функции strcpy из стандартной библиотеки <string.h>, то она возвращает в качестве своегорезультата еще и указатель на новую копию строки.Вторая программа, которую мы здесь рассмотрим, это strcmp(s, t).
Она сравнивает символы строк s и tи возвращает отрицательное, нулевое или положительное значение, если строка s соответственнолексикографически меньше, равна или больше, чем строка t. Результат получается вычитанием первыхнесовпадающих символов из s и t./* strcmp: выдает < 0 при s < t, 0 при s == t, > 0 при s > t */int strcmp(char *s, char *t){int i;for (i = 0; s[i] == t[i]; i++)if (s[i] == '\0')return 0;return s[i] - t[i];}Та же программа с использованием указателей выглядит так:/* strcmp: выдает < 0 при s < t, 0 при s == t, > 0 при s > t */int strcmp(char *s, char *t){for ( ; *s == *t; s++, t++)if (*s == '\o')return 0;return *s - *t;}Поскольку операторы ++ и -- могут быть или префиксными, или постфиксными, встречаются (хотя и не такчасто) другие их сочетания с оператором *. Например:*--руменьшит р прежде, чем по этому указателю будет получен символ.














