Б. Страуструп - Язык программирования С++ (1119446), страница 25
Текст из файла (страница 25)
Имя, т.е. лексема NAME, определяется как буква, за которой может идти несколько буквили цифр:if (isalpha(ch)) {char* p = name_string;*p++ = ch;while (cin.get(ch) && isalnum(ch)) *p++ = ch;cin.putback(ch);*p = 0;return curr_tok=NAME;}Этот фрагмент программы заносит в name_string строку, оканчивающуюся нулевым символом. Функцииisalpha() и isalnum() определены в <ctype.h>. Результат isalnum(c) ненулевой, если c - буква или цифра,и нулевой в противном случае.Приведем, наконец, функцию ввода полностью:token_value get_token(){char ch;do {// пропускает обобщенные пробелы за исключением '\n'if(!cin.get(ch)) return curr_tok = END;} while (ch!='\n' && isspace(ch));switch (ch) {case ';':case '\n':cin >> ws;// пропуск обобщенного пробелаreturn curr_tok=PRINT;case '*':case '/':case '+':case '-':case '(':case ')':case '=':return curr_tok=token_value(ch);case '0': case '1': case '2': case '3': case '4':case '5': case '6': case '7': case '8': case '9':75Бьерн Страуструп.Язык программирования С++case '.':cin.putback(ch);cin >> number_value;return curr_tok=NUMBER;default:// NAME, NAME= или ошибкаif (isalpha(ch)) {char* p = name_string;*p++ = ch;while (cin.get(ch) && isalnum(ch)) *p++ = ch;cin.putback(ch);*p = 0;return curr_tok=NAME;}error("недопустимая лексема");return curr_tok=PRINT;}}Преобразование операции в значение лексемы для нее тривиально, поскольку в перечисленииtoken_value лексема операции была определена как целое (код символа операции).3.1.3 Таблица именЕсть функция поиска в таблице имен:name* look(char* p, int ins =0);Второй ее параметр показывает, была ли символьная строка, обозначающая имя, ранее занесена втаблицу.
Инициализатор =0 задает стандартное значение параметра, которое используется, еслифункция look() вызывается только с одним параметром. Это удобно, так как можно писать look("sqrt2"),что означает look("sqrt2",0), т.е. поиск, а не занесение в таблицу. Чтобы было так же удобно задаватьоперацию занесения в таблицу, определяется вторая функция:inline name* insert(const char* s) { return look(s,1); }Как ранее упоминалось, записи в этой таблице имеют такой тип:struct name {char* string;name* next;double value;};Член next используется для связи записей в таблице.
Собственно таблицауказателей на объекты типа name:- это просто массивconst TBLSZ = 23;name* table[TBLSZ];Поскольку по умолчанию все статические объекты инициализируются нулем, такое тривиальноеописание таблицы table обеспечивает также и нужную инициализацию.Для поиска имени в таблице функция look() использует простой хэш-код (записи, в которых именаимеют одинаковый хэш-код, связываются вместе):int ii = 0;// хэш-кодconst char* pp = p;while (*pp) ii = ii<<1 ^ *pp++;if (ii < 0) ii = -ii;ii %= TBLSZ;Иными словами, с помощью операции ^ ("исключающее ИЛИ") все символы входной строки pпоочередно добавляются к ii.
Разряд в результате x^y равен 1 тогда и только тогда, когда эти разряды воперандах x и y различны. До выполнения операции ^ значение ii сдвигается на один разряд влево,76Бьерн Страуструп.Язык программирования С++чтобы использовался не только один байт ii. Эти действия можно записать таким образом:ii <<= 1;ii ^= *pp++;Для хорошего хэш-кода лучше использовать операцию ^, чем +.
Операция сдвига важна для полученияприемлемого хэш-кода в обоих случаях. Операторыif (ii < 0) ii = -ii;ii %= TBLSZ;гарантируют, что значение ii будет из диапазона 0...TBLSZ-1. Напомним, что % - это операция взятияостатка. Ниже полностью приведена функция look:#include <string.h>name* look(const char* p, int ins =0){int ii = 0;// хэш-кодconst char* pp = p;while (*pp) ii = ii<<1 ^ *pp++;if (ii < 0) ii = -ii;ii %= TBLSZ;for (name* n=table[ii]; n; n=n->next)// поискif (strcmp(p,n->string) == 0) return n;if (ins == 0) error("имя не найдено");name* nn = new name;// занесениеnn->string = new char[strlen(p)+1];strcpy(nn->string,p);nn->value = 1;nn->next = table[ii];table[ii] = nn;return nn;}После вычисления хэш-кода ii идет простой поиск имени по членам next.
Имена сравниваются спомощью стандартной функции сравнения строк strcmp(). Если имя найдено, то возвращаетсяуказатель на содержащую его запись, а в противном случае заводится новая запись с этим именем.Добавление нового имени означает создание нового объекта name в свободной памяти с помощьюоперации new (см. $$3.2.6), его инициализацию и включение в список имен. Последнее выполняется какзанесение нового имени в начало списка, поскольку это можно сделать даже без проверки того, есть лисписок вообще. Символьная строка имени также размещается в свободной памяти. Функция strlen()указывает, сколько памяти нужно для строки, операция new отводит нужную память, а функция strcpy()копирует в нее строку.
Все строковые функции описаны в <string.h>:extern int strlen(const char*);extern int strcmp(const char*, const char*);extern char* strcpy(char*, const char*);3.1.4 Обработка ошибокПоскольку программа достаточно проста, не надо особо беспокоиться об обработке ошибок. Функцияerror просто подсчитывает число ошибок, выдает сообщение о них и возвращает управление обратно:int no_of_errors;double error(const char* s){cerr << "error: " << s << "\n";no_of_errors++;return 1;}Небуферизованный выходной поток cerr обычно используется именно для выдачи сообщений об77Бьерн Страуструп.Язык программирования С++ошибках.
Управление возвращается из error() потому, что ошибки, как правило, встречаются посредивычисления выражения. Значит надо либо полностью прекращать вычисления, либо возвращатьзначение, которое не должно вызвать последующих ошибок. Для простого калькулятора большеподходит последнее. Если бы функция get_token() отслеживала номера строк, то функция error() моглабы указывать пользователю приблизительное место ошибки.
Это было бы полезно принеинтерактивной работе с калькулятором. Часто после появления ошибки программа должназавершиться, поскольку не удалось предложить разумный вариант ее дальнейшего выполнения.Завершить ее можно с помощью вызова функции exit(), которая заканчивает работу с выходнымипотоками ($$10.5.1) и завершает программу, возвращая свой параметр в качестве ее результата. Болеерадикальный способ завершения программы - это вызов функции abort(), которая прерываетвыполнение программы немедленно или сразу же после сохранения информации для отладчика (сбросоперативной памяти). Подробности вы можете найти в своем справочном руководстве.Более тонкие приемы обработки ошибок можно предложить, если ориентироваться на особые ситуации(см.$$9), но предложенное решение вполне приемлемо для игрушечного калькулятора в 200 строк.3.1.5 ДрайверКогда все части программы определены, нужен только драйвер, чтобы инициализировать и запуститьпроцесс.
В нашем примере с этим справится функция main():int main(){// вставить предопределенные имена:insert("pi")->value = 3.1415926535897932385;insert("e")->value = 2.7182818284590452354;while (cin) {get_token();if (curr_tok == END) break;if (curr_tok == PRINT) continue;cout << expr() << '\n';}return no_of_errors;}Принято, что функция main() возвращает нуль, если программа завершается нормально, и ненулевоезначение, если происходит иначе.
Ненулевое значение возвращается как число ошибок. Оказывается,вся инициализация сводится к занесению предопределенных имен в таблицу.В цикле main читаются выражения и выдаются результаты. Это делает одна строка:cout << expr() << '\n';Проверка cin при каждом проходе цикла гарантирует завершение программы, даже если что-то случитсяс входным потоком, а проверка на лексему END нужна для нормального завершения цикла, когда функцияget_token() обнаружит конец файла.
Оператор break служит для выхода из ближайшего объемлющегооператора switch или цикла (т.е. оператора for, while или do). Проверка на лексему PRINT (т.е. на '\n' и ';')снимает с функции expr() обязанность обрабатывать пустые выражения. Оператор continueэквивалентен переходу на конец цикла, поэтому в нашем случае фрагмент:while (cin) {// ...if (curr_tok == PRINT) continue;cout << expr() << "\n";}эквивалентен фрагменту:while (cin) {// ...if (curr_tok == PRINT) goto end_of_loop;cout << expr() << "\n";end_of_loop: ;78Бьерн Страуструп.Язык программирования С++}Более подробно циклы описываются в $$R.63.1.6 Параметры командной строкиКогда программа калькулятора уже была написана и отлажена, выяснилось, что неудобно вначалезапускать ее, вводить выражение, а затем выходить из калькулятора.