Лекции. Тестирование ПО (all in one) (1186159), страница 9
Текст из файла (страница 9)
Наиболее похожими на целые числа конечнымимножествами с таким набором операций являются множества (кольца) классов целых чиселпо какому-то модулю, например Z2 = {[0], [1]}, где [0] — класс четных чисел, а [1] — класснечетных, или Z3 = {[0], [1], [2]}, где [n] — класс чисел, имеющих остаток n при делении на3. Поскольку в машине удобно представлять числа в двоичной записи, для эффективногорасхода памяти стоит взять модуль равным степени 2, например 232.
То есть, машинноечисло n будет обозначать класс чисел, равных n по модулю 232. Если к тому же хочется,чтобы действия с небольшими числами приводили к привычным результатам: 2+2 = 4, а 3–5= –2, в качестве представителей классов чисел по модулю 232 должны использоватьсянебольшие положительные и отрицательные числа. Таким образом, в качествепредставителей удобно выбрать числа 0, 1, –1, 2, –2, 3, –3, 4, –4 и т.д. Но, поскольку всего ихдолжно быть 232, для некоторого числа n, мы в итоге выберем n, но не выберем –n илинаоборот — ведь для 0 в этой последовательности уже нет соответствующегоотрицательного числа.
Соответственно, конец ее выглядит как 2147483647, –2147483647,–2147483648 = –231. По причинам, связанным с эффективностью и простотой реализацииопераций, проще выбрать –231, чем 231 — при этом можно использовать первый битпредставления числа в значении его знака, а все вычисления производить побитно, по тем жепричинам не стоит вводить специальное число –0, что, например, сделано в арифметикечисел с плавающей точкой. По модулю 232 выполнено –[–231] = [231] = [232–231] = [–231], что исоответствует выписанному выше соотношению.Другой пример. Как ведет себя tg(arctg(x)) при возрастающем x, которое является числом сплавающей точкой двойной точности? При x <= 1016 все идет как ожидается: tg(arctg(x)) = x снебольшой погрешностью, а вот дальше, как бы ни было велико x, tg(arctg(x)) дает один итот же результат 1.633123935319537⋅1016.
Для объяснения этого нужно знать, как устроенычисла с плавающей точкой, что служащее для представления π/2 число с плавающей точкойдвойной точности X = 884279719003555/562949953421312 меньше π/2 примерно на6.1232339957367658⋅10–17, и что получаемый результат является как раз значением tg(X) ≈1/(π/2 – X), вычисленным с двойной точностью.Двоичное число с плавающей точкой имеет следующую структуру [2,3].•Число представлено в виде набора из n бит, из которых первый бит является знаковымбитом числа, следующие k бит представляют его порядок E, а оставшиеся (n-k-1) битпредставляют его мантиссу M.•Знаковый бит S, порядок E и мантисса M числа x определяют его значение последующим правилам.x = (-1)S·2e·m, гдеo S — знаковый бит, равный 0 для положительных чисел, и 1 для отрицательных;o если 0 < E < 2k-1, то e = E-2(k-1)+1;иначе, если E = 0, e = -2(k-1)+2;число b = (2(k-1)-1) называется смещением порядка (exponent bias);o если 0 < E < 2k-1, то m = 1+M/2n-k-1.
Иначе говоря, m имеет двоичноепредставление 1.M, т.е. целая часть m равна 1, а последовательность цифр дробнойчасти совпадает с последовательностью бит M;если же E = 0, то m = M/2n-k-1, или m имеет двоичное представление 0.M.Числа с нулевой экспонентой называются денормализованными, а все остальные— нормализованными.•Максимальное возможное значение порядка E = 2k-1 зарезервировано дляпредставленияисключительныхчисел:положительнойиотрицательнойбесконечностей, +∞ и -∞, а также специального значения NaN (not-a-number, нечисло). NaN используется, если результат выполняемых действий нельзя корректнопредставить ни обычным числом, ни бесконечностью, как, например, результаты 0/0или (-∞) + (+∞).+∞ имеет нулевой знаковый бит, максимальный порядок и нулевую мантиссу; -∞отличается только единичным знаковым битом.Любое число, имеющее максимальный порядок и ненулевую мантиссу, считаетсяпредставлением NaN.•Стандарты IEEE 754 и IEEE 854 определяют несколько возможных типов чисел сплавающей точкой, из которых чаще всего используются числа однократнойточности (single precision), числа двойной точности (double precision) и числарасширенной двойной точности (double-extended precision).Для чисел однократной точности n = 32 и k = 8.
Соответственно, для мантиссыиспользуется 23 бита и смещение порядка равно 127.Для чисел двойной точности n = 64 и k = 11. Для мантиссы используется 52 бита исмещение порядка равно 1023.Для чисел расширенной двойной точности определенные значения k и n нефиксируются в стандартах, вводятся лишь ограничения 128 ≥ n ≥ 80 и k ≥ 15. Впроцессорах 32-битной архитектуры Intel n = 80 и k = 15. При этом для мантиссыиспользуется 64 бита и смещение порядка равно 16383.Кроме этого, иногда используются числа четырехкратной точности, для которых n= 128 и k = 15. Соответственно, для мантиссы используется 112 бит и смещениепорядка равно 16383. Они не специфицированы в стандарте, но имеют аналогичнуюструктуру.В качестве примера укажем представление числа -1710 в виде чисел однократной и двойнойточности.
Поскольку -1710 = (-1)1·2131-127·1.00012 = (-1)1·21027-1023·1.00012, соответственно, онопредставляется в виде числа однократной точности как1 10000011 00010000000000000000000, а в виде числа двойной точности как1 10000000011 0001000000000000000000000000000000000000000000000000.Некоторые граничные значения таких чисел для разных форматов указаны в Таблице 1. Приэтом для расширенной двойной точности используются параметры 32-битной архитектурыIntel.ОбщийвидОднократнаяточностьДвойнаяточностьРасширеннаядвойнаяточностьЧетырехкратнаяточностьСамоемаленькоеденормализованноеположительное число2-b-n+k+22-1492-10742-164462-16494Самоемаленькоенормализованноеположительное число2-b+12-1262-10222-163822-16382Самоебольшоеположительное число2b-n+k+1··(2n-k-1)2104·(224-1) 2971·(253-1)216319·(265-1)216271·(2113-1)Самое большое число,меньшее 11-2-n+k1-2-241-2-531-2-651-2-113Самоемаленькоечисло, большее 11+2-n+k+11+2-231+2-521+2-641+2-112Таблица 1.
Граничные значения чисел с плавающей точкой.Заметьте, что половину страницы текста заняло объяснение лишь небольшой «странности»поведения операции взятия противоположного целого числа — одной из простейших инаиболее точно определенных, которые только можно себе представить. Для полного иаккуратного разбора примера с арктангенсом потребовалась бы еще дополнительно парастраниц. При рассмотрении же более сложных функций программных систем, не имеющихтаких точных математических аналогов, возникают гораздо более серьезные проблемы.Именно поэтому здесь в качестве примеров взяты математические функции — любойчеловек, окончивший два курса ВУЗа по физико-математической или техническойспециальности, достаточно хорошо представляет себе, что это такое, и при желании можетсамостоятельно понять, как должна работать такая функция.
Если же надо понять, какработают менее однозначно определенные операции, возникает такое количество возможныхразнообразных смыслов, что чисто умозрительно решить, какой именно правилен,практически невозможно — необходима документация, зафиксированные в документахтребования, общение с разработчиками системы или с экспертами в данной предметнойобласти.Например, для адекватного понимания работы операции чтения заданного количествабайт из файла нужно уметь четко отвечать на множество вопросов.
Что происходит, еслифайла нет? Что будет, если он есть, но у данного процесса нет прав на работу с ним? Чтобудет результатом, если размер файла меньше запрашиваемого количества байт? А еслидругие операции в тоже время записывают данные в этот же файл? И пр., и т.д., и т.п.В то же время для операций ввода-вывода, как и для большинства других операций,реализованных в рамках широко используемых библиотек, можно, после определенныхусилий, достаточно строго определить математическую модель, адекватно описывающую ихработу.
Для многих же практических примеров — операций биллинговой системы, системыавтоматического управления боевым кораблем или гидроэлектростанцией — таких моделейвообще нет, никто никогда не продумывал такие сложные системы во всех их деталях. Наформальную проработку их при современных технологиях уйдет времени и усилий гораздобольше, чем это допустимо с точки зрения экономической оправданности таких систем.Таким образом, одна из наиболее сложных задач — адекватно понять требования,понять, что именно обозначает каждое утверждение в документации, которое относится кданной операции. В примере с абсолютной величиной вроде бы удалось сразу написатьчеткое определение, но понять его помогает только приведенный пример «странного»поведения.
Только после проведенного дополнительного анализа становится возможным безошибок выводить следствия из этого определения (первоначальный вывод о том, чтоабсолютная величина больше 0 был ошибкой). Во многих других случаях даже простонаписать четкое определение нелегко. Поэтому всегда необходим вдумчивый анализтребований, извлечение всех сведений, которые только можно получить из документации,стандартов, а также из личного общения с экспертами, архитекторами, разработчиками ипользователями тестируемой системы и другими заинтересованными лицами.Помогают в этом анализе попытки четко определить, как можно проверить требования.Например, попытка проверить правильность вычисление абсолютной величины при помощитождества abs(x) >= 0 проваливается, и этот факт вынуждает задуматься об основныхпринципах машинной арифметики.
Формулируя требования в проверяемом виде, мы сразуполучаем очень хорошее определение правильного поведения, более аккуратное, чемсуществующие описания для подавляющего большинства программных систем.Если тесты создаются как обычно, в виде тестовых вариантов, их разработчик сразупытается определить, как именно проверять требования в той конкретной ситуации, котораявозникает в данном тесте. Методы тестирования на основе моделей требуют описыватьтребования к поведению операции «вообще», в произвольной ситуации, в которой онадолжна работать.