Записи по ЯП (1161118), страница 2
Текст из файла (страница 2)
многобайтовым (к примеру, для Юникода).
п.2.4 Ограниченные типы данных
п.2.4.1 Перечисления (перечислимые типы данных)
Паскаль:
Type EnumTyp = (va1, …, valN);
Операции:
:=, =, <, >, <>, >=, <= - основаны на функциях succ(x), pred(x)
ord(x) = 0…N-1 (Элементы упорядочены)
Таким образом перечислимый тип – некий способ удобного создания, хранения и использования констант.
преобразования:
EnumType -> Integer безопасно
Integer -> EnumType Небезопасно. Нужны проверки
Статические проверки – проверки при компиляции программы. Проверяемые данные не меняются в различных вызовах функции (запусках программы)
A:array [1..100] of integer;
……….
a[10] = 10; Статическая проверка
Квазистатические проверки - проверки при выполнении. Квазистатическим они называются потому, что проверяемые данные могут меняться в различных вызовах
функции (запусках программы). Поэтому эти проверки делаются именно при выполнении.
Компилятор обнаруживает опасное место в программе и вставляет в это место квазистатический код, который выполнится в процессе работы программы.
a:array [1..100] of integer;
……….
a[n] = 10; n не известна в момент компиляции. Если язык поддерживает квазистатические проверки, то здесь будет вставлен контроль выхода за границу массива
x:0…N-1
x:= expr; Вставится роверка вида «if(expr >= N) or (expr <0) then error()», т.к. значение expr не известно во время компиляции
В машинных языках нет квазистатических проверок. Поэтому нет и в Си
int a[10];
n = 11;
a[n] = 10; В Си проверки не будет
RTTI – динамическая информация о типе. Ради этого в Си++ вставлены квазистатические проверки.
В Си-89 добавили такую конструкцию:
enum ET(v0,…,vN);
которая эквивалентна последовательности строк
#define v0 0;
#define v1 1;
……..
Но так как нет квазистатических проверок, то все нижеследующие строки будут корректны:
enum ET y;
int I;
x = v1;
I = v2;
x = I;
I = x;
x = -5;
Негласная парадигма языка Си – «компактность кода», а квазистатические проверки, естественно, увеличивают генерируемый код.
В своё время перечислимые типы были очень популярны.
Но:
-
Языки «Оберон»(1988) и «Оберон-2»(1993) уже не содержали перечислимые типы. В Обероне было «Расширение типов», которому противоречат перечислимые типы данных, которые невозможно расширить.
-
uses (pascal, Ада) Вместе с перечислимым типом неявно импортируются все его константы на том же уровне видимости .Таким образом значения констант могут конфликтовать и перекрываться для разных перечислимых типов (в т.ч. из разных модулей)
-
Java (1995) – нет перечислимых типов
-
C# (1999) – перечислимые типы есть. Одно из назначений - хранение наборов значений параметров компонентов( например влево/вправо/по центру для выравнивания). Т.е. перечислимые типы интегрировали в визуальные средства проектирования.
-
Java (2005) - расширение Java, в том числе добавление перечислимых типов, оформленных в виде полноценных классов
Вопросы, связанные с реализацией и использованием перечислимых типов данных:
-
Проблема представления – реализовывать ли возможность задавать конкретные значения констант (например, для цветов)?
-
Проблема эффективности – реализовывать ли возможность управления представлением?
-
Проблема преобразований в другие целочисленные типы данных – разрешать или не разрешать?
-
Неявный импорт – разрешать или нет?
-
Удобство использования – ввод, вывод и т.д.
Модула-2 type ET = (v1, …, vN); Преобразования : ord(x); ET -> integer val(T,i); ET -> integer. Либо выдаёт ошибку, либо выдаёт значение. val(ET,v2) = 1; Неявный импорт возможен Удобность использования не расширена. |
С++ <-> C-89 enum ET{…}; void f(ET x); void f(int x); Будет перегрузка, потому что перечисление – новый тип данных В Си++ typedef задаёт синоним типа, а не создаёт новый тип. typedef int a; void f(a x) void f(int x) Перегрузки не будет, т.к. «a» не новый тип(=> будет ошибка) В Си++ можно задавать значения константам перечисления Enum FileAccept { FileRead = 1; FileWrite = 2; FileReadWrite = FileRead | FileWrite; } Удобство использования такое же, как и для int |
Ада Типы BOOLEAN и CHARACTER являются перечислимыми типами данных из пакета STANDARD Проблема неявного импорта: type SendColor is (Red,Yellow,Green) type BasicColor is (Red,Green,Blue) Ввели понятие «литерал» перечисления. Им является либо идентификатор, либо символ(‘символ’) type Latin is (‘A’, ‘B’,’C’,… ,’Z’) type ASCII Latin(‘A’, ‘B’,’C’,… ,’Z’, ‘a’, ’b’,…) Литерал перечисления – функция без параметров, имя которой совпадает с литералом и возвращает нужную константу procedure P(x:SendColor) procedure P(x:BasicColor) P(Wellow) – в функцию отправится «1» P(Red) - ?? ошибка Решение проблемы неявного импорта: Уточнение типа - T’expr – выражение expr трактовать как выражение типа Т P(BasicColor’Red) – правильно! Представление: for BasicColor use (Red => FF00000x, Green => FF00x, Blue =>FFx) for BasicColor’Size use 24; - 24- количество битов «’» специальная операция, применимая именами типов, позволяющая получить доступ к некоторым атрибутам |
C# Управление реализацией: enum BasicColor { Red = 0xFF0000; Green = 0xFF00 Blue = 0xFF }; enum SendColor: Byte { Yellow; Green; }; Преобразования из перечислимых типов в целочисленные в современных языках только явные. Атрибуты – средства сообщать компилятору некоторую информацию о реализации типа. [FLAGS] – указывает, что перечисление может обрабатываться как битовое поле, которое является набором флагов. [FLAGS] enum FileAcces { FileRead = 1; FileWrite = 2; FileReadWrite = FileRead | FileWrite; } теперь, если вывести на экран FileAccept. FileReadWrite получим «FileRead, FileWrite». Без использования атрибута [FLAGS] получим 3. |
С#, Java Неявный импорт FileAcces x; X = FileAcces.Read; //Уточнение перечисления Удобство использования. Классы-обёртки Классификация ТД
Для каждого типа-значения существует класс-обёртка С# int - Int32,bool – Boolean, long – Int64 Java int – Integer,bool – Boolean, long – Long В С# все обёртки находятся в .Net Для всех перечислений имеется один класс-обёртка – «Enum»
int [] vals = (int []) Enum.GetValues(typeof(…)); |
Java v5.0 Tiger 2005 Enum SendColor { Red,Yellow,Green //Статические члены } SendColor c = SendColor.Red; В Java v5.0 константы перечисления - статические члены класса, находящиеся в классе и представляющее собой значения класса. Упорядочены. Значения задавать нельзя. SendColors.valuesof(); .ordinal(); .value(“Red”) // -> 0 enum Apples { …. Apple4(10); /// Каждое значение перечислимого типа должно быть со своей ценой …. int price; public Apples(int p) { price = p; } public void set_price(int p){…} public int get_price(){….} } ….. Apples x = Apples.Apple4; // можно писать без «new». Это исключение для перечислений // Apples.Apple4 – значение класса, а не поля класса Объекты перечислений нельзя копировать. Наследование от перечислений запрещено. |
п2.4.2 Диапазоны
Паскаль var x: L..R; |
Модула 2 var x: [0..N]; y: CARDINAL[0..N]; i:INTEGER; j:CARDINAL; x := 0; Проверки не будет x := i; Вставка квазистатической проверки, если нельзя вычислить i x := y; Проверки не будет. Напомню, что переменные типа CARDINAL могут принимать значения от 0 до 65535, а INTEGER от -32768 до 32767 (для 16-ти битных компиляторов) |
Ада Type Diap is range 0..N; Type Pos is new INTEGER range 0..MAX_INT; новый тип данных. …. I:integer; Y:Pos; Y := I; компилятор вставит сообщение об ошибке, т.к. это разные типы данных (из-за «new») Y:=Pos(I); Вставка проверки на знак Subtype Natural is range 1..MAX_INT; J:Natural ……… I := J; Проверки не будет J := I; В этой строчке будет проверка |
Ни в одном из современных языков программирования нет типов-диапазонов, т.к. современных языках чётко определены индексы массив: 0 <= i <= N-1, а основной областью применения диапазонов было именно задание типов индекса массива.
п.2.5 Указатели и ссылки
Адрес :
-
Указатель
-
Имя
-
Метка
Строгие Стандартный Паскаль, Модула-2, Ада, Оберон (со сборкой) Pascal Type PT = ^T; {Modula-2 Type PT = pointer to T;} var i :T; Инициализировать указатель можно только двумя способами – либо другим указателем, либо выделением новой памяти NEW(p : PT); Поэтому все данные чётко разделяются на именованные, либо не именованные. Указатель служит для работы с анонимными данными в динамической памяти. Смысл – избежание части ошибок | Не строгие C, C++, Turbo Pascal Можно получать адрес любого объекта с помощью операции взятия адреса «&» Существует абстрактный указатель «void *» T * => void * автоматически void * к T * автоматически не приводится T * p; void *pp; pp = p; p = (T *)pp; |
Проблемы строгих и нестрогих указателей:
-
Удаление памяти (Dispose(p : PT)) не в своё время, что приводит к появлению «висячих ссылок» - указателей, которые должны на что-то указывать, но не указывают.
-
Накопление мусора – памяти, на которую не указывает ни один указатель.
P,P1 : PT;
New( P );