И.Г. Головин - Конспект лекций по курсу Языки программирования (1161120), страница 9
Текст из файла (страница 9)
Мусор (garbage) объект существует(операция delete не выполнена)Пример (C++, мусор)42X *pa = new X();Pa = new X();Важным вопросом становится, а что лучше висячая ссылка или мусор?Висячую ссылку легче отловить, легче обнаружить, мусор обнаруживается ошибкой упользователя, что очень плохо.В языках без динамической сборки мусора(где нет delete), необходимы дополнительныенакладные расходы(правда сейчас сборщики мусора работают параллельно выполнениюпрограммы, что несколько уменьшает накладные расходы).Одним из этапов работы сборщика мусора является дефрагментация памяти.Она нужна для того ,чтобы можно было выделить нужный объём непрерывной памяти(у насможет быть достаточно свободной памяти, но не подряд идущей).Промоделируем данную ситуацию в С: будем запрашивать realloc каждый раз чуть больше,чем выделили, получим такую картину:Динамический сборщик мусора сдвигает всё к одному концу:В С# можно обращаться к malloc, free и тд. Для этого существует понятие fixed-блоки, вкоторых можно обращаться к подпрограммам на C/C++.Fixed (p = 0) – гарантируется,что значение р будет неизменным.Это необходимо для явного обращения к С, С++ из С#.ОБЛАСТЬ ВИДИМОСТИОбласть видимости – это некоторая часть программы, в которой имя можно использовать.Область видимости характеризует только именованные объекты.С понятием область видимости связано понятие определяющего вхождения (имени объектаданных)Если определяющих вхождений несколько, то имеет место перегрузка.В современных языках программирования либо нельзя перегружать пользовательскиеимена, либо перегрузка допускается только для имён функций (иногда можно перегружатьимя типа).Пример (Name mangling)43class X{...void f(){};...}Здесь f() непонятное имя (сложно отслеживать в отладчике – будетнаписано «”dfsdf” не определена», ошибку выдаст линкерИспользующих вхождений может быть много(хотя бы 1)Хороший компилятор должен выдавать предупреждение – имя описано, но не используетсяСтатическая область видимости – область видимости, которая определяется во времятрансляции.
Динамическая область видимости – поиск вхождения имени в соответствии сисполнением программы.Все процедурные языки(например, С, С++,Pascal) – имеют статическую областьвидимости(или с блочной структурой).С ВОЙСТВА ОБЛАСТИ ВИДИМОСТИ1. СтатическаяОбласть видимости статическая и динамической быть не может (однако из этогоправила есть исключения).2. ВложенностьВложенность областей видимости (может быть как на рисунке слева, но не как нарисунке справа).В языке С область видимости (блок, файл) – статические.
Однако бывают и динамическиеобласти видимостиПример (Паскаль)Module Mvar x;//x1procedure Pvar x;//x2beginP1; x:=0;44End P;Procedure P1BeginX:=1;End P1;BeginP;P1;End M;Соответствие устанавливается следующим образом: в момент рассмотрения использующеговхождения, компилятор находит определяющее вхождение. Оно проверяется по последнейобъемлющей области видимости.Анализ зависит от того, что определяется под областью видимости. Если статическая, то вприведенном примере в P x как х2, в Р1 х как х1.
Если динамическая, то поиск происходит взависимости вложенности друг в друга.Если приведенный выше пример изменить следующим образом:M[х1Р[x2P1[x2…то во второй раз в P1 будет ссылка на х1.Заметим, что поиск обработчика исключений в C++ происходит аналогично поиску в случаединамической области видимости (проводится поиск по стеку вызовов).ОБЛАСТЬ ДЕЙСТВИЯОбласть действия – область, в которой объект доступен и может использоваться.Область видимости(Scope), область действия (extend) – иногда не совпадают.Если термин «область видимости» применим к имени объекта, то область действия – ксамому объекту.Замыкание( closure) – такое понятие, в котором область действия шире, чем областьвидимости (характерно для функционального программирования).
Бывает лексическое идинамическое.Пример (Lisp)(defun f(x) ((+ x 1))) – здесь первый x – определяющеевхождение, второй x – использующее вхождение(sety y 5)45(defun f(x) ((+ x y))) – здесь x – связанная переменная, а y –свободная переменная и входит в замыкание f(sety a 3)(f a) – результат 8(sety y 10)(f a) – зависит от вида связывания: если динамическое 13, иначе 8Другой пример – лямбда-функции в языке C#.Пример (C#)Лямбда-функция называется еще анонимная функция. От обычнойфункции она отличается типом(X) => X + 1 – делегатdelegate z { return z + 1 }void P (int x) { return x + 1; }(y) = y + x – здесь значение x будет захваченоВИРТУАЛЬНАЯ МАШИНА ЯЗЫКА ПРОГРАММИРОВАНИЯСуществуют компилируемые и интерпретируемые языки.Если рассматривать процесс как «черный ящик», то компиляция и интерпретация – это однои то же.
В чем же разница?Примеры языков: C –классический компилируемый язык, а Javascript интерпретируемый.Они отличаются степенью удобства и накладными расходами.Интерпретатор – фиксированный, определяется семантикой языка, а компилятор можнооптимизировать.Есть ли мера того, насколько язык компилируем или интерпретируем (то есть, что дляконкретного языка подходит больше – компиляция или интерпретация?) Это Связываниетип объект данных. При статическом связывании легче генерировать программный код ивыгоднее использовать компилятор. При динамическом связывании можно (и проще)использовать интерпретатор.Большинство современных языков программирования основано на микроядре. В микроядререализован свой язык программирования. Например, IA 32, x86-64 архитектуры имеют своюсистему команд, инструкций (инструкция вызывает функцию на языке микроядра).Машинный код является интерпретирующимся аппаратно.
Различные семействапроцессоров AMD, Intel имеют одну и ту же систему команд, различающуюся микроядром. Изэтого следует, что машинный код можно интерпретировать и программно, отсюдавозникает понятие виртуальной машины.46Если можно интерпретировать даже машинный язык, то можно, вообще говоря,представить виртуальный компьютер, у которого машинным языком является наш языкпрограммирования.ПримерМИР2,3 – входной язык был язык аналитиков (Algol 60)LISP machines – машинным языком был LISPПроцесс программирования можно рассматривать как программирование на иерархиивиртуальных машин (на примере Java):Рассмотрим подробнее виртуальный компьютер языка Java:Виртуальный компьютер JavaJVMJNIВиртуальный компьютер (ОС)Программно-аппаратный вычислительный комплексРеализация функций компилятора (микроэвм)Для сравнения рассмотрим виртуальный компьютер языков C/C++:Виртуальный компьютерсистемныевызовыОСассемблерныевставкиПрограммно-аппаратный вычислительный комплексРеализация функций компилятора (микроэвм)Существовала аппаратная реализация JVM – picoJava.Программы, которые не используют интерфейс ОС – более переносимы.
JNI (Java NativeInterface) – нужна, когда не хватает набора функций виртуального компьютера, для вызовафункций операционной системы. Это обертка C/C++ интерфейса в Java-вызовы. В 50-х, 60-хAPI включал в основном управление внешними устройствами. Дописывая библиотеки наC/C++, мы дописываем компьютер ОС.ОСНОВНЫЕ ПОНЯТИЯ ИМПЕРАТИВНЫХ ЯЗЫКОВПРОГРАММИРОВАНИЯБазис императивных языков программирования состоит из двух частей:1.
Скалярный базис – примитивные (простые) типы данных и операции472. Структурный базис – составные типы данных, операторы.СКАЛЯРНЫЙ БАЗИС ИМПЕРАТИВНЫХ ЯППРОСТЫЕ ТИПЫ ДАННЫХПростые типы данных делятся на следующие категории:1. Арифметическиеa. целые – знаковые, беззнаковые;b. вещественные – плавающие, фиксированные2. Символьные3. Логические4. Порядковыеa. диапазонb. перечисления5. Ссылки и указатели6. Подпрограммные типы данныхМы будем рассматривать первые 5 типов данныхВ основном компьютеры вычисляют, так что начнем с рассмотрения арифметических типовданныхАрифметические типы данныхЦелые типы данныхБудем рассматривать целые типы данных различных языков программирования в 5аспектах:1. универсальность2. наличие/отсутствие беззнаковости3.
представление4. надёжность5. набор операций1. УниверсальностьВ Стандартном Паскале 1 целый тип данных – intВ языке Java:byte (0 .. 255)short (-32768 .. 32768)48int (-231 .. 231 - 1)long (-263 .. 263 -1)В языке C++:charshort intlong long longКроме того, ко всем типам добавляются ключевые слова unsigned или signed.В языке C#:sbyteshortintlongbyteushortuintulongПричем sizeof(T1)<sizeof(T2), где T1 выше T2Зафиксировано представление или не зафиксировано? Если представление зафиксировано,то такие типы переносимые, но менее универсальные.2. Наличие или отсутствие беззнаковостиЭтот пункт тесно связан с надежностью.Какую программу можно назвать надежной? Ту, в которой мало ошибок.
Соответственно,ненадежная программа – та, в которой много ошибок. Ошибка – несоответствие работыпрограммы ожиданию пользователя. Надежные конструкции – такие, которые непровоцирует ошибки.Беззнаковый тип ненадежен, потому что в некоторых случаях он ошибочноинтерпретируется как знаковый (при этом компилятор не выдает предупреждений), чтоприводит к ошибкам.Возникает вопрос, а зачем тогда нужен беззнаковый ТД? Потому что есть address – всегдабеззнаковый.Java не содержит беззнаковых тд (кроме byte – но он не базовый).Безопасное преобразование из T1 в T2:T2(T1(T2))=i493. Преобразования типовРасширяющие преобразования целочисленных типов это безопасно, язык долженразрешать.
Сужающие – опасно и ненадежно,язык должен запрещать. Преобразования иззнакового в беззнаковое опасноНеявное – которое автоматически вставляет компиляторЯвное – (Т) exprЕдинственная проблема связана с С и с С++ – любой арифметический тип может неявнопреобразовываться.Целочисленные типы в языке Модула 2INTEGERBYTESHORTINTCARDINALLONGINTВ C не запрещены преобразования unsigned-signed, потому что в первый стандарт их невключили, а впоследствии было уже написано множество программ, использующих такиепреобразования. Ниша языка С – язык системного программирования.Пример (C)uint i;for(i = N-1; i >= 0; --i) S – операция --i не определенаРефакторинг – процесс согласованного изменения программы с целью преобразования видапрограммы(не функциональности). Обычно это делается с целью улучшенияудобочитаемости и понятности кода.В языке C# существует блок checked{}, в котором выполняется проверка на диапозонзначений.
По умолчанию стоит unchecked, но можно это изменить, если интересуетнадежность.4. НадежностьСм. знаковость/беззнаковость.5. Набор операций+ - / * % (операции без побочных эффектов)<, >, <=, >= ,==, !=|, & ,^ ,~<<, >>++,--,*=50Семантика деления зависит от типа операндовХватит ли этого набора операций в языке Java? Нет, 2 сдвига вправо(SAL SAR SHL SHR). Нехватает SHL SHR – необходимо добавить беззнаковый сдвиг вправо.Кратко напомним основные проблемы типов данных:УниверсальностьНадежностьПредставление (фиксировать или нет)Ввести широкую номенклатуру типов данных и фиксировать представление – так можнолегко решить вопросы универсальности и надежности.Модула 2 – просто запрещает любые преобразования беззнакового типа в знаковый.
Вомногих ЯП наличие беззнаковости отражено тем, что есть базисный набор типов, длякаждого изкоторых есть его без знаковый эквивалент. Например, в языке С:charunsigned charshortunsigned shortintunsigned intlongunsigned longВ языке АДА была осуществлена концепция «тип-подтип». Был решен ряд важных проблем.Идея следующая: каждый объект данных принадлежит единственному типу данных.Типы соответствия:множество значениймножество операцийВозникла проблема надежности и ограниченности представления.