введение_1 (1085732), страница 13
Текст из файла (страница 13)
type_prorapt( ): /* печать приглашения на экране */
read_command(command, parameters): /* читать входные данные с терминала */
if (fork( ) !- 0) { /*запускает дочерний процесс */
/* текст родительского процесса */
waitpid(-1, &status, 0): /* ждать окончания дочернего процесса */
} else {
/* текст дочернего процесса */
execve(command, parameters, 0); /* выполнение command */
} }
В самом общем случае у команды execve есть три параметра: имя файла, который будет выполняться, указатель на массив аргументов и указатель на массив переменных окружения. Эти параметры мы кратко обсудим в дальнейшем. Различные библиотечные программы, включая execl, execv, execle и execve, разрешают пропускать параметры или определять их другими способами. В книге мы воспользуемся названием exec для того, чтобы представить системный вызов, вызываемый всеми этими процедурами.
Рассмотрим следующую команду:
ср file1 file2
которая используется для копирования файла file1 в файл file2. После создания оболочкой дочернего процесса последний находит и исполняет файл ср и передает ему имена исходного и целевого файлов.
Основной модуль программы ср (как и большинство других головных программ на С) содержит определение:
main(argc, argv, envp)
в котором в параметр argc входит количество записей в командной строке, включая имя программы. Например, для строки вверху argc равен 3.
Второй параметр argv является указателем на массив указателей. Элемент г массива указывает на f-ю запись в командной строке. В нашем примере argv[0] должен указывать на слово «ср», a argv[l] и argv[2] — на слова «filel» и «file2» соответственно.
Третий параметр функции main, envp, является указателем на массив строковых переменных окружения вида имя=величина, которые используются для передачи программе такой информации, как тип терминала или имя домашнего каталога. В листинге 1.1 третий параметр равен нулю, поскольку ничего не передается дочернему процессу.
Если команда exec кажется сложной, не огорчайтесь, потому что это один из наиболее сложных системных вызовов в POSIX. Все остальные намного проще. В качестве еще одного примера рассмотрим exit, процессы должны использовать его при завершении работы. У него есть всего один параметр, статус выхода, изменяющийся от 0 до 255. Он возвращается родительскому процессу через параметр statloc в системном вызове waitpid.
В UNIX под процессы отводится часть памяти, которая, в свою очередь, делится на три сегмента: текстовый (то есть код программы), сегмент данных (переменные) и сегмент стека. Сегмент данных растет снизу вверх, а стек увеличивается сверху вниз, как показано на рис 1.18. Между ними существует часть неиспользованного адресного пространства. Стек автоматически занимает такую часть этого участка памяти, какую необходимо, но расширение сегмента данных выполняется явным образом. Для этого используется специальный системный вызов brk, задающий новый адрес для границы сегмента данных. Однако этот вызов не определен стандартами POSIX, так как программистам для динамического распределения памяти рекомендуется использовать библиотечную процедуру malloc. Было решено, что низкоуровневую реализацию процедуры malloc не следует стандартизировать, потому что мало кто вызывает ее напрямую.
А
Cтэк
Промежуток
Данные
Текст
дрес FFFF
Рис. 1.18. Под процессы отводится три сегмента: текст, данные и стек
Системные вызовы для управления файлами
Многие системные вызовы имеют отношение к файловой системе. В этом разделе мы рассмотрим вызовы, работающие с отдельными файлами, а в следующем разделе обратимся к тем, которые оперируют каталогами или файловой системой в целом.
Чтобы прочитать или записать файл, его сначала нужно открыть при помощи вызова open. Для этого вызова указывается имя открываемого файла (задается или абсолютный путь файла, или ссылка на рабочий каталог) и код O_R.DONLY, O_WRONLY или O_RDWR, означающий, что файл открывается для чтения, записи или и того и другого. Для создания нового файла используется код O_CREAT. Возвращаемый дескриптор файла затем можно употребить при чтении или записи. Потом файл закрывается с помощью вызова close, который делает дескриптор файла доступным при следующем открытии (open).
Наиболее часто используемыми вызовами, без сомнения, являются read и write. Вызов read мы уже обсуждали, write имеет те же самые параметры. Несмотря на то, что большинство программ читает и записывает файлы с помощью последовательного доступа, некоторым прикладным программам необходима возможность доступа к любой, случайно выбранной части файла. Связанный с каждым файлом указатель содержит текущую позицию в файле. Когда чтение (запись) осуществляется последовательно, он обычно указывает на байт, который должен быть прочитан (записан) следующим. Вызов lseek может изменить значение позиции указателя, так что следующий вызов read или write начнет операцию где-либо в другой части файла.
У вызова lseek есть три параметра: первый — это идентификатор файла, второй — позиция в файле, а третий говорит, является ли второй параметр позицией в файле относительно начала файла (абсолютная позиция), относительно текущей позиции или относительно конца файла. Вызов lseek возвращает абсолютную позицию в файле после изменения указателя.
Для каждого файла UNIX хранит следующие данные: тип файла (обычный, специальный, каталог и т. д.), размер, время последнего изменения и другую информацию. Программа может запросить эту информацию через системный вызов stat. Его первый параметр определяет требуемый файл, а второй указывает на структуру, куда нужно поместить информацию.
Системные вызовы для управления каталогами
В этом разделе мы рассмотрим некоторые системные вызовы, относящиеся скорее к каталогам и файловой системе в целом, нежели просто к определенному файлу, как в предыдущем разделе. Первые два вызова, mkdir и rmdir, соответственно создают и удаляют пустые каталоги. Следующий вызов — 1ink. Он разрешает одному файлу появляться под двумя или более именами, часто в разных каталогах. Этот вызов обычно используется, когда несколько программистов, работающих в одной команде, должны совместно использовать один общий файл. Тогда этот файл может появиться в каталоге у каждого из программистов, возможно, под другим именем. Разделение (совместное использование) файла — это не то же самое, что копирование файла для каждого члена команды. При разделении файла изменения, производимые одним программистом, немедленно становятся видимыми для остальных — все происходит в одном файле. А при создании копии файла последующие изменения не влияют на другие копии этого файла.
Чтобы увидеть, как работает вызов link, рассмотрим ситуацию на рис. 1.19, а. Два пользователя, ast и jim, имеют свои собственные каталоги ast и jim с файлами. Если теперь пользователь ast запустит программу, содержащую системный вызов
link("/usr/jim/memo", "/usr/ast/note"):
то файл memo в каталоге Джима появится в каталоге Аста под названием note. Соответственно, /usr/jim/memo и /usr/ast/note теперь будут ссылаться на один и тот же файл. Хранятся ли каталоги пользователей в каталоге/usr, /user, /home или где-либо еще, определяется локальным системным администратором.
Возможно, станет понятнее, что делает системный вызов link, если разобраться в том, как он работает. Каждый файл в UNIX имеет уникальный номер — свой i-но-мер, который идентифицирует файл (identification — идентификация). I-номер — это индекс в таблице i-узлов (i-nodes), содержащей по одному на файл. Каждый i-узел включает в себя информацию о хозяине файла, о том, какие блоки на диске
он занимает и т. д. Каталог представляет собой просто файл, содержащий набор пар (i-номер, ASCII-имя). В первой версии UNIX под каждый элемент каталога было отведено 16 байт: два байта для i-номера и 14 байт для названия. Хотя теперь для поддержки длинных имен используется более сложная структура, концептуально каталог все еще остается набором пар (i-номер, ASCII-имя). На рис. 1.19 файл mail имеет i-номер, равный 16 и т. д. Вызов link просто создает новый элемент каталога, возможно, с новым именем, используя i-номер существующего файла. На рис. 1.19, б два элемента имеют одинаковый i-номер (70) и, таким образом, ссылаются на один и тот же файл. Если впоследствии один из них будет удален с помощью системного вызова unlink, другой элемент останется. Если будут удалены оба файла, UNIX убедится, что больше нет записей, соответствующих этому файлу (поле в таблице i-узлов хранит данные с номером элемента каталога, указывающие на файл), и удалит файл с диска.
B
in dev lib mnt usr bin dev lib usr
а
б
Рис. 1.19. Два каталога до присоединения/usr/jim/memo к каталогу ast (а); те же каталоги
после вызова link (б)
Как упоминалось выше, системный вызов mount позволяет объединять в одну две файловые системы. Обычная ситуация такова: на жестком диске находится корневая файловая система, содержащая двоичные (исполняемые) версии общих команд и наиболее часто использующиеся файлы. При этом пользователь может вставить в дисковод гибкий диск для чтения файлов.
При помощи системного вызова mount файловую систему с гибкого диска можно присоединить к корневой файловой системе, как показано на рис. 1.20. Типичный оператор на языке С, выполняющий монтирование, выглядит так:
mount("/dev/fdO". "/mnt". 0):
где первым параметром является имя специального блочного файла на диске 0, второй параметр — это место в дереве, куда будет вмонтирована файловая система, а третий параметр говорит о том, монтируется ли встроенная файловая система для чтения и записи или только для чтения.
/usr/ast /usr/jim /usr/ast /usr/jim
1
6 mail 31 bin 16 mail 31 bin