urkc_7 (1013652)
Текст из файла
ФЕДЕРАЛЬНОЕ АГЕНТСТВО КАДАСТРА ОБЪЕКТОВ НЕДВИЖИМОСТИ
ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО УНИТАРНОГО ПРЕДПРИЯТИЯ «ФЕДЕРАЛЬНЫЙ КАДАСТРОВЫЙ ЦЕНТР «ЗЕМЛЯ»
«ЮЖНЫЙ РЕГИОНАЛЬНЫЙ КАДАСТРОВЫЙ ЦЕНТР «ЗЕМЛЯ»
| УТВЕРЖДАЮ | |
| Директор филиала ФГУП «ФКЦ «Земля» «Южный региональный кадастровый центр «Земля» | |
| ______________ Ю.М. Князев | |
| «______»_________________ 2005 г. |
РЕКОМЕНДАЦИИ ПО РАЗРАБОТКЕ XML СХЕМ
| Главный конструктор | _______________ /Д.П. Калачев/ |
Таганрог, 2005 г.
Содержание
1. Термины и определения. 3
2. Общие рекомендации. 8
2.1. Типы схем 8
2.2. Стандарт именования 8
2.3. Фасеты 9
2.4. Структурные модели 10
2.5. Архитектурные формы контейнера 11
3. Общие требования к проектированию XML схем 13
3.1. Основные требования. 13
3.2. Проверка XML-документов на допустимость 13
3.3. Аннотации 14
3.4. Версия пакета обмена 14
3.5. Одинаковые наименования 16
3.6. Размер документа 18
4. Повторное использование 19
4.1. Основные повторноиспользуемые подсхемы 20
4.1.1. TYPESData.xsd 20
4.1.2. TYPESCertificate.xsd 20
4.1.3. TYPESOrganization.xsd 21
4.1.4. TYPESPerson.xsd 21
4.1.5. TYPESObjectLocation.xsd 21
5. Приложения 22
1.Термины и определения.
Архитектурная форма контейнера (architectural container form) - применение или адаптация заслуживающих внимания и повторяющихся шаблонов к структурной модели XML
Абстрактная форма контейнера (abstract container form) — архитектурная форма или шаблон, включающий повторяющиеся контейнеры-элементы с одинаковыми именами, в определенном контексте. Абстрактная форма контейнера подразумевает использование до некоторой степени абстрактных имен элементов (имен "тегов"). В качестве примера абстрактного имени можно привести имя "<PersonName>" (полное имя), используемое вместо более конкретного имени "<EmployeePersonName>" (полное имя сотрудника).
Атрибут (attribute) - именованный контейнер для данных. XML - атрибут синтаксически похож на HTML - атрибут (пара "имя-значение"). Важно отметить, что XML - атрибут определяется внутри конкретного элемента и не может повторяться.
Camel case - способ использования регистра символов в фразе, слове, или терме. В зависимости от источника, техника использования может отличаться. Чаще всего он предполагает следующее: первый символ каждого выделяемого слова находится в верхнем регистре (заглавный), а все остальные - в нижнем регистре (прописные).
Дочерний элемент (child element) - дочерний или подчиненный элемент некоторого родительского элемента.
Компонент (component) - составная часть более крупного объекта или концепции. В примере с почтовым адресом компонентом является, например, название города. Концептуально, сочетание всех непосредственно входящих компонентов представляет собой исходный объект, частями которого они являются.
Компонентная структурная модель XML (component XML structure model) -модель структуры, состоящая из наборов подобных или взаимосвязанных контейнеров, объединенных в именованные группы. XML-схемы, описывающие эти группы элементов, становятся кандидатами на повторное использование в качестве подсхем.
Контейнер (container) - в контексте XML, это обычно элемент, или атрибут. То есть объект, содержащий данные, другой контейнер, то и другое вместе или ничего.
Содержимое или контент (content) - значения данных, содержащиеся в XML-документе
Концепция данных (data concept) - общая абстрагирующая классификация для типа или набора данных. К примерам концепций данных относятся "почтовый адрес", "полное имя", "телефонный номер" и т. д.
Составляющая концепции данных (data concept particle) - определенный набор составных частей, фрагментов информации, или компонентов концепции данных. К примеру, имя и фамилия - составляющие концепции данных "полное имя".
Составная часть данных (data particle) - часть, фрагмент, или компонент концепции данных. Составная часть данных часто рассматривается как "атом" (т. е. представляет собой наименьший возможный результат декомпозиции данных).
Степень кардинальности (degree of cardinality) - заданный предел, наименьшее или наибольшее возможное количество повторений элементов данных.
Элемент (element) - именованный контейнер для данных. XML-элемент имеет ту же синтаксическую форму, что и HTML-элемент ("<имя-элемента>...</имя-элемента>", или "<имя-элемента/>").
Интеграция предприятия (enterprise integration) - цель и процесс согласования и интеграции информационных активов различных систем предприятия.
Предприятие (enterprise) - бизнес или объединение взаимосвязанных бизнесов, действующих как единое целое. Предприятие включает ресурсы (людские и др.), процессы, информацию, цели и стратегии.
XML (extensible Markup Language - расширяемый язык разметки) - язык, возникший как согласованное подмножество SGML. XML часто называют самоописывающим языком метаданных. XML получил популярность как язык, используемый в Web-приложениях и язык для определения транзакций электронной коммерции
Гибкость (flexible) - архитектурная характеристика; когда структура может быть расширена или сжата.
Горизонтальная структурная модель XML (horizontal XML structure model) - модель структуры, в которой для хранения данных используются преимущественно контейнеры-атрибуты. Ее называют также "плоской".
Гибридная форма контейнера (hybrid container form) - архитектурная форма контейнера, в которой сочетаются лучшие характеристики и возможности всех остальных форм контейнера.
Интеграция (integration) - процесс, ведущий к порождению, комбинированию, объединению, обмену, преобразованию и обработке информационных активов несколькими системами предприятия.
Метаданные (metadata) - характеристики, форма, допустимые значения, стандарты и правила, описывающие и определяющие данные. Часто упоминаются как "данные о данных".
Родительский элемент (parent element) - элемент-владелец (или вышестоящий) для одного или нескольких дочерних элементов.
Синтаксический анализатор (parser) - в случае XML, служебная программа, проверяющая синтаксис XML-документа и позволяющая приложениям обрабатывать документ (осуществлять навигацию, извлекать данные и вставлять данные).
Шаблон (pattern) - характерная форма или оболочка, которую можно адаптировать для конкретных нужд и неоднократно использовать.
Повторное использование (reuse) - возможность использовать что-либо более одного раза. Более узко - возможность использовать более одного раза то, что было разработано специально с прицелом на возможность повторного использования.
Разработка с прицелом на повторное использование (reuse engineering) -проектирование, разработка и развитие информационного актива, выполняемые специально с расчетом на возможность его неоднократного использования.
Собственно повторное использование (reuse harvesting) - установление возможности, проверка, и использование повторноиспользуемого информационного актива.
Строго типизированные данные (strongly typed data) - данные, которые были описаны или определены с детальными характеристиками, такими, как тип данных (например, string, integer, date и т. д.).
Тег (tag) - синтаксическая форма XML для задания имени контейнера или структуры.
Стандарт именования (taxonomy) - схема и форма классификации, часто применяемая для создания имен.
Вертикальная структурная модель XML (vertical XML structure model) - структурная модель, складывающаяся преимущественно из контейнеров-элементов. Визуально такая модель может быть представлена как направленная сверху вниз.
XML-атрибут (XML attribute) - вид контейнера XML, который определяется внутри XML-элемента. XML-атрибут не может существовать сам по себе (без соответствующего элемента). XML-атрибут может содержать данные или ничего не содержать (пустой). XML-атрибут не может содержать другой атрибут или элемент.
XML-документ (XML document) - файл, документ, транзакция или сообщение, определенные с использованием синтаксиса XML. Объемлющий контейнер для контейнеров XML и значений данных.
XML-элемент (XML element) - наиболее часто используемый тип контейнера XML. XML-элемент определяется в форме имени тега, заключенного в угловые скобки. XML-элемент можно определить как содержащий данные, другие элементы, то и другое вместе, или нечего. XML-элемент можно также определить как пустой, то есть элемент, который не может содержать никакого значения.
XML-Схема (также известная как W3C XML-Схема) (XML Schema) - основанный на XML вид схемы, включающий правила и ограничения для соответствующего XML-документа. XML-Схема может включать расширенный набор характеристик метаданных (формат, структура, правила и допустимые значения). Как и определено в майских 2001 года рекомендациях WWW консорциума.
2.Общие рекомендации.
2.1.Типы схем
W3C XML-Схемы, используются для описания содержимого, ориентированного на транзакции. Благодаря самоописывающейся природе XML и при условии, что используются описательные (интуитивно понятные) имена элементов, XML – схема строится так, чтобы человек потенциально был способен сориентироваться в строении схемы и интуитивно понять ее содержание.
2.2.Стандарт именования
Имя элемента или атрибута XML должно быть описательным, общепризнанным, не нарушать синтаксических правил XML и интуитивно понятным ("правило интуитивности").
В имени элемента или атрибута XML необходимо использовать символы обоих регистров. Разделители между составными частями имени используются только для обеспечения читабельности имен элементов и атрибутов.
Существуют два способа визуального деления имени элемента или атрибута в XML:
-
использование в именовании подхода "camel case", при котором каждый начальный символ каждой составной части имени находится в верхнем регистре, а остальные символы - в нижнем, визуально разделяет составные части;
-
для визуального деления имени элемента или атрибута в XML можно использовать символы подчеркивания ("_")
Имена атрибутов и элементов XML должны иметь оправданную длину (быть не слишком многословными, но и не слишком сокращенными). Длина имен атрибутов и элементов XML должна быть оптимизирована и согласована с большинством общих источников данных и получателей данных.
Абстрактные элементы и атрибуты XML, из имени которых исключены внутренние "роли" или "классификации" и для которых уточнение их текущего назначения производиться с помощью их родительских элементов хорошо подходят для повторного использования. Имена элементов и атрибутов могут содержать краткие имена – Name, Date, Type и т.д.
При использовании множественного типа элемента использовать первоначально контейнер-элемент с этим именем во множественном числе с указанием единственного возникновения этого элемента (minOccurs=1 и maxOccurs=N), связанным с контейнером–элементом множественного типа с именем в единственном числе.
Пример.
В случае, когда количество повторений некоторого элемента в группе внутри родительского элемента имеет существенное значение для логики работы, необходимо добавлять на уровне родительского элемента атрибут, содержащий в себе число повторений.
2.3.Фасеты
Фасеты перечисления (список допустимых значений) могут использоваться для поддержания внутренних стандартов и, в некоторых случаях, для разрешения различий в характеристиках метаданных между источником и получателем данных, путем ограничения допустимых значений набором, согласованным с обеими системами.
Фасеты перечисления (список допустимых значений) можно использовать для описания стандартов данных, таких как наборы кодов (например, коды регионов, единиц измерений и т.д.). Однако следует соблюдать осторожность в случаях, когда списки перечислений определяются внутри нескольких схем, а не во внешнем подмножестве схем, на которые можно ссылаться. Имеется в виду, что при дублировании списков перечислений в двух или более схемах можно получить недостоверные данные, когда при сопровождении XML-Схем списки перечислений будут подвергаться модификации, и внесенные в них изменения не будут отражены одинаково во всех копиях. Этой ситуации можно избежать с помощью определения списков перечислений во внешней подсхеме и дальнейшего использования этой подсхемы через ссылки на нее.
Списки перечислений должны быть согласованы между всеми сторонами обмена, не должны превышать более 50 значений и обновляться не чаще 1 раза в год.
2.4.Структурные модели
XML-документ состоит из элементов, включающих содержимое данного документа. Элементы находятся в иерархической подчиненности по отношению друг к другу и читаются сверху вниз, слева направо, причем имеется единственный корневой элемент. Наибольшая глубина вложенности элементов для содержания не должна превышать 10 уровней.
Вертикальные структурные модели компонуются преимущественно из контейнеров-элементов. В сочетании с повторением элементов (кардинальность или мультипликативность), вертикальные модели структур XML являются наиболее гибкими. Они могут быть динамически расширены или сжаты в соответствии с характеристиками содержащихся данных
В горизонтальных структурных моделях используется значительное количество атрибутов. Поэтому они имеют скорее "горизонтальную" протяженность, нежели вертикальную. Наиболее эффективно использовать XML-атрибуты в качестве контейнеров для порядкового номера элемента в последовательности повторяющихся элементов, для описательной классификации элемента, для значений стандартных кодов, описания функции или вида деятельности и для хранения отдельных частей элемента, содержащего данные.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.















