XML (1013985)
Текст из файла
XML (eXtensible Markup Language) - рекомендованный W3C язык разметки. XML - текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе специализированных языков разметки. XML является упрощенным подмножеством языка SGML.
Язык XML имеет следующие достоинства:
-
Это человеко-ориентированный формат документа, он понятен как человеку, так и компьютеру.
-
Поддерживает Юникод.
-
В формате XML могут быть описаны основные структуры данных - такие как записи, списки и деревья.
-
Это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей.
-
Имеет строго определенный синтаксис и требования к анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым.
-
Широко используется для хранения и обработки документов;
-
Это формат, основанный на международных стандартах;
-
Иерархическая структура XML подходит для описания практически любых типов документов;
-
Представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
-
Не зависит от платформы;
-
Является подмножеством SGML, для которого накоплен большой опыт работы и созданы специализированные приложения;
К известным недостаткам языка можно отнести следующие:
-
Синтаксис XML избыточен.
-
Размер XML документа существенно больше бинарного представления тех же данных (порядка 10 раз).
-
Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON, YAML) и особенно в форматах данных, оптимизированных для конкретного случая использования.
-
Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
-
Для большого количества задач не нужна вся мощь синтаксиса XML, и можно использовать значительно более простые и производительные решения.
-
Пространства имен XML сложно использовать и их сложно реализовывать в XML парсерах.
XML не содержит встроенной в язык поддержки типов данных. В нем нет понятий "целых чисел", "строк", "дат", "булевых значений" и т. д.
Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами.
Вообще говоря, XML можно рассматривать не только как новый язык разметки, но и как основу для целого семейства технологий:
| XML | Технические рекомендации об использовании XML |
| DTD | Определение типа документа (схема) |
| XDR | Формат XML Reduced (схема Microsoft) |
| XSD | Определение схемы XML (схемы W3C) |
| Пространство имен | Метод определения имен элементов и атрибутов |
| XPath | Язык путей XML |
| XLink | Язык ссылок XML |
| XPointer | Язык указателей XML |
| DOM | API для объектной модели документа |
| SAX | Простой API для XML |
| XSL | Расширяемый язык таблиц стилей |
| XSL-FO | Объекты форматирования XSL |
| XSLT | Язык преобразований XSL |
| XInclude | Синтаксис XML Include |
| XBase | Синтаксис XML Base URI |
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.















