Отличие файлов форматов XLS и XLSX в Microsoft Excel
Отличие файлов в формате кслскс и кслс — это различия между проприетарным форматом .xls и открытым форматом .xlsx, которые представляют собой стандарты Microsoft Excel для электронных таблиц, где XLS является бинарным форматом на основе BIFF версии 8, а XLSX — открытым XML-форматом, введённым в Excel 2007.
- XLS (BIFF8): Бинарный формат, используемый в Excel 97-2003.
- XLSX (OOXML): Открытый XML-формат, введённый в Excel 2007.
- Microsoft Excel 97-2003: Версия Excel, поддерживающая формат .xls.
- Excel 2007+: Версия Excel, поддерживающая формат .xlsx.
Эволюция форматов XLS и XLSX
Формат XLS использует бинарную структуру BIFF, в которой данные организованы в виде последовательности записей. Каждая запись имеет фиксированный заголовок, содержащий тип, размер и содержимое, что делает формат компактным, но нечитаемым для человека. Однако такая структура подвержена повреждениям. В отличие от этого, XLSX представляет собой ZIP-архив, содержащий XML-файлы, такие как workbook.xml (структура листов), sheet*.xml (данные ячеек), styles.xml (форматирование) и drawings.xml (графики). Это обеспечивает модульность, возможность восстановления и валидацию с помощью схемы ECMA-376.
XLS ограничен приблизительно 65,000 строками и 256 столбцами, в то время как XLSX поддерживает до 1 миллиона строк и 16,000 столбцов. Также XLSX поддерживает больше макросов VBA, хотя это несет в себе риски безопасности.
Иерархическая структура файлов XLS и XLSX
Файлы формата XLS представляют собой монолитные бинарные файлы с разделами, такими как BOF/EOF records, worksheets и charts. Основные типы файлов включают Workbook, Worksheet и Chart. В отличие от этого, XLSX имеет иерархическую структуру ZIP-архива, содержащего несколько ключевых компонентов:
- [Content_Types].xml: определяет типы частей документа.
- _rels/.rels: управляет связями между компонентами.
- xl/: содержит основные данные, включая worksheets/, sharedStrings.xml, theme/ и media/.
Процесс создания XLSX включает несколько этапов: сжатие XML, архивация и преобразование в формат .xlsx. Существуют также различные виды файлов, такие как XLSM (XLSX с макросами) и XLTX (шаблоны).
Переход на формат XLSX и его влияние
Формат XLS устарел из-за своих ограничений и проблем безопасности, связанных с макросами, уступив место XLSX, который обеспечивает лучшую совместимость как открытый стандарт ISO/IEC 29500. XLSX позволяет уменьшить размер файлов на 50-75% благодаря сжатию и улучшает интеграцию с веб-технологиями (например, AJAX и API) и инструментами, такими как LibreOffice и Google Sheets.
Практическое применение формата XLSX включает миграцию устаревших данных для работы с большими датасетами (big data) и автоматизацию процессов. Например, для работы с XLSX используется библиотека Python openpyxl, в то время как для XLS применяется xlrd. Стандартизация формата XLSX оказала значительное влияние на бизнес-аналитику (BI) с использованием таких инструментов, как Power BI и Tableau, а также на облачные решения, такие как OneDrive.
Частые вопросы
Почему XLSX не открывается в старом Excel без конвертации?
Формат XLSX не поддерживается старыми версиями Excel, поэтому для его открытия необходимо конвертировать файл в формат XLS.
В чем разница в работе с макросами между XLS и XLSX?
Файлы XLS сохраняют макросы, тогда как XLSX может ломать VBA-код, что приводит к потере функциональности макросов.
Почему восстановление поврежденного XLSX сложнее?
Формат XLSX использует ZIP-структуру, что делает восстановление данных более сложным по сравнению с традиционным форматом XLS.

















