Двоичный XML
различные двоичные ) были предложены В качестве компактного представления XML ( расширяемого языка разметки форматы . Использование двоичного формата XML обычно снижает многословность XML-документов, тем самым также снижая стоимость синтаксического анализа. [1] но мешает использовать обычные текстовые редакторы и сторонние инструменты для просмотра и редактирования документа. Существует несколько конкурирующих форматов, но ни один из них еще не стал стандартом де-факто , хотя Консорциум Всемирной паутины принял EXI в качестве рекомендации 10 марта 2011 года. [2]
возможность преобразования документа в форму (XML), которую легко Двоичный XML обычно используется в приложениях, где производительность стандартного XML недостаточна, но ценится просматривать и редактировать, и обратно. Другие преимущества могут включать в себя возможность произвольного доступа и индексации XML-документов.
Основной задачей двоичного XML является создание единого широко распространенного стандарта. Международная организация по стандартизации (ISO) и Международный союз электросвязи (ITU) опубликовали стандарт Fast Infoset в 2007 и 2005 годах соответственно. Другой стандарт (ISO/IEC 23001-1), известный как двоичный формат MPEG для XML ( BiM ), был стандартизирован ISO в 2001 году. BiM используется во многих стандартах ETSI для цифрового и мобильного телевидения. Открытый геопространственный консорциум предоставляет спецификацию кодирования двоичного XML (в настоящее время документ с передовой практикой), оптимизированную для геозависимых данных (GML), а также эталон для сравнения производительности Fast InfoSet, EXI, BXML и deflate для кодирования/декодирования AIXM . [3]
Альтернативы двоичному XML включают использование традиционных методов сжатия файлов в документах XML (например, gzip ); или используя существующий стандарт, такой как ASN.1 . Однако традиционные методы сжатия предлагают только преимущество уменьшения размера файла без преимущества уменьшения времени анализа или произвольного доступа. ASN.1 /PER формирует основу Fast Infoset , который является одним из двоичных стандартов XML. Существуют также гибридные подходы (например, VTD-XML ), которые прикрепляют небольшой индексный файл к XML-документу, чтобы устранить накладные расходы на анализ. [4]
Двоичные XML-усилия
[ редактировать ]Проекты и форматы файлов, связанные с понятием двоичного XML, включают:
- Стандарт BiM от ISO , разработанный MPEG. рабочей группой
- Fast Infoset — стандарт, опубликованный ISO/IEC и ITU-T.
- Рекомендация W3C по эффективному обмену XML (EXI), основанная на работе Efficient XML от AgileDelta, Inc.
- Расширяемый двоичный метаязык (EBML) от Matroska
- Двоичный XML WAP (WBXML)
- Двоичный формат .NET: структура данных XML от Microsoft ; реализация, включенная в .NET Framework 3.0 и более поздних версий.
- Язык двоичной разметки (BML)
Другие проекты, функциональность которых связана с двоичными представлениями (или конкурирует с ними), включают:
- VTD-XML от XimpleWare и проект VTD-XML
- Буферы протоколов от Google
- Апач бережливый
- Служба распространения данных от OMG
- Apache Avro для больших данных
- Пакет приложений Android использует недокументированный двоичный формат XML; исходный код открыт и хорошо прокомментирован. [5]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Проблемы с производительностью двоичного XML http://webservices.sys-con.com/read/250512.htm. Архивировано 20 мая 2008 г. на Wayback Machine.
- ^ Джон Шнайдер, Такуки Камия, ред., «Эффективный формат обмена XML (EXI) 1.0», Рекомендация W3C от 10 марта 2011 г. [1]
- ^ Сравнительный анализ сжатия AIXM 5.1: как EXI, FI, BXML и deflate конкурируют при работе с географическими данными?
- ^ «Индексирование XML-документов с помощью VTD-XML» . Архивировано из оригинала 4 июля 2008 г. Проверено 28 ноября 2007 г.
- ^ «Где документирован двоичный формат XML для Android?» . Обмен стеками реверс-инжиниринга .