Jump to content

WARC (формат файла)

Веб-архив
Расширение имени файла
.warc
Тип интернет-СМИ
приложение/варк [1]
Расширено с АРК [2]
Стандартный ИСО 28500:2017 [3]
Открытый формат ? Да
Веб-сайт ПК .github .что /warc-спецификации /спецификации /warc-формат /варк-1 .1-аннотированный /

WARC архивный (Web ARChive) Формат архива определяет метод объединения нескольких цифровых ресурсов в единый файл вместе со связанной информацией. Формат WARC представляет собой версию Интернет-архива . формата файла ARC_IA [4] который традиционно использовался для хранения « интернет-сканирований » в виде последовательностей блоков контента, собранных из Всемирной паутины . Формат WARC обобщает старый формат для лучшей поддержки потребностей архивных организаций в сборе, доступе и обмене. Помимо основного контента, записанного в данный момент, редакция включает в себя связанный вторичный контент, такой как назначенные метаданные , сокращенные события обнаружения дубликатов (см. §7.6 «повторное посещение») и более поздние преобразования. [5] Формат WARC создан на основе потоков HTTP/1.0 с аналогичным заголовком и использованием CRLF в качестве разделителей, что делает его очень удобным для реализации сканеров.

Впервые указано в 2008 году, [6] В настоящее время WARC признан большинством национальных библиотечных систем в качестве стандарта веб-архивирования. [7]

Программное обеспечение

[ редактировать ]
  1. ^ "приложение/варк" . Проверено 17 марта 2018 г.
  2. ^ "Введение" . СоурсФордж . Проверено 5 марта 2015 г.
  3. ^ «Информация и документация — формат файла WARC» . Проверено 16 марта 2018 г.
  4. ^ «ARC_IA, формат файла ARC Интернет-архива» . www.digitalpreservation.gov . 14 февраля 2008 года . Проверено 9 мая 2015 г.
  5. ^ «WARC, формат файла Web ARChive» . www.digitalpreservation.gov . 31 августа 2009 года . Проверено 9 мая 2015 г.
  6. ^ Арвидсон, Аллан; Кунце, Джон; Мор, Гордон; Стек, Майкл (5 июля 2008 г.). «Формат файла WARC» . IETF . Проверено 29 апреля 2021 г.
  7. ^ Аллегрецца, Стефано (21 апреля 2016 г.). «Новые перспективы веб-архивирования: стандарты ISO 28500 (формат WARC) и ISO/TR 14873, касающиеся качества веб-архивирования» . Дигилия . 2015 : 49–61.
  8. ^ Скривано, Джузеппе (6 августа 2012 г.). «Выпущен GNU wget 1.14» . Выпущена GNU wget 1.14 . Фонд свободного программного обеспечения, Inc. Проверено 25 февраля 2016 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 210a4eba5fa2692be7114cc62d4ab3d2__1720620540
URL1:https://arc.ask3.ru/arc/aa/21/d2/210a4eba5fa2692be7114cc62d4ab3d2.html
Заголовок, (Title) документа по адресу, URL1:
WARC (file format) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)