Список инициатив по веб-архивированию
![]() | в этой статье Использование внешних ссылок может не соответствовать политике и рекомендациям Википедии . ( июнь 2019 г. ) |
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/39/Map_of_Web_archiving_initiatives_58632FRT.jpg/363px-Map_of_Web_archiving_initiatives_58632FRT.jpg)
Эта статья содержит список инициатив по веб-архивированию во всем мире. Для удобства чтения информация разделена на три таблицы: инициативы по веб-архивированию, архивированные данные и методы доступа.
Эта страница Википедии изначально была создана на основе результатов, полученных для исследовательской работы «Опрос по инициативам веб-архивирования». [2] опубликовано командой Arquivo.pt (португальский веб-архив).
Инициативы по веб-архивированию [ править ]
Имя | Страна | Год создания | Технологии | Количество сотрудников | Комментарии | |
---|---|---|---|---|---|---|
На постоянной основе | Неполная занятость | |||||
Веб-архив на конец семестра | Соединенные Штаты | 2008 | Херитрикс , Вэйбэк | 6–10 | Веб-архив на конец срока собирает и сохраняет веб-сайты федерального правительства США ( .gov , .mil и т. д.) в законодательной, исполнительной или судебной ветвях власти в конце президентской администрации. Начиная с 2008 года, EOT до сих пор сохраняет веб-сайты от административных изменений в 2008, 2012 и 2016 годах и в настоящее время готовится к переходу в 2020 году. Партнерами проекта являются цифровая библиотека CA , Интернет-архив, Библиотека Конгресса, Университет Джорджа Вашингтона, Стэнфордский университет, Университет Северного Техаса и Издательство правительства США. | |
Archive.st | Соединенные Штаты | 2017 | Пользовательское программирование Archive.st, предоставленное US Support LLC. | >1 | 0 | Archive.st предоставляет бесплатное онлайн-архивирование в виде архива .JPG и HTML. |
Аркивера [3] | По всему миру (но со штаб-квартирой в Швеции) | 2020 | Решения с открытым исходным кодом, индивидуальное программирование и сценарии | 3 | 4 | Arkiwera — шведская компания, которая за годовую плату поддерживает цифровые архивы веб-сайтов и аккаунтов в социальных сетях. Он поддерживает автоматический сбор, воспроизведение, полнотекстовый поиск и экспорт данных. |
Веб-архив ЕС [4] | Евросоюз | 2013 | Архив-это сервис | 1 | Веб -архив ЕС объединяет записи веб-сайтов учреждений Европейского Союза , которые размещены в домене europa.eu и поддоменах. Его цель — сохранить веб-контент ЕС в долгосрочной перспективе и сделать его доступным для общественности. Архив был создан в 2013 году Историческим архивом Европейского Союза , а в 2018 году Управление публикаций ЕС взяло на себя эту задачу и создало службу Веб-архива ЕС. Коллекция архивных веб-сайтов подпадает под действие системы обязательного экземпляра ЕС , которая объединяет все материалы, созданные организациями ЕС, в обширную библиографию. | |
Веб-сайт правительства и политики штата Алабама и архивы социальных сетей [5] | Соединенные Штаты | 2005 | Архив-это сервис | |||
Веб-архив Австралии [6] | Австралия | 1996 | Система цифрового архивирования PANDORA (PANDAS) , Heritrix, Bamboo, NLA Trove , HTTrack , Webrecorder, outbackCDX. | 4 | >10 | Национальная библиотека Австралии возглавляет компонент «ПАНДОРА» Австралийского веб-архива, который использует выборочный подход и представляет собой совместную программу 10 агентств, обеспечивающих кураторский вклад. PANDORA использует систему рабочих процессов PANDAS (разработанную NLA в конце 1990-х годов) с HTTrack в качестве сборщика по умолчанию. Национальная библиотека Австралии также осуществляет массовый сбор данных с веб-сайтов правительства Австралии (Веб-архив правительства Австралии), используя сборщик Heritrix и веб-рекордер с внутренней инфраструктурой (называемой «Bamboo») для организации контента, а также разработанный NLA инструмент outbackCDX для управления индексированием. ограничения доступа к контенту. В дополнение к этим подходам Национальная библиотека также ежегодно собирает данные по всему домену .au, что делается в сотрудничестве с Интернет-архивом с использованием Heritrix и Wayback . В 2019 году PANDORA, Веб-архив правительства Австралии и все собранные домены были интегрированы в новый единый портал обнаружения и доставки через службу обнаружения Trove NLA. |
ОБЕЩАНИЕ проект [7] | Бельгия | 2017 | Херитрикс , PyWB | 7 | Проект PROMISE представлял собой двухлетний проект (2017–2019 гг.), в ходе которого изучались политические, юридические, технические и научные вопросы, связанные с архивированием бельгийской сети. Целью проекта было: а) выявить лучшие практики в области веб-архивирования; б) разработать стратегию сохранения бельгийской сети; в) запустить пилотный проект по сохранению и предоставлению доступа к архивной бельгийской сети; г) дать рекомендации. для внедрения устойчивой службы веб-архивирования. Проект инициирован Королевской библиотекой Бельгии. [8] и Государственный архив Бельгии [9] в сотрудничестве с Гентским университетом (Исследовательская группа по СМИ, инновациям и коммуникациям) [10] и Гентский центр цифровых гуманитарных наук), [11] Université de Namur (Исследовательский центр в области информации, права и общества) [12] и Верхняя школа Брюсселя-Брабанта [13] (Отдел исследований и обучения в области информатики и документации). В октябре 2019 года заключительный коллоквиум «Спасение Интернета: обещание бельгийского веб-архива»). [14] состоялся в КБР. На коллоквиуме были представлены основные результаты исследования. | |
Веб-архив КБР [15] | Бельгия | 2020 | 1 | КБР [16] или Королевская библиотека Бельгии разрабатывает оперативный веб-архив на основе результатов исследовательского проекта PROMISE. [7] (2017–2019). Операционная политика и техническая инфраструктура будут разработаны на основе стратегии, изложенной в проекте PROMISE. | ||
КАДОК-КУ Левен | Бельгия | 2022 | HTTrack , Heritrix , Archiveweb.page , Replayweb.page | 0 | 1 | Тематический архив с коллекцией, посвященной взаимодействию религии, культуры и общества в Бельгии. В 2023 году завершился исследовательский проект « Лучшие практики архивирования социальных сетей» во Фландрии и Брюсселе . |
MT.GOV Connect | Соединенные Штаты | 2007 | Архив-ИТ Сервис | 1 | Коллекция веб-сайтов государственных агентств штата Монтана, датируемых 1996 годом, частично во исполнение уставного мандата. [17] выявлять, приобретать, описывать и обеспечивать постоянный общественный доступ к государственным публикациям. Оцифрованные исторические государственные публикации доступны по адресу https://archive.org/details/MontanaStateLibrary. | |
Стиллио [18] | По всему миру | 2011 | Puppeteer, движок V8 , Gecko , WebKit , веб-службы Amazon | 3 | 4 | SaaS-решение для архивирования веб-сайтов периодических изданий и социальных сетей . Обеспечивает архивирование снимков экрана как статических, так и динамических веб-страниц в течение фиксированной продолжительности, которую можно настроить в соответствии с требованиями. Помогает в соблюдении нормативных требований, отслеживании тенденций, проверке рекламных баннеров и изменении версий. |
ПейджФризер [19] | По всему миру | 2009 | Поисковый сканер Deep Web от PageFreezer, Hadoop , Cassandra, Elastic Search | 60 | SaaS-решение для архивирования веб-сайтов и социальных сетей. Обеспечивает автоматический сбор, воспроизведение, полнотекстовый поиск и экспорт данных веб-сайтов, блогов, социальных сетей и платформ корпоративного сотрудничества для обнаружения электронных данных и соблюдения нормативных требований FDA, FINRA , FSA, SEC, федеральных правил доказывания, FOIA и законов об управлении записями. | |
OoCities — Архив GeoCities / Зеркало GeoCities [20] | Германия | 2009 | ||||
Архив Wikiwix — Линтервеб [21] [22] | Франция | 2008 | Селен + МонгоБД | Во франкоязычной Википедии разрабатывается с 2008 года. Это проект с открытым исходным кодом , который оптимизирует потребление инодов и, таким образом, заполняет жесткие диски. Содержит пространство аннотаций для архивных документов. Главный разработчик Фабьен Кулон, доктор дю Литис от имени Linterweb, хостинг Renater https://gitlab.com/dev_linterweb . | ||
Вебархив Австрия [23] | Австрия | 2008 | NetarchiveSuite, Heritrix , OpenWayback | 1 | 1 | |
Немецкая национальная библиотека [24] | Германия | 2012 | Инструменты oia GmbH | 6 | Сканирование выборочного веб-архива осуществляется немецкой компанией oia GmbH. Доступ ограничен читальными залами Немецкой национальной библиотеки. | |
ДИЛИМАГ (Цифровые литературные журналы) [25] | Австрия | 2007 | Веб-куратор | 2 | Один техник, другой для сбора метаданных. | |
Библиотека и Национальный архив Квебека (BAnQ) [26] | Канада | 2012 | Херитрикс , Вэйбэк . | 2 | ||
Программа веб-архивирования в Библиотеке и архивах Канады [27] | Канада | 2005 | Сервис Архив-ИТ | 4 | 3 | Веб-архивирование в Канаде — это законодательно установленная деятельность, которая осуществляется в целях сохранения цифровой информации в соответствии с разделом 8 (2) Закона о библиотеках и архивах Канады . [28] Над программой работают четыре штатных сотрудника и три сотрудника, работающих неполный рабочий день. Веб-архивирование в Библиотеке и архивах Канады [27] также используется для осуществления обязательного экземпляра . [29] |
Сбор и сохранение веб-информации - WICP (Китайский веб-архив) [30] | Китай | 2003 | Heritrix , Wayback и NutchWAX . | |||
Хорватский веб-архив (Hrvatski arhiv weba - HAW) [31] | Хорватия | 2004 | Сканирование: программное обеспечение DAMP, Heritrix | 2 | 2 | Хорватский веб-архив (HAW) представляет собой коллекцию контента, полученного из Интернета. В 2004 году Архив зародился как концепция выборочного сбора веб-ресурсов. Сбор данных по всему домену .hr проводится ежегодно с 2011 года, а также сбор тематических/событий для событий, представляющих национальный интерес. Содержимое архива общедоступно на веб-сайте HAW. (2 библиотекаря на полный рабочий день, 1 библиотекарь на неполный рабочий день, NUL ), 2 ИТ-специалиста на неполный рабочий день (SRCE - Университет Загреба, Университетский вычислительный центр ) |
Вебархив ( Национальная библиотека Чехии ) [32] | Чешская Республика | 2000 | Heritrix , Wayback и Seeder . | 5 | 2 | Чешский веб-архив ( Webarchiv ), поддерживаемый Национальной библиотекой Чешской Республики, занимается архивированием чешской национальной сети. Политика приобретения состоит из трех направлений: выборочный сбор (сбор ресурсов на основе критериев отбора), тематические коллекции (сосредоточенные на важных темах в области чешской сети) и комплексный сбор (автоматический сбор контента в национальном домене). В штате 1 менеджер, 3,5 куратора + 1,5 технического персонала. |
Сетевой архив [33] / Датский веб-архив ( Королевская библиотека Дании ) | Дания | 2005 | Расписание/сканирование: NetarchiveSuite , Heritrix , Browsertrix , Archiveweb.page. Интерфейс доступа/поиска/обнаружения и воспроизведение: SolrWayback . Все еще установлен Wayback для альтернативного воспроизведения, но планирую перейти на PyWb. | 1 | 5,5 ЭПЗ | С 2005 года сбор и сохранение датской части Интернета включено в датский Закон об обязательном экземпляре. Эту задачу взяла на себя Датская королевская библиотека . Публичный доступ к датскому веб-архиву отсутствует. Архив доступен только исследователям, связанным с датским исследовательским учреждением, которые запросили и получили специальное разрешение на использование коллекции для конкретных исследовательских целей. Этот веб-сайт https://www.kb.dk/en/find-materials/collections/netarkivet предназначен для информирования исследователей, владельцев веб-сайтов и других заинтересованных сторон о датском веб-архиве. |
Эстонский веб-архив [34] | Эстония | 2010 | Heritrix , Squidwarc , PhantomJS и Puppeteer для скриншотов главных страниц веб-сайтов, Pywb , Custom Curator Tool. | 3 | 1 | С 2006 года Закон об обязательном экземпляре позволяет Национальной библиотеке Эстонии собирать эстонские веб-сайты в качестве экземпляров обязательного экземпляра. Сбор информации в сети осуществляется, а архив поддерживается Национальной библиотекой Эстонии. |
Финский веб-архив [35] | Финляндия | 2006 | Heritrix , Solr , Pywb , поисковый робот Browsertrix , дополнение для Webrecorder , OutbackCDX , Twarc2 , YT-DPL . | 3 | >3 | Хранится в Национальной библиотеке Финляндии . Ежегодно собираются все домены *.fi, а также веб-серверы, расположенные в Финляндии. Помимо этих сборов, библиотека вручную выбирает соответствующие веб-сайты. |
BnF - обязательный экземпляр в Интернете [36] | Франция | 2006 | Heritrix , NetarchiveSuite , BCWeb, OpenWayback , SolrWayback, WARC Indexer/Solr | 11 | Во Франции с 2006 года закон об авторском праве и смежных правах в информационном обществе (известный как DADVSI) расширил сферу обязательного экземпляра на «знаки, сигналы, письменные произведения, изображения, звуки или сообщения любого рода», сообщаемые публике посредством электронными средствами - другими словами, обязательный экземпляр в сети. Архивирование французской сети — это юридическое обязательство, которое продолжает миссию BnF по сохранению наследия. Поскольку технически невозможно постоянно собирать весь веб-контент, цель обеспечения полноты обязательного экземпляра печатных документов превратилась в выборочный подход для создания цифровых коллекций, показывающих деятельность и поведение французских интернет-пользователей. | |
Ина (Национальный аудиовизуальный институт) [37] | Франция | 2009 | Сканирование: PhagoSite , Crocket на основе Firefox , Fantomas на основе PhantomJS / Доступ: Vortex / Поиск: Dowser на основе Elasticsearch | 7 | ||
Центр библиотечного обслуживания Баден-Вюртемберга [38] | Германия | 2003 | Сервис Архив-ИТ | 0.5 | Веб-сайты около 20 городов, муниципалитетов, районов и связанных с ними корпораций, а также государственных библиотек собраны BSZ по заказу в различных коллекциях Archive-It. Публичный доступ. Хранение данных: Сан-Франциско (Archive-It), а также резервное копирование с помощью инфраструктуры хранения данных Баден-Вюртемберга. | |
Веб-архив немецкого Бундестага [39] | Германия | 2005 | ||||
Веб-архив Национальной библиотеки Сечени | Венгрия | 2017 | Heritrix , Wayback, PyWb, Brozzler, Webrecorder , WCT | 3 | 2 | С апреля 2017 года по декабрь 2019 года Национальная библиотека Сечени ( http://www.oszk.hu ) реализовала пилотный проект веб-архивирования в рамках своей комплексной программы развития ИТ-инфраструктуры. В 2020 году веб-архивирование стало постоянной услугой Национальной библиотеки Сечени. С 2021 года создана правовая база и веб-архив работает согласно измененным пунктам закона о культуре и соответствующему постановлению правительства. Они проводят тематические, событийные и доменные сборы. У них есть небольшая демонстрационная коллекция с метаданными и возможностями полнотекстового поиска. Остальная часть архива не находится в открытом доступе. |
Исландия [40] | Исландия | 2004 | Херитрикс , OpenWayback | |||
Веб-архив Национальной библиотеки Ирландии [41] | Ирландия | 2011 | Архив-это сервис | 1 | 0,5 ЭПЗ | Национальная библиотека Ирландии выборочно архивирует ирландские веб-сайты, имеющие научное, культурное и политическое значение, через свой Выборочный веб-архив NLI . |
Палестинский веб-архив | Палестина | 2011 | Heritrix , Инструмент веб-куратора , Wayback , Rosetta | 1 | >3 | Национальная библиотека Палестины, собирающая домены .PS, 1 менеджер проекта на неполный рабочий день, 1 технический руководитель на неполный рабочий день, 1 библиотекарь на неполный рабочий день, 1 ИТ-инфраструктура на неполный рабочий день |
Национальная центральная библиотека Флоренции | Италия | 2018 | Архив-это Сервис | Целью проекта является сбор и архивирование цифровых документов и веб-сайтов, представляющих «культурный интерес» для итальянской истории и культуры, в соответствии с принципами национального закона об обязательном экземпляре. Коллекция Archive -it находится в открытом доступе. | ||
Проект веб-архивирования (WARP), Национальная парламентская библиотека , Япония [42] | Япония | 2002 | Херитрикс , OpenWayback, Solr | 4 | 1 | Проект веб-архивирования (WARP) занимается архивированием веб-сайтов с 2002 года. Закон о библиотеках Национального парламента, пересмотренный в 2009 году и вступающий в силу в апреле 2010 года, позволяет NDL архивировать веб-сайты официальных учреждений Японии: правительства, парламента, судов, местных органов власти. правительства, независимые административные организации и университеты. Веб-сайты культурных и международных мероприятий, проводимых в Японии, а также веб-сайты, связанные с онлайн-периодическими изданиями, также архивируются с разрешения их веб-мастеров. |
Национальная библиотека Кореи - OASIS (онлайн-архивирование и поиск в интернет-источниках) [43] | Корея | 2001 | Собственная система на базе СУБД Oracle и специализированной поисковой системы (IRS), выполняющей функции управления данными и поиска. | 3 | 11 | |
Национальная библиотека Люксембурга | Люксембург | 2015 | Херитрикс , Вэйбэк , Браузертрикс, Солр | 2 | Национальная библиотека Люксембурга ежеквартально проводит широкое сканирование домена .lu, а также выборочное сканирование и сканирование по событиям. Веб-сайты, собранные в Веб-архиве Люксембурга, обогащают родовые коллекции Национальной библиотеки, что позволяет сохранить цифровые публикации для будущих поколений. Webarchive.lu — это платформа информации и участия Люксембургского веб-архива. | |
Королевская библиотека [44] | Нидерланды | 2007 | Heritrix 3.3, Web Curator Tool 3.0 , Wayback , система электронного депо KB | ~10 | 1 инженер по сканированию, 1 разработчик программного обеспечения и 9 специалистов по сбору данных, все работают неполный рабочий день (что эквивалентно примерно 4 штатным специалистам). КБ выборочно собирает голландские объекты, представляющие исследовательскую и культурную ценность. | |
Национальная библиотека Латвии [45] | Латвия | 2005 | Инструмент веб-куратора и Wayback | 1 | В настоящее время хранится только для консервации, доступ для публики в разработке (ETA, июнь 2012 г.). Латвийский термин для сбора паутины — «расмошана». | |
Веб-архив Новой Зеландии [46] | Новая Зеландия | 1999 | Инструмент веб-куратора , Heritrix3 , Webrecorder , ArchiveIT, Browsertrix, Pywb, OutbackCDX , Rosetta | 5 | >10 | Сбор национальных доменов проводится с 2008 года и ежегодно с 2015 года в сотрудничестве с Интернет-архивом. Выборочный сбор данных осуществляется Национальной библиотекой Новой Зеландии, главным образом, с использованием инструмента Web Curator Tool. Три штатных сотрудника собирают веб-сайты, а несколько штатных сотрудников собирают сериалы в формате HTML или монографии в формате HTML. Поддерживается одним специализированным инженером по веб-архивированию и более широким отделом ITMS. Вопросами сохранности цифровых данных занимаются сотрудники, работающие с Rosetta. |
Национальная библиотека Норвегии [47] | Норвегия | 2001 [48] | ||||
Arquivo.pt [49] [50] | Португалия | 2007 | Собственная разработка , Heritrix , Wayback , NutchWAX , Pywb , Apache Solr , Brozzler , инструменты Webrecorder.net | 5 | Arquivo.pt — это исследовательская инфраструктура, которая сохраняет информацию, собранную из Интернета с 1996 года, и предоставляет общедоступную службу поиска по этой коллекции. Arquivo.pt сохраняет веб-сайты на нескольких языках и предоставляет пользовательские интерфейсы на английском языке. Архивированные данные могут автоматически обрабатываться для проведения исследований больших данных через распределенную платформу обработки или через интерфейсы прикладного программирования , которые облегчают разработку приложений с добавленной стоимостью. Команда Arquivo.pt также внесла свой вклад в научные и технические статьи , связанные с веб-архивированием, опубликованные в открытом доступе. | |
Веб-архив Чачака [51] | Сербия | 2009 | HTTrack | 1 | ||
Веб-архив Сингапур [52] | Сингапур | 2006 | Вэйбэк , Херитрикс , Солр | 3 | Веб-архив Сингапура находится в ведении Национального библиотечного совета Сингапура (NLB). NLB осуществляет доменное и выборочное архивирование веб-сайтов с упором на сингапурский контент. Коллекцию можно просмотреть в Национальной библиотеке Сингапура, а избранный контент, одобренный владельцами авторских прав, доступен в Интернете. | |
Цифровые ресурсы ( Университетская библиотека в Братиславе ) [53] | Словацкая Республика | 2015 | Heritrix 3.2.0, OpenWayback 2.2.0, Solr 5.2.1, Invenio , пользовательский инструмент куратора, Archivewebpage.org | 4 | 1 | Университетская библиотека в Братиславе (ULIB) провела первые эксперименты по сбору веб-страниц в 2008–2009 годах. В 2015 году УЛИБ ввел в эксплуатацию платформу для веб- и электронного архивирования (в ходе реализации национального проекта «Цифровые ресурсы», поддержанного Европейским фондом регионального развития) - www.webdepozit.sk/ . |
Словенский веб-архив [54] | Словения | 2007 | Heritrix , OpenWayback , инструмент веб-куратора | 1 | ||
Испанский веб-архив [55] | Испания | 2009 | NetarchiveSuite , OpenWayback , Solr | 3+руководитель | 2 | Поддерживается Национальной библиотекой Испании при сотрудничестве региональных библиотек. Применяет смешанный подход: выборочный и широкий сбор урожая. Сбор всего домена .es проводился ежегодно с 2009 по 2013 год в сотрудничестве с Интернет-архивом с использованием Heritrix и Wayback. С 2014 года выборочный сбор данных осуществляется Национальной библиотекой Испании с использованием NetarchiveSuite. Национальная библиотека = 3 библиотекаря на полный рабочий день, 2 инженера по сканированию изображений на неполный рабочий день. Региональные библиотеки = несколько библиотекарей на неполный рабочий день. С 26 октября 2015 года Закон об обязательном экземпляре позволяет Национальной библиотеке Испании и региональным библиотекам собирать испанские веб-сайты в рамках обязательного экземпляра и предоставлять их общественности с соблюдением норм закона об авторском праве. |
PADICAT: Веб-архив Каталонии [56] | Испания | 2005 | Heritrix , OpenWayback, OutbackCDX и CAT . | 2 | PADICAT — это веб-архив Каталонии с открытым доступом, созданный Библиотекой Каталонии : государственным учреждением, ответственным за сбор, сохранение и распространение библиографического наследия Каталонии в Испании. | |
ONDARENET - Архив цифрового наследия Басков [57] | Испания | 2008 | Heritrix , Wayback , NutchWAX и веб-куратор . | 1 | ||
Швеция (Culturesw3) [58] | Швеция | 1996 | NetarchiveSuite , Херитрикс . Собственная система хранения, обслуживания и доступа, но переезд на pywb или SolrWayback . | 1.25 | Шведский проект по сбору веб-сайтов начался в 1996 году, а первый сбор был проведен в 1997 году. В 2002 году были добавлены ежедневные сборы с некоторых газетных веб-сайтов. Была пауза в работе ноябрь 2009 - май 2011, но урожай за 2010 год был собран с помощью Интернет-архива. В 2016, 2018 и 2019 годах сбор доменов не производился из-за проблем с платформой сбора. Ежедневный сбор газетных веб-сайтов был приостановлен в период с мая 2017 года по декабрь 2018 года, но был расширен и теперь охватывает все шведские газетные веб-сайты на ежедневной основе. С апреля 2013 года Национальная библиотека Швеции также получает онлайн-материалы в соответствии с Законом об обязательном экземпляре электронных материалов. | |
Архивы Алеф [59] | Швейцария, США | 2010 | Платформа веб-архивирования, захват доменного имени, высокопроизводительная поисковая система, индексация практически в реальном времени, инструменты веб-мониторинга | >10 | Платформа автоматического веб-архивирования корпоративного уровня для онлайн-сохранения и хранения данных. Поддержите обнаружение электронных данных с помощью мощной и качественной технологии. Предназначен для корпораций, учреждений и агентств, стремящихся собирать, сохранять и использовать свой веб-контент; динамические веб-сайты, вики-сайты, социальные сети, форумы, комментарии, заявления об отказе от ответственности и реклама для соответствия требованиям (FDA, FINRA , FSA, SEC, FOIA), маркетинга или просто для сохранения. | |
Архив блога Центра архивов экспатриантов [60] | Гаага, Нидерланды | 2019 | Сервис Архив-ИТ | В центре внимания этого проекта — блоги, написанные людьми, жившими за границей. Мы сохраняем эти блоги и их содержимое, поскольку признаем их культурную и историческую ценность. Добавление архива блога в нашу коллекцию обогатит исследовательские возможности для студентов и других ученых, выбравших нас в качестве места обучения. Архивированные блоги будут отбираться на основе очень конкретных критериев, и их качество будет регулярно проверяться. | ||
Ведро веб-архивирования [61] | Швейцария, США, Канада | 2012 | Комплект разработки программного обеспечения WARC, Cobalt, веб-сервер Holon | «Ведро веб-архивирования» — это инициатива, запущенная Aleph Archives, с целью сохранения данных и предоставления библиотекам и организациям бесплатных в использовании инструментов и компонентов веб-архивирования. Web Archiving Bucket предоставляет набор инструментов, помогающих архивистам и специалистам в их повседневной работе. | ||
Веб-архив Швейцарии [62] | Швейцария | 2008 | Heritrix , Wayback , Pywb, веб-рекордер, облако Browsertrix | 6 | 2 краулинг-инженера, 3 человека по обеспечению качества (менее 1 на полный рабочий день), 1 координатор. Кураторами, осуществляющими отбор, являются библиотеки-партнеры по всей Швейцарии. | |
Система веб-архивирования NTU, NTUWAS [63] | Тайвань | 2007 | Лусене | 3 | ||
Веб-архив Тайвань [64] | Тайвань | 2007 | ||||
Веб-архив Великобритании [65] | Великобритания | 2004 | Heritrix , Web Curator Tool , Wayback , Solr для поиска. | |||
Веб-архив правительства Великобритании (UKGWA) [66] | Великобритания | 2003 | ЗеркалоWeb | 7 | 1 | архив . Веб-архив правительства Великобритании Национального архива Великобритании (UKGWA) представляет собой полностью открытый веб- Он включает в себя более 5000 веб-сайтов центрального правительства и социальных сетей, анализ которых осуществляется через регулярные промежутки времени (с 1996 года по настоящее время). Объем UKGWA изложен в документе OSP27 . Техническую сторону операции веб-архивирования обеспечивает MirrorWeb . |
Веб-архив парламента Великобритании | Великобритания | 2009 | ЗеркалоWeb | 1 | 2 | Веб-архив Парламента Великобритании собирает, сохраняет и делает доступной информацию Парламента Великобритании, опубликованную в Интернете. Веб-архив включает в себя веб-сайты и социальные сети, датируемые с 2009 года по настоящее время. Техническую сторону операции веб-архивирования обеспечивает MirrorWeb . |
Веб-архив выхода из ЕС [67] | Великобритания | 2020 | ЗеркалоWeb | Веб-архив выхода из ЕС Национального архива Великобритании представляет собой полностью открытый веб-архив. Он содержит широкий выбор документов, взятых с EUR-Lex (веб-сайт европейского законодательства), включая договоры, законодательные документы, Официальный журнал ЕС, прецедентное право и другие вспомогательные материалы, а также решения Европейского суда на английском языке. Французский и немецкий. Коллекция содержит весь контент, опубликованный до завершения периода реализации, в 23:00 по Гринвичу 31 декабря 2020 года. [68] Он обеспечивает всеобъемлющую и официальную точку отсчета британского законодательства ЕС в том виде, в котором оно существовало на конец периода реализации. [68] Техническую сторону операции веб-архивирования обеспечивает MirrorWeb . | ||
ЗеркалоWeb [69] | По всему миру | 2012 | Heritrix , PYWB для общедоступных архивов, индивидуальный повтор для архивов внутри платформы MirrorWeb. Пользовательские инструменты архивирования социальных сетей. | 40 | MirrorWeb предоставляет платформу для архивирования веб-сайтов и социальных сетей для финансовых служб и организаций государственного сектора. Они управляют рядом государственных архивов, два из которых включают; Веб -архив правительства Великобритании и Веб-архив парламента Великобритании . | |
Интернет-архив (предоставляет услугу Archive-it) [70] | Соединенные Штаты | 1996 | Heritrix , Wayback , NutchWAX и другие инструменты, разработанные Интернет-архивом | 150 | Wayback Machine от Internet Archive — это крупнейший и старейший веб-архив в мире, основанный в 1996 году. Internet Archive также предоставляет различные услуги веб-архивирования, включая Archive-IT , «Сохранить страницу сейчас» и сканирование контрактов на уровне домена. Wayback Machine — это общедоступная служба доступа к Интернет-архиву и коллекциям партнеров. | |
Библиотеки Стэнфордского университета [71] | Соединенные Штаты | 2007 | Heritrix , HTTrack , Wayback , Служба веб-архивирования CDL , Интернет-архив Archive-It | 2 | 5 | Библиотеки Стэнфордского университета участвуют в проектах веб-архивирования с 2007 года и начали создавать программу веб-архивирования в 2013 году. Коллекции, которыми занимается SUL, включают архивы Стэнфордского университета , отчеты правительств области залива , отчеты Исследовательской службы Конгресса (CRS) , Закон о свободе информации ( FOIA) , беглые исполнительные агентства США и многие другие. SUL также участвует в совместных проектах веб-архивирования, таких как Archive of the California Government Domain, CA.gov с библиотеками Калифорнийского университета и Библиотекой штата Калифорния, End of Term Web Archive и Ivy Plus Libraries Confederation . |
Библиотеки Колумбийского университета [72] | Соединенные Штаты | 2009 | Архив-это сервис | 2 | >1 | Программа сбора веб-ресурсов библиотек Колумбийского университета (CUL) архивирует избранные веб-сайты в тематических областях, соответствующих существующим возможностям коллекции CUL, веб-сайты, созданные филиалами Колумбийского университета, а также веб-сайты организаций или частных лиц, чьи документы или записи хранятся в физических архивах CUL. Начал веб-архивирование в 2008 году. |
Библиотека Корнелльского университета | Соединенные Штаты | 2011 | Архив-это сервис | 1 | >1 | |
Архив веб-сайта правительства штата Северная Каролина [73] | Соединенные Штаты | 2005 | Архив-это сервис | 3 | ||
Латиноамериканский проект веб-архивирования [74] | Соединенные Штаты | 2005 | Архив-это сервис | |||
Проект веб-архивирования для островов Тихого океана [75] | Соединенные Штаты | 2009 | Архив-это сервис | 4 | ||
Веб-архив Библиотеки Конгресса [76] | Соединенные Штаты | 2000 | Heritrix , Wayback и DigiBoard, собственный инструмент кураторства и разрешений. | 6 | 80 | Сотрудники, работающие неполный рабочий день, тратят несколько часов в месяц (в среднем) на подбор контента для коллекций. |
Гарвардская библиотека | Соединенные Штаты | 2006 | Архив-Это | >10 | Веб-коллекции Гарвардской библиотеки состоят из коллекций 10 кураторских подразделений . [77] с переменным персоналом, участвующим как в технической, так и в кураторской деятельности. Гарвард также участвует в совместном веб-коллекционировании через Конфедерацию библиотек Ivy Plus .
| |
Служба веб-архивирования из Калифорнийской цифровой библиотеки (служба WAS) [79] | Соединенные Штаты | 2005 | Херитрикс , Вэйбэк , НутчВАКС | 4 | >1 | Количество часов, которые кураторы посвящают сервису, очень варьируется. |
Веб-архив Исторической библиотеки Бентли (Мичиганский университет) [80] | Соединенные Штаты | 2000 | HTTrack , Teleport Pro, сервис WAS (2010-) | 2 | ||
Веб-архив Техасского университета в Сан-Антонио [81] | Соединенные Штаты | 2009 | Архив-Это | 3 | Количество часов варьируется в зависимости от того, как запланировано сканирование. | |
Кумрам [82] | Швейцария | 2010 | qumram Пакет программного обеспечения для веб-архивирования/управления веб-информацией | Коммерческий пакет программного обеспечения для веб-архивирования и управления веб-информацией. Обеспечивает как удаленный сбор данных, так и транзакционное веб-архивирование. Обеспечивает интеграцию с любым возможным веб-приложением (WCMS, портал, Sharepoint, интернет-магазин, пользовательские приложения), а также с хранилищем (база данных, файловая система, электронный архив или система управления записями, облачное решение). Позволяет собирать и воспроизводить общедоступную информацию, а также конкретные взаимодействия с пользователем. | ||
САПЕРИОН [83] | Германия | 2011 | Архив веб-контента SAPERION ECM | коммерческим Пакет управления корпоративным контентом специализируется на соблюдении нормативных требований. Продукт обеспечивает как сбор данных, так и транзакционное веб-архивирование на основе интеграции Qumram. [82] Пакет программного обеспечения для веб-архивирования Chronos. Веб-контент — это еще один канал, по которому контент поступает в SAPERION. Другими могут быть сканер, факс, электронная почта, мобильные устройства, офисные пакеты или любая другая система, создающая контент, такая как системы ERP . | ||
Александрийской библиотеки Интернет-архив | Египет | 2002 | Херитрикс , OpenWayback , WARCrefs | 3 | Текущие интересы сканирования: Египет после 25 января, нДВУ Лиги арабских государств. Дедупликация: использование инструмента WARCrefs для дедупликации содержимого веб-архива в кластере BA. | |
Веб-архив АУЭБ [84] | Греция | 2010 | Heritrix , Wayback и NutchWAX . | 1 | 1 | Этот проект является частью функции университетской библиотеки. [85] |
Веб-архивы Всемирного банка [86] | Соединенные Штаты | 2007 | Поисковый робот HTTrack , СУБД Oracle, Google Search Appliance | 0 | 3 | |
Российский национальный цифровой архив [87] | Россия | 2010 | wpull , Grab-site , сканер HTTrack , специальные сценарии, разработанные для архивирования в социальных сетях. Экспериментирую: Heritrix , Wayback | Около 5000 правительственных веб-сайтов собрано (май 2018 г.) с помощью wpull и предоставлено в виде архивов для скачивания. | ||
Архивная команда | По всему миру | 2009 | wpull , специальные сценарии | 1 | ~100 | Волонтерская группа. Они частично заархивировали GeoCities , Yahoo! Видео , Google Video и другие. |
WikiTeam | По всему миру | 2011 | специальные сценарии | 0 | 0 | Группа волонтеров. Сохранилось более 20 000 вики. [88] |
Киберкладбище Университета Северного Техаса [89] | Соединенные Штаты | 1997 [90] | Херитрикс , Вэйбек ; ранее HTTrack | 2 | Киберкладбище представляет собой архив правительственных веб-сайтов, которые прекратили свою деятельность (обычно это веб-сайты несуществующих государственных учреждений и комиссий, подготовивших окончательный отчет). В этом сборнике представлены разнообразные темы, свидетельствующие о широком характере правительственной информации. В частности, в этой коллекции представлены веб-сайты, посвященные темам, поддерживающим учебную программу университета и сильные стороны конкретных программ. | |
archive.today [91] | По всему миру | 2012 | Apache Accumulo , HDFS , Хром , [92] специальные сценарии | 1 | 1 | Сохраняет внешние ссылки с веб-сайтов сообщества (вики, форумы, блоги и т. д.). Может сохранять снимки страниц Web 2.0. |
Греческий веб-архивный портал | Греция | 2022 | Херитрикс, Вэйбэк | 0 | 1 |
|
ΕΣΑΕΙ Веб-архив - Национальная система архивирования греческой сети | Греция | 2017 | Heritrix, Open Wayback, Solr, Netarchive Suite | 0 | 4 | Проект ΕΣΑΕΙ стал первой попыткой собрать весь контент .gr и изучить его размеры. Он был реализован Национальной библиотекой Греции в сотрудничестве с Афинским университетом экономики и бизнеса и включал два массовых и три выборочных сборника, касающихся коллекций «Местное самоуправление», «Новости» и «Образование». Инструмент NLG Curator Tool был создан для воспроизведения коллекции. |
Библиотека Тамимент и трудовой архив Роберта Ф. Вагнера в Нью-Йоркском университете [93] | Соединенные Штаты | 2007 | БЫЛ Сервис | 1 | 1 | Веб-сайты архивов, связанные с Нью-Йорком, а также национальными лейбористскими и левыми движениями. Среди проектов: Альтернативные СМИ/Новости; Анархизм; Права животных; Левые искусства и культуры; Гражданские права и гражданские свободы; Коммунизм, Социализм, Троцкизм; Экономическая и социальная справедливость (включая движение «Оккупай Уолл-стрит»); Образование и студенческие движения; Электоральная политика и партии/Политические действия (левые США); Энвайронментализм/Зеленое движение; Феминизм и женские движения; Лагерь для задержанных Гуантанамо и военные преступления (США); Жилье; Демократия Интернета/киберпространства; Американская прогрессивная и левая еврейская деятельность; Профсоюзы и организации (США); Левая академия и теория, интеллектуалы и другие известные люди; права ЛГБТ; Другой левый активизм; Движения за мир; Права заключенных и политические заключенные; Прогрессивная политика/Образовательные организации. |
Пресервика [94] | По всему миру | 2012 | Heritrix , основной продукт Preservica, Wayback | Облачная служба гетерогенного архивирования, которая позволяет получать данные из нескольких источников (включая получение веб-архивов через Heritrix). Возможность переноса контента из файлов WARC и рендеринга в Wayback. Ingest работает как рабочий процесс, поэтому для его запуска требуется совсем немного усилий. Разработан, поддерживается и управляется Preservica. | ||
Центральный государственный электронный архив Украины | Украина | 2007 | HTTrack , Wget | 2 | Архивы, заинтересованные в ведении сайтов и создании тематических подборок таких сайтов. В настоящее время находится на хранении Архивная подборка сайтов, которая включает в себя темы президентских выборов в Украине с 2010 года по сегодняшний день, о Чернобыльской катастрофе, местных выборах, Евро-2012 в Украина, объекты Всемирного наследия ЮНЕСКО в Украине, 200-летие со дня рождения Тараса Шевченко. [95] [96] | |
Библиотеки Йоркского университета , Библиотеки Йоркского университета Wayback Machine [97] | Канада | 2012 | Браузертрикс , pywb | 1 | 0 | |
Нью-Йоркский консорциум художественных ресурсов (NYARC) [98] [99] | Соединенные Штаты | 2012 | Сервис Архив-ИТ | 1 | ~3 | Сотрудничество между Справочной библиотекой по искусству Фрика , Библиотекой и архивами Бруклинского музея и Библиотекой Музея современного искусства (MoMA) для архивирования специализированных веб-ресурсов по истории искусства. |
Веб-архив Нидерландского института звука и изображения (Sound and Vision) [100] | Нидерланды | 2011 | Heritrix , Elasticsearch для полнотекстового индекса, Drupal для внешнего интерфейса. | ~7 | Sound and Vision участвует в проектах веб-архивирования с 2008 года, начиная с исследовательского проекта ЕС LiWA. [101] После пары пилотов [102] В 2014 году масштабы проектов веб-архивирования были расширены. [103] | |
Корневище (организация) | Соединенные Штаты | 1999 | ArtBase , Веб-рекордер , Oldweb.Today | 3 | 1 | Rhizome управляет программой цифрового сохранения, возглавляемой Драганом Эспеншиедом , которая ориентирована на создание бесплатных программных инструментов с открытым исходным кодом для децентрализации веб-архивирования и практики сохранения программного обеспечения, а также обеспечения доступа к своим коллекциям произведений искусства, рожденных в цифровом формате. Oldweb.Today и Webrecorder — это инструменты, специально предназначенные для веб-архивирования. [104] |
Библиотеки Техасского университета в Остине, Инициатива по документации по правам человека | Соединенные Штаты | 2009 | Сервис Архив-ИТ | 1 | 1 | Инициатива по документации по правам человека библиотек Техасского университета (HRDI) захватывает веб-сайты правозащитных организаций, чтобы обеспечить безопасный доступ к документации по правам человека в случае, если эти зачастую хрупкие сайты будут закрыты. [105] |
Департамент библиотек и архивов Кентукки | Соединенные Штаты | 2009 | Archive-it , Wayback | >1 | 0 | Эта коллекция включает в себя снимки веб-сайтов агентств штата Кентукки исполнительной, законодательной и судебной ветвей власти. Отдельные веб-сайты советов, советов, комитетов, квазиправительственных агентств и агентских программ также архивируются. В эту подборку включены кадры с сайтов 2000–2008 годов путем переноса на наш аккаунт с Wayback Machine. [106] |
Библиотека Калифорнийского университета в Сан-Франциско | Соединенные Штаты | 2007 | Archive-it , Wayback , CDL WAS Сервис | >1 | 0 | Этот сборник документирует присутствие UCSF в Интернете, а также более крупные научные направления в области здравоохранения, связанные с историей СПИДа; анестезиология; биотехнология и биомедицинские исследования; контроль и регулирование табака; нейробиология; и компьютерная медицина. [107] Персонал — один штатный цифровой архивист с различными обязанностями, помимо веб-архивов. |
Конфедерация библиотек Ivy Plus [108] | Соединенные Штаты | 2013 | Archive-It , Хвойное дерево | 1 | 1 | Программа сбора веб-ресурсов Конфедерации библиотек Ivy Plus — это совместная работа по созданию тщательно подобранных тематических коллекций свободно доступного, но подверженного риску веб-контента с целью поддержки исследований в участвующих библиотеках и за их пределами. Библиотеки-участники: Браун , Чикаго , Колумбия , Корнелл , Дартмут , Дьюк , Гарвард , Джонс Хопкинс , Массачусетский технологический институт , Пенсильвания , Принстон , Стэнфорд и Йельский университет . [109] Коллекции доступны через Archive-It . |
Веб-архив правительства Малайзии (MyGWA) | Малайзия | 2017 | Wayback, WGET , WPULL | >1 | 0 | Национальный архив Малайзии начал архивировать веб-сайты государственного сектора Малайзии с 2017 года. |
HTTP-архив | Сканирует популярные веб-сайты для анализа данных. [110] | |||||
Национальная медицинская библиотека (США) | Соединенные Штаты | 2009 | Archive-It, Хвойное дерево | ~8 | Интернет-коллекционирование NLM руководствуется «Руководством по созданию коллекций Национальной медицинской библиотеки» и другими стратегическими усилиями по сбору информации. Коллекции включают глобальные события в области здравоохранения, опиоидную эпидемию, ВИЧ / СПИД, блоги о здоровье и медицине, а также собственное присутствие NLM в Интернете. [111] | |
Смитсоновские библиотеки и архивы (США) [112] | Соединенные Штаты | 2000 | Heritrix , Archive-It , Webrecorder , Conifer , Browsertrix , другие | 5 | Библиотеки и архивы Смитсоновского института собирают веб-сайты и учетные записи в социальных сетях, документирующие историю учреждения. | |
Призрачный архив [114] | Соединенные Штаты [ нужна ссылка ] | 2021 [115] | Веб-рекордер | 1 | ||
Обычное сканирование [116] | Соединенные Штаты | 2008 | Apache Nutch , Apache Tika , pywb , собственные инструменты | 3 | 3 |
Архивные данные [ править ]
Имя | Архивное содержимое (в миллионах) | Занимаемое дисковое пространство (ТБ) | Формат архива | ДВУ/широкое сканирование | Выборочное сканирование (да/нет) | Комментарии |
---|---|---|---|---|---|---|
Веб-архив ЕС [4] | ВАРК | .ЕВРОСОЮЗ | И | .EU 250 веб-сайтов в домене и поддоменах europa.eu, сканирование один раз в квартал + специальное сканирование по запросу владельцев веб-сайтов (выборочное сканирование). Статус февраль 2019. | ||
Веб-архив Австралии [6] | 11000 | 600 | ВАРК | .В | И | Сканирование .AU (1996–2018 гг.): 10,15 миллиардов файлов (530 ТБ). Выборочное сканирование (1996–2019 гг.): 755 миллионов файлов (44 ТБ). AGWA (2011–2018 гг.): 525 миллионов файлов (58 ТБ). |
Наш цифровой остров, веб-архив Тасмании [117] | 0.336 | HTTrack | И | Сохраняет онлайн-контент, связанный с Тасманией. ODI с момента своего создания действует исходя из предположения, что веб-сайты подпадают под определение «книги» в Законе о библиотеках Тасмании 1984 года. [118] Таким образом, никакого разрешения на захват от издателей не требуется. | ||
Вебархив Австрия [23] | 4095 | 164 | АРК | .АТ , .Вена , .Тироль | И | Копия данных хранится в блоке хранения данных с высоким уровнем безопасности. |
Немецкая национальная библиотека [24] | ВАРК | .ИЗ | И | Только одно экспериментальное сканирование TLD. | ||
ДИЛИМАГ (Цифровые литературные журналы) [25] | 0.03 | 0.996 | АРК | Проект с 1 марта 2007 г. по 23 декабря 2010 г. Проект DILIMAG по сбору, описанию и архивированию цифровых немецких литературных журналов. | ||
Библиотека и Национальный архив Квебека (BAnQ) [26] | 167 | 31 | АРК / ВАРК | И | Сбор данных начался в 2009 году. Выборочное сканирование веб-сайтов Квебека. | |
Веб-архив правительства Канады (GCWA) [27] | 1750 | 70 | АРК / ВАРК | .GC.CA | И | Веб-архивирование в Библиотеке и архивах Канады (LAC) [27] началась в 2005 году и сосредоточилась на сборе данных федерального правительства в Интернете и съемке федеральных выборов, Олимпийских игр и памятных мероприятий в Канаде. Тематические веб-коллекции, представляющие исследовательский интерес Canadiana, курируются в рамках постоянной программной деятельности с 2009 года. |
Сбор и сохранение веб-информации - WICP (Китайский веб-архив) [30] | .GOV.CN | И | Сбор веб-страниц о событиях, имеющих большое влияние на общество, экономику и т.п., а также сайтов в домене gov.cn. | |||
Хорватский веб-архив (Hrvatski arhiv weba - HAW) [31] | 231 | 13 | Зеркало, ВАРК | .HR | И | С 2004 года выборочный сбор более 5000 веб-ресурсов. С 2011 года проводится ежегодный сбор национального домена .hr, а также тематический сбор. Весь архивный контент общедоступен на веб-сайте HAW. |
Вебархив ( Национальная библиотека Чехии ) [32] | 9412 | 350 | АРК / ВАРК | .Чехия | И | Сбор урожая начался в 2001 году. |
Сетевой архив [119] / Датский веб-архив ( Королевская библиотека Дании ) | 36000 | 634 | АРК / ВАРК | .ДК | И | +36 миллиардов объектов:
|
Эстонский веб-архив [34] | 874 | 56 | АРК / ВАРК | .EE | И | Архив состоит из выборочного, событийного и тематического сканирования с 2010 года. Сканирование всех национальных доменов осуществляется ежегодно с 2015 года. Помимо TLD .ee, веб-контент, связанный с Эстонией, собирается из других TLD, таких как .eu, .org, .com и т. д. |
Финский веб-архив [35] | 4300 | 300 | ARC / WARC / .json / .mp4 | .FI , .AX | И | Также сканирует контент, размещенный на компьютерах, физически расположенных в Финляндии, независимо от их домена. |
BnF - обязательный экземпляр в Интернете [36] | 48 000 | 1 800 | АРК / ВАРК | .FR + все сайты, размещенные во Франции | И | БнФ делает копии [36] всех сайтов в .FR домене верхнего уровня , а также всех сайтов, размещенных и созданных во Франции, игнорируя как стандарт исключения роботов , так и лицензии документов. |
Веб-архив БнЛ | 543 | 41 | ВАРК | .LU | И | BnL проводит два сканирования доменов в год, а также сканирование на основе событий и выборочное сканирование. |
Ина (Национальный аудиовизуальный институт) [37] | 105800 | 2359 | ДАФФ | И | По состоянию на 8 марта 2021 г. DAFF обеспечивает полную дедупликацию контента, поэтому размер на диске учитывает сжатие и дедупликацию; эквивалентное дисковое пространство в сжатом формате ARC будет составлять примерно 10 ПБ. | |
Электронная диаспора (Télécom ParisTech, FMSH) [120] | 1030 | 13 | ДАФФ | И | DAFF обеспечивает полную дедупликацию контента, поэтому размер на диске учитывает сжатие и дедупликацию; эквивалентное дисковое пространство в сжатом формате ARC будет составлять примерно 51 ТБ. | |
Фонд Интернет-памяти | 180 | ВАРК | Может быть выполнено партнерами | И | Бывший Европейский архив. [121] Сотрудничайте с Internet Memory Research, которая предоставляет службу ArchiveTheNet (ATN Service). Выборочное сканирование (140 ТБ), сканирование доменов (40 ТБ). Ожидается, что в 2012 году объем вырастет до 1 ПБ. Новый центр обработки данных и новый сканер в 2012 году. | |
Центр библиотечного обслуживания Баден-Вюртемберга [38] | 9 | ВАРК | И | Веб-сайты около 20 городов, муниципалитетов, районов + связанных с ними корпораций и государственных библиотек собираются BSZ по заказу в различных коллекциях Archive-It. Публичный доступ. Хранение данных: Сан-Франциско (Archive-It), а также резервное копирование с помощью инфраструктуры хранения данных Баден-Вюртемберга. | ||
Веб-архив немецкого Бундестага [39] | И | Федеральный парламент Германии. Селективный. Через регулярные промежутки времени или во время определенных событий создаются снимки (снимки) сайта www.bundestag.de и других веб-сайтов Бундестага Германии. Они доступны в веб-архиве на сегодняшний день. | ||||
Исландия [40] | ||||||
Палестинский веб-архив | АРК / ВАРК | .PS | И | Сканирование .PS (2006–2011 гг.): Пилотное сканирование (500 ГБ). Выборочное сканирование (1996, 2011) | ||
Проект веб-архивирования (WARP), Национальная парламентская библиотека, Япония [42] | 12670 | 1313 | ВАРК | - | И | по состоянию на март 2023 г. 15 ТБ выборочного сканирования на основании разрешения (2002–2010 гг.). Начато веб-архивирование официальных сайтов учреждений на основании законодательства с апреля 2010 года. |
Национальная библиотека Кореи - OASIS (Интернет-ресурс для онлайн-архивирования и поиска) [43] | 24 | И | Перед архивированием требуется согласие. Таргетинг на 56 401 веб-сайт. Веб-архивирование осуществляется в рамках систем управления цифровыми ресурсами. В 2011 году будет перестроена система веб-архивирования. | |||
Королевская библиотека [44] | 407 | 36 | ВАРК | И | Выборочное сканирование (ежегодно) ок. 20 400 сайтов (декабрь 2020 г.) | |
Веб-архив Новой Зеландии [46] | 4300 | 260 | АРК / ВАРК | .Новая Зеландия | И | Сканирование доменов .NZ (2008–2023 гг.): более 4 миллиардов URL-адресов (260 ТБ). Выборочное сканирование 33 500 веб-сайтов (около 9 ТБ). Обязательный экземпляр охватывает созданные цифровые материалы (включая веб-сайты). |
Национальная библиотека Норвегии [47] | ||||||
Arquivo.pt [49] [122] | 17 716 | 876 | АРК / ВАРК | Ориентирован на .PT , а также на другие домены. | И | Сканирование домена .PT и интеграция внешних коллекций с 2007 года, а также ежедневное сканирование избранных онлайн-публикаций с 2010 года. Выборочное сканирование, связанное с национальными событиями, такими как выборы, или международный контент, связанный с наукой, например веб-сайты, посвященные проектам исследований и разработок, финансируемым Евросоюз. |
Веб-архив Чачака [51] | 0.255 | 0.013 | HTTrack | И | Выборочное сканирование 130 сайтов, связанных с городом Чачак. Сотрудничество с командой Webarchiv из Национальной библиотеки Чехии. | |
Веб-архив Сингапур [52] | ВАРК | .СГ | И | Выборочное сканирование сайтов, связанных с Сингапуром, и архивирование домена .SG . | ||
Цифровые ресурсы ( Университетская библиотека в Братиславе ) [123] | 1 921 | 89 | ВАРК | .SK + другие домены верхнего уровня со словацким содержанием | И | Сбор словацкой сети начался в 2015 году. С тех пор ULB провел шесть (2016–2021 гг.) полнодоменных сборов (сбор национального домена .SK), несколько выборочных и тематических обходов (кампании, ориентированные на темы и события). |
Словенский веб-архив [54] | 30 | ВАРК | Выборочное сканирование с 2007 года, сканирование национальных доменов с 2014 года. | |||
Испанский веб-архив [55] | 2539 | 117 | ВАРК | .ЯВЛЯЕТСЯ | И | Сканирование домена .ES (2009–2013 гг.): 2,421 миллиона файлов (111 ТБ) в сотрудничестве с Internet Archive. Выборочное сканирование (2014–2015 гг.): 119 миллионов файлов (6 ТБ). Ежедневно сканировалось около 30 сайтов новостных СМИ. Пока не представлен публично. |
PADICAT: Веб-архив Каталонии [56] | 620 | 32,5 | АРК / ВАРК | .КОТ | И | В соответствии с общей тенденцией модель архива представляет собой гибридную систему, состоящую из: массовой компиляции цифровых ресурсов открытого доступа, публикуемых в Интернете (.cat); Систематическое архивирование материалов веб-сайтов каталонских организаций; Содействие направлениям исследований посредством тематической интеграции цифровых ресурсов, относящихся к конкретным событиям общественной жизни Каталонии (выборы, музеи и т. д.). |
Архив баскского цифрового наследия [57] | 21 | 0.8 | АРК | И | ||
Швеция (Culturesw3) [58] | 5700 | 360 | Многочастный MIME | .se, шведский .nu и геолокация для других доменов верхнего уровня. | И | Массовые ползают примерно два раза в год. Выборочный просмотр около 140 газет каждый день. |
Архивы Алеф [59] | >10000000 | >25 | Собственные HTML , WARC , WARC2, ARC и HTTrack в WARC. инструменты миграции | И | Платформа автоматического веб-архивирования корпоративного уровня для онлайн-сохранения и хранения данных. Поддержите обнаружение электронных данных с помощью мощной и качественной технологии. Предназначен для корпораций, учреждений и агентств, стремящихся собирать, сохранять и использовать свой веб-контент; динамические веб-сайты, вики-сайты, социальные сети, форумы, комментарии, заявления об отказе от ответственности и реклама для соответствия требованиям (FDA, FINRA , FSA, SEC, FOIA), маркетинга или просто для сохранения. | |
Веб-архив Швейцарии [62] | 80 | АРК , ВАРК | И | В основном выбранное сканирование .ch | ||
Система веб-архивирования NTU, NTUWAS [63] | 200 | 14 | И | |||
Веб-архив Тайвань [64] | ||||||
Веб-архив Великобритании [65] | 20.6 | ВАРК | И | Выборочное сканирование с предыдущего разрешения. В настоящее время также проводится оптовое сканирование доменов Великобритании в соответствии с законодательством о непечатном обязательном экземпляре, вступившим в силу в апреле 2013 года. Этот контент будет доступен только в помещениях, контролируемых одной из шести библиотек обязательных экземпляров. UKWA является дочерним предприятием Британского консорциума веб-архивирования, деятельность которого завершилась в 2007 году. | ||
Ханзо Архивы [124] | 7 | ВАРК | И | Коммерческие услуги и устройства веб-архивирования для правительств и корпораций, чьи требования или юридические обязательства/потребности распространяются на их веб-сайты, интранет и социальные сети. Множество «темных» архивов по всей Европе и США. | ||
Веб-архив правительства Великобритании [125] | 1000 + | 150 | АРК Сообщение WARC, июль 2017 г. | В период с 2003 по 2005 год Интернет-архив взял на себя техническую сторону веб-архивирования от имени Веб-архива правительства Великобритании. В период с 2005 по июль 2017 года техническая сторона службы веб-архивирования была передана по контракту Internet Memory Foundation. С июля 2017 года MirrorWeb взяла на себя контракт и переместила весь архив в облако. Веб-архив правительства Великобритании был частью Консорциума веб-архивирования Великобритании с 2004 по 2009 год. | ||
Интернет-архив (предоставляет услугу Archive-it) [70] | 690000 | 21000 | По всему миру | И | Предоставляет услугу Archive-it и возглавляет проект Archive-access (инструменты доступа к Интернет-архиву ARC). Коллекция отражена в Александринской библиотеке в Египте. | |
Программа сбора веб-ресурсов библиотек Колумбийского университета [72] | 723 | 50.4 | АРК / ВАРК | И | Выборочное сканирование с разрешения или уведомления. Тематические сборники: Права человека; Созданная среда Нью-Йорка; Религии Нью-Йорка; Сопротивление. Также захватите веб-домен Колумбийского университета. | |
Архив веб-сайта правительства штата Северная Каролина [73] | 51.5 | 3.8 | ВАРК | И | ||
Латиноамериканский проект веб-архивирования [74] | И | |||||
Проект веб-архивирования для островов Тихого океана [75] | 5.5 | АРК / ВАРК | И | Включает сайты 18 стран. | ||
Веб-архив Библиотеки Конгресса [76] | 7741 | 420 | АРК / ВАРК | И | Ранее МИНЕРВА. Выборочное сканирование с уведомлением и разрешением; прежде всего событийные и тематические коллекции. | |
Библиотека Гарвардского университета: Служба сбора веб-архивов (WAX) [126] | 19 | 0.661 | АРК | И | Выборочное сканирование без предварительного разрешения. | |
Служба веб-архивирования из Калифорнийской цифровой библиотеки (служба WAS) [79] | 216 | 25.2 | АРК / ВАРК | Может быть выполнено партнерами | И | Предоставляет услуги веб-архивирования (WAS) партнерам по всему миру. Был разработан в Калифорнийской цифровой библиотеке. |
Веб-архив Исторической библиотеки Бентли (Мичиганский университет) [80] | 34.5 | 2.6 | АРК / ВАРК | И | WAS обслуживается с 2010 года. | |
Веб-архив Техасского университета в Сан-Антонио [81] | 26 | 1.135 | АРК / ВАРК | И | Администрация университета, сайты преподавателей и студентов; а также выборочные исследования предметных областей Сан-Антонио и Южного Техаса, включая организации Сан-Антонио; Интернет-журналы и блоги Сан-Антонио; Музыка Техано и Конджунто; Веб-сайты, посвященные геям, лесбиянкам, бисексуалам, трансгендерам и гомосексуалистам в Техасе, Сан-Антонио и долине Рио-Гранде; Иммиграция/Пограничье; Мексиканские кулинарные блоги; Рестораны Сан-Антонио; Возобновляемая энергия в Техасе; Организации долины Рио-Гранде; и Проблемы водораздела Рио-Гранде и воды в Техасе. | |
Веб-архив АУЭБ [84] | 3 | ВАРК | aueb.gr | Н | Объем данных, сканированных с домена aueb.gr, колеблется от 10 до 14,9 ГБ. Данные хранятся на диске в сжатом виде и требуют от 8,8 до 9,7 ГБ, что приводит к экономии места от 12% до 35%. В случае нового сканирования мы можем хранить на диске только те веб-страницы, которые изменились с момента предыдущего сканирования. Следовательно, мы просканировали 13,1 ГБ из домена aueb.gr, но сохранили на диске только 1,6 ГБ, в результате чего экономия места составила 88%. | |
Веб-архивы Всемирного банка [86] | 0.143 | HTTrack | нет, пока | И | С 2007 года было собрано 450 объектов, имеющих историческую или исследовательскую ценность, каждый из которых был заархивирован перед отключением от сети или перед масштабной модернизацией. | |
Киберкладбище Университета Северного Техаса [89] | 0.887 | ВАРК | .gov | И | ||
Интернет-архив Александрийской библиотеки | 80000 | 1000 | АРК / ВАРК | Египетские новости и политика | И | |
Цифровая библиотека Йоркского университета [97] | 0.435 | ВАРК | yorku.ca + запросы преподавателей | И | ||
Веб-архив Нидерландского института звука и изображения (Sound and Vision) [100] | АРК / ВАРК | И | Помимо прочего, компании Sound and Vision поручено архивировать программы, транслируемые голландскими общественными вещателями. Поэтому важную часть веб-архива составляют веб-сайты общественных вещателей, связанные с этими программами. Кроме того, в архив попадают веб-сайты, не имеющие прямой ссылки на коллекцию, но представляющие интерес в более широком, медиа-историческом плане. [103] Примерами являются веб-сайты коммерческих вещательных компаний. | |||
Департамент библиотек и архивов Кентукки | 3 | 0.3007 | ВАРК | И | ||
Библиотека Калифорнийского университета в Сан-Франциско | 12.5 | 0.587 | АРК/ВАРК | И | Веб-сайты, запрошенные сотрудниками и преподавателями, а также растущий список, в котором предпринимаются попытки максимально полно охватить все веб-сайты UCSF. | |
Конфедерация библиотек Ivy Plus | 347 | 16 | АРК / ВАРК | И | Выборочное сканирование с уведомлением. Тематические коллекции о политике и политических протестах, архитектуре, композиторах, дизайне, играх, геологии, веб-комиксах, документальных фильмах, искусстве, религии, сексуальности, изменении климата и многом другом. [127] | |
Веб-архив правительства Малайзии (MyGWA) | 10 | ВАРК | .GOV.MY | И | Сканирует только сайты государственного сектора Малайзии. Представление осуществляется по темам, т.е. управление, экономика, безопасность и социальная сфера. | |
Национальная медицинская библиотека (США) | 122 | 9.1 | ВАРК | И | ||
Смитсоновские библиотеки и архивы (США) | 10 | ВАРК | И | |||
Обычное сканирование | 250 000 | 8 000 | АРК/ВАРК | по всему миру | И |
Методы доступа [ править ]
Имя | История URL-адресов (Да/Нет) | Поиск по метаданным (каталог/расширенный) (Да/Нет) | Полнотекстовый поиск (Да/Нет) | Соответствие Memento (нет/родной/прокси) | Комментарии |
---|---|---|---|---|---|
Веб-архив ЕС [4] | И | И | И | Свободно доступен для всех через [2] | |
Веб-архив Австралии [6] | И | И | И | Нет | Отобранные сайты общедоступны через структуру каталогов. Сбор доменов — нет. Архив PANDORA индексируется и доступен для поиска через единую поисковую службу NLA Trove. [128] Сборы австралийских доменов индексируются полнотекстово, но в настоящее время не являются общедоступными. Веб-архив правительства Австралии доступен для поиска по URL-адресам и полнотекстовым индексам на его портале. |
Наш цифровой остров, веб-архив Тасмании [117] | И | И | Н | Нет | Представляет миниатюры, созданные с помощью Html To Image, дополненные HTTrack . Информация организована в каталоге: Тематический список от А до Я, Список заголовков от А до Я. |
Вебархив Австрия [23] | И | Н | И | Нет | можно искать в Интернете Версии либо по URL, либо в (частичном) полнотекстовом формате. Доступ к веб-сайтам возможен только на специальных терминалах Австрийской национальной библиотеки . Имеет функцию закладок, которая позволяет сохранять версии в Интернете и вызывать их на терминалах веб-архива библиотеки. |
Немецкая национальная библиотека [24] | И | И | И | Нет | Доступно только в читальных залах Немецкой национальной библиотеки. Метаданные включены в общедоступный каталог библиотеки. |
ДИЛИМАГ (Цифровые литературные журналы) [25] | И | И | Н | Нет | Метаданные находятся в открытом доступе, к архивным версиям предоставляется свободный или ограниченный доступ в зависимости от соглашения правообладателей. Полнотекстовый поиск реализован в новой версии (онлайн с февраля 2015 года). |
Библиотека и Национальный архив Квебека (BAnQ) [26] | И | Н | Н | Нет | Предоставляет доступ в соответствии с политикой партнера. [129] |
Веб-архив правительства Канады (GCWA) [27] | И | И | И | Прокси | Библиотека и архивы Канады [27] делает свои веб-архивы федерального правительства (материалы, защищенные авторским правом Короны) общедоступными. Индексы доступны для поиска федеральных веб-ресурсов Канады в алфавитном порядке по организациям-авторам и по URL-адресам. Полнотекстовое индексирование основано на Lucene. |
Сбор и сохранение веб-информации - WICP (Китайский веб-архив) [30] | И | Нет | Содержимое архива доступно только во внутренней сети Национальной библиотеки Китая. Некоторые коллекции общедоступны, с возможностью поиска по метаданным и возможностью просмотра по коллекциям. | ||
Хорватский веб-архив (Hrvatski arhiv weba - HAW) [31] | И | И | И | Прокси | Полный открытый доступ. |
Вебархив ( Национальная библиотека Чехии ) [32] | И | Н | Н | Н | Из-за ограничений авторских прав в Интернете доступно только ограниченное количество архивных веб-сайтов, для которых были подписаны соглашения с издателями. Для других ресурсов вы можете узнать, был ли данный веб-сайт заархивирован, и количество собранных версий. Неограниченный доступ ко всем ресурсам Вебархива возможен с публичных терминалов Национальной библиотеки. |
Netarkivet.dk [130] | И | Н | И | Нет | Онлайн-доступ предоставляется только исследователям через учетную запись Citrix для бесплатного текстового поиска на основе Solr и прокси-решения, которое получает доступ к архиву через Wayback . Он создал основу для выполнения пакетных заданий с возможностью интеллектуального анализа данных. |
Эстонский веб-архив [34] | И | И | Н | Нет | Публичный доступ к архивному контенту разрешен только с разрешения правообладателя. Полный архив доступен только сотрудникам веб-архива. |
Финский веб-архив [35] | И | Н | 15% материала. | Нет | Поиск по URL-адресу, но доступ к контенту на месте. Полнотекстовый поиск доступен по 15% материала. |
BnF - обязательный экземпляр в Интернете [36] | И | Н | 15% коллекции | Нет | Доступен авторизованным пользователям через читальные залы Научно-исследовательской библиотеки BnF, расположенной в Париже и Авиньоне, а также в библиотеках-партнерах в регионах и заморских территориях. Wayback был настроен, а интерфейс переведен на французский язык. Полнотекстовый поиск доступен только в определенных коллекциях (например, новости, Covid-19, ранний французский Интернет). Создает специальные галереи коллекций на основе подборки из архива по заданной теме. |
Ина (Национальный аудиовизуальный институт) [37] | И | И | И | Нет | Полнотекстовое индексирование основано на Lucene. Чтобы учесть результаты частого сканирования (несколько сканирований в час для некоторых страниц), используется кластеризация для обработки похожих версий страниц. |
Электронная диаспора (Télécom ParisTech, FMSH) [120] | И | Н | Н | Нет | В настоящее время сканируется 1381 сайт для создания архива об использовании Интернета мигрантами; исследователи в области социальных наук запустили долгосрочный проект на основе этого архива. Инна занимается сканированием и хранением. |
Интернет-памяти Фонд | И | И | И | Нет | Предоставляет услуги доступа и поиска в соответствии с политикой партнеров. |
Центр библиотечного обслуживания Баден-Вюртемберга [38] | И | И | И | Родной | Архивированные веб-сайты, доступные через Archive-It; интегрирован в каталог SWB Union. Полный открытый доступ к большей части снимков, некоторые ограничены по IP. |
Веб-архив немецкого Бундестага [39] | И | Н | Н | Нет | Сам веб-архив представляет собой снимки www.bundestag.de и других веб-сайтов. Навигация возможна по клику на год. [131] |
Исландия [40] | Родной | ||||
Палестинский веб-архив | Н | И | Н | Нет | Все еще в разработке и пилотных проектах |
Проект веб-архивирования (WARP), Национальная парламентская библиотека , Япония [42] | И | И | И | Родной | Все архивные веб-сайты доступны на месте. 85% из них также доступны в Интернете с разрешения веб-мастеров. |
Национальная библиотека Кореи - OASIS (Интернет-ресурс для онлайн-архивирования и поиска) [43] | И | И | И | Нет | Проиндексировано 100% архива. Позволяет поиск по тематической классификации (например, Религия, Наука, Искусство). Доступен поиск. [132] |
Королевская библиотека [44] | И | Н | Н | Нет | Веб-архив доступен на терминалах в читальных залах базы знаний для полноправных членов («на месте»). |
Веб-архив Новой Зеландии [46] | И | И | И | Родной | Сбор доменов: доступен избранным сотрудникам, использующим Pywb, и ограничивается поиском по URL. Выборочный сбор: каждый веб-сайт описан в каталоге (с возможностью поиска по теме, автору, названию и URL-адресу) и может быть просмотрен публикой через Интернет, щелкнув ссылку на архивную копию. Небольшая часть выборочных данных доступна с помощью полнотекстового поиска. |
Национальная библиотека Норвегии [47] | Н | И | Нет | Сайты интегрированы в Каталог. Левая панель обеспечивает фасетную навигацию с детализацией. [133] | |
Arquivo.pt - португальский веб-архив [134] | И | И | И | Родной | Служба полнотекстового поиска и поиска по URL находится в свободном доступе . Поиск изображений также поддерживается. Архивированные данные можно извлечь с помощью платформы Hadoop или общедоступных интерфейсов прикладного программирования для разработки веб-приложений . |
Веб-архив Чачака [51] | Н | Н | Н | Нет | В планах развитие поисковой системы в будущем. Одной из плохих особенностей HTTrack является то, что он переименовывает файлы во время архивирования, поэтому теряется исходная структура веб-сайта, а также имена файлов. |
Веб-архив Сингапур [52] | И | И | И | Нет | Коллекцию можно просмотреть в Национальной библиотеке Сингапура, а избранный контент, одобренный владельцами авторских прав, доступен в Интернете. |
Цифровые ресурсы (Университетская библиотека в Братиславе) [135] | И | И | Н | Нет | Можно узнать, был ли сайт заархивирован и сколько существует собранных версий. Из-за ограничений авторских прав общедоступно только ограниченное количество архивных веб-сайтов (на основании соглашений с издателями). Доступ к другим архивным ресурсам доступен локально в университетской библиотеке в Братиславе. |
Словенский веб-архив [54] | И | Н | И | Нет | Архив выборочных обходов находится в открытом доступе. Использование возможно путем просмотра и полнотекстового поиска. Сканирование национальных доменов пока недоступно, но будет доступно в будущем. |
Испанский веб-архив [55] | Y (Будущее) | Y (Будущее) | Y (Будущее) | Нет | Планируйте обеспечить доступ на месте в краткосрочной и среднесрочной перспективе. |
PADICAT: Веб-архив Каталонии [56] | И | И | И | Нет | Полный открытый доступ. |
Архив баскского цифрового наследия [57] | И | И | И | Нет | |
Швеция (Culturesw3) [58] | И | Н | Н | Нет | Публичный доступ через специальные машины в здании библиотеки. |
Архивы Алеф [59] | И | И | И | Нет | Платформа автоматического веб-архивирования корпоративного уровня для онлайн-сохранения и хранения данных. Поддержите обнаружение электронных данных с помощью мощной и качественной технологии. Предназначен для корпораций, учреждений и агентств, стремящихся собирать, сохранять и использовать свой веб-контент; динамические веб-сайты, вики-сайты, социальные сети, форумы, комментарии, заявления об отказе от ответственности и реклама для соответствия требованиям (FDA, FINRA , FSA, SEC, FOIA), маркетинга или просто для сохранения. |
Веб-архив Швейцарии [62] | И | И | И | Нет | Веб-архив Швейцарии — это коллекция Швейцарской национальной библиотеки, содержащая веб-сайты, посвященные Швейцарии. Веб-архив Швейцарии интегрирован в e-Helvetica, [136] система доступа Швейцарской национальной библиотеки, дающая доступ ко всей цифровой коллекции. Таким образом, вы можете выполнять полнотекстовый поиск по части веб-архива. Однако архивные версии веб-сайтов можно просмотреть только в читальных залах Швейцарской национальной библиотеки и библиотек-партнеров, которые помогают нам создавать коллекцию швейцарских веб-сайтов. Но вы можете просмотреть метаданные заархивированных версий где угодно. |
Система веб-архивирования NTU, NTUWAS [63] | И | И | И | Нет | Представляет миниатюры страниц, архивные страницы, сопоставленные с географическими местоположениями. |
Веб-архив Тайвань [64] | И | И | И | Нет | |
ПейджФризер [19] | И | И | И | Нет | Служба корпоративного класса по требованию для архивирования и воспроизведения веб-сайтов, блогов, Ajax, Flash, видео, аудио и социальных сетей для защиты в судебных процессах, обнаружения электронных данных и соблюдения нормативных требований FDA, FINRA, FSA, SEC, SOX, федеральных правил доказывания и законов об управлении записями. . Используется государственными учреждениями и публичными корпорациями в фармацевтической, пищевой, финансовой, здравоохранительной и розничной отраслях. |
Веб-архив Великобритании [65] | И | И | Н | Родной | |
Ханзо Архивы [124] | И | И | И | Нет | Коммерческие услуги и оборудование для веб-архивирования. Доступ включает полнотекстовый поиск, аннотации, редактирование, URL-адреса/историю, политику архивирования и временной просмотр, а также настраиваемую схему метаданных для расширенных приложений электронного обнаружения. Используется в правительстве и корпорациях, чьи требования или юридические обязательства/потребности распространяются на их веб-сайты, интранет и социальные сети. Множество «темных» архивов по всей Европе и США. |
Веб-архив правительства Великобритании (UKGWA) [125] | И | И | И | Родной | Полнотекстовый поиск доступен в Веб-архиве правительства Великобритании (UKGWA). [137] Пользователи могут просматривать коллекцию, используя полный список всех сайтов в Аризоне. [138] |
Веб-архив выхода из ЕС | И | И | И | Родной | В веб-архиве выхода ЕС действует полнотекстовый поиск. |
Интернет-архив (предоставляет услугу Archive-it) [70] | И | И | И | Родной | История URL-адресов доступна для всех архивированных данных. Метаданные и полнотекстовый поиск только для выбранных обходов. До 2002 года имелась платформа для майнинга для исследований, созданная Alexa Shell Perl Tools. av_tools и платформа p2 для параллельной обработки. [139] Он был заменен более простым методом доступа и прямого доступа, который обеспечивает автоматический доступ к файлам, но не имеет платформы для обработки. [140] |
Программа сбора веб-ресурсов библиотек Колумбийского университета [72] | И | И | И | Нет | Доступно через сервис Archive-it. [141] |
Архив веб-сайта правительства штата Северная Каролина [73] | И | И | И | Нет | Доступно через сервис Archive-it. [141] |
Латиноамериканский проект веб-архивирования [74] | И | И | И | Нет | Доступ к контенту можно получить с помощью полнотекстового поиска, просмотра по стране или специализированной коллекции образцов. |
Проект веб-архивирования для островов Тихого океана [75] | И | И | И | Нет | Поддерживается сервисом Archive-it. |
Веб-архив Библиотеки Конгресса [76] | И | И | Н | Прокси | Доступ предоставляется через LCWA . Записи в формате MODS (описательная схема объекта метаданных). |
Библиотека Гарвардского университета: Служба сбора веб-архивов (WAX) [126] | И | И | И | Нет | |
Служба веб-архивирования из Калифорнийской цифровой библиотеки (служба WAS) [79] | И | И | И | Нет | Доступ для частного обучения, стипендий и исследований. Большинство архивов, созданных с помощью WAS, еще не опубликованы, поскольку партнеры сами решают, хотят ли они предоставить доступ. Сервисом пользуются 16 партнеров, создавших более 80 веб-архивов, из которых только 30 находятся в открытом доступе. Производительность NutchWAX не позволяла осуществлять полный поиск в архиве. Предстоящий переход на SOLR позволит осуществлять как полный архив, так и полнотекстовый поиск по конкретной коллекции. |
Веб-архив Исторической библиотеки Бентли (Мичиганский университет) [80] | И | И | И | Нет | Создано на базе WAS из Калифорнийской цифровой библиотеки. [142] Доступ является общедоступным, но использование ограничено для частного обучения, получения стипендий и исследований. |
Веб-архив Техасского университета в Сан-Антонио [81] | И | И | И | Родной | Доступно через сервис Archive-it. [143] и онлайн-база данных архивных хранилищ Техаса. [144] |
АУЭБ Веб-архив [84] | И | И | И | Нет | |
Веб-архивы Всемирного банка [86] | И | И | И | Нет | История URL-адресов предоставляется через открытый доступ к коллекции через стандартный веб-браузер. Полнотекстовый поиск доступен только внутри каждого отдельного сайта. Поиск по метаданным доступен посредством расширенного поиска в коллекции веб-архивов. |
Университета Северного Техаса Киберкладбище [89] | Н | И | И | Нет | |
Библиотека Тамимент и трудовой архив Роберта Ф. Вагнера в Нью-Йоркском университете [145] | И | И | И | Нет | Доступ осуществляется через сервис WAS [146] а также путем поиска вспомогательных средств, которые доступны для поиска на портале поиска вспомогательных средств Нью-Йоркского университета. [147] |
Цифровая библиотека Йоркского университета [97] | И | И | И | ||
Веб-архив Нидерландского института звука и изображения (Sound and Vision) [100] | И | И | Н | Отдельные сайты, в отношении которых заключены соглашения, являются общедоступными. [100] Полнотекстовое индексирование осуществляется с помощью Elasticsearch , интерфейс построен на Drupal . | |
Департамент библиотек и архивов Кентукки | И | И | И | Нет | Полный открытый доступ |
Библиотека Калифорнийского университета в Сан-Франциско | И | И | И | Нативный (через IA ) | Как захват, так и доступ к заархивированному контенту обеспечивается службой Archive it, поэтому все возможности такие же, как и у Archive-It. |
Библиотеки Айви Плюс | И | И | И | Нет | Доступно через сервис Archive-It. |
Веб-архив правительства Малайзии (MyGWA) | И | И | И | Нет | Открытый доступ |
Национальная медицинская библиотека (США) | И | И | И | Доступ осуществляется через Archive-It. | |
Смитсоновские библиотеки и архивы (США) | И | И | И | Доступ осуществляется через Archive-It. |
См. также [ править ]
Ссылки [ править ]
- ^ Набор данных для создания карты инициатив по веб-архивированию (пожалуйста, обновите ее)
- ^ Дэниел Гомес; Жоао Миранда; Мигель Коста (25–29 сентября 2011 г.). «Опрос инициатив по веб-архивированию» . Международная конференция по теории и практике электронных библиотек 2011 . Спрингер . Проверено 23 октября 2012 г.
- ^ «Аркивера – Хем – английский» . 09.07.2023 . Проверено 9 июня 2024 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив ЕС - Веб-архив ЕС - Публикационное бюро ЕС» . Веб-архив ЕС . Проверено 9 июня 2024 г.
- ^ «Департамент архивов и цифровых коллекций истории Алабамы» . digital.archives.alabama.gov . Проверено 28 октября 2018 г.
- ^ Jump up to: Перейти обратно: а б с «Пандора — веб-архив Австралии» . nla.gov.au. Май 1999 года . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б «Проект ОБЕЩАНИЕ» . Проверено 31 января 2020 г.
- ^ «Королевская библиотека Бельгии» . www.kbr.be. Проверено 31 января 2020 г.
- ^ «Государственный архив Бельгии» . www.arch.be. Проверено 31 января 2020 г.
- ^ «Исследовательская группа по медиа, инновациям и коммуникационным технологиям» . www.ugent.be . Проверено 31 января 2020 г.
- ^ «Гентский центр цифровых гуманитарных наук» . www.ghentcdh.ugent.be . Проверено 31 января 2020 г.
- ^ «Исследовательский центр информации, права и общества» . www.crids.eu/ . Проверено 31 января 2020 г.
- ^ «Верхняя школа Брюсселя-Брабанта» . he2b.be/ . Проверено 31 января 2020 г.
- ^ «Спасение Интернета: обещание бельгийского веб-архива» . КБР . Проверено 31 января 2020 г.
- ^ «Веб-архив КБР» . Проверено 31 января 2020 г.
- ^ «КБР» . www.kbr.be. Проверено 31 января 2020 г.
- ^ «Кодекс Монтаны с аннотациями, 2019 г.» .
- ^ «Стиллио» . Stillio.com. 16 мая 2019 г. Проверено 16 мая 2019 г.
- ^ Jump up to: Перейти обратно: а б «ПейджФризер» . страницаfreezer.com. 20 января 2011 г. Проверено 17 ноября 2013 г.
- ^ «OoCities — Архив Geocities / Зеркало Geocities» . www.oocities.org . Проверено 25 декабря 2019 г.
- ^ «Архив Wikiwix» .
- ^ https://wikiwix.com .
{{cite web}}
: Отсутствует или пусто|title=
( помощь ) - ^ Jump up to: Перейти обратно: а б с «Вебархив Австрии» . Onb.ac.at. Проверено 11 декабря 2020 г.
- ^ Jump up to: Перейти обратно: а б с «Немецкая национальная библиотека» . dnb.de. Проверено 18 сентября 2015 г.
- ^ Jump up to: Перейти обратно: а б с «DILIMAG (Цифровые литературные журналы») . dilimag.literature.at . Проверено 17 ноября 2013 г ..
- ^ Jump up to: Перейти обратно: а б с «Библиотека и Национальный архив Квебека (BAnQ)» . Banq.qc.ca. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с д и ж «Библиотека и архивы Канады» . Библиотека и архивы Канады. 28 мая 2020 г. Проверено 10 июня 2023 г.
- ^ «Закон о библиотеках и архивах Канады, SC 2004, c.11» . Правосудие Канады. 22 апреля 2004 г. Проверено 16 декабря 2014 г.
- ^ «Обязательный экземпляр в Библиотеке и архивах Канады» . Библиотека и архивы Канады. 15 июня 2022 г. Проверено 10 июня 2023 г.
- ^ Jump up to: Перейти обратно: а б с «Сбор и сохранение веб-информации - WICP (Китайский веб-архив)»
- ^ Jump up to: Перейти обратно: а б с «Хорватский веб-архив (Hrvatski arhiv weba - HAW)» . Haw.nsk.hr. 01.10.2004 . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Вебарчив (Национальная библиотека Чехии)» . webarchiv.cz . Проверено 30 октября 2015 г.
- ^ «Нетаркивет» . www.kb.dk (на датском языке) . Проверено 9 июня 2024 г.
- ^ Jump up to: Перейти обратно: а б с «Эстонский веб-архив» . Национальная библиотека Эстонии. 09.01.2014 . Проверено 9 января 2014 г.
- ^ Jump up to: Перейти обратно: а б с «Финский веб-архив» . kansalliskirjasto.fi . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с д «Национальная библиотека Франции – обязательный экземпляр в сети» . Бнф.фр. 17 августа 2010 г. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Ина (Национальный институт аудиовизуального искусства)» (на французском языке). Ина.фр. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Центр библиотечного обслуживания Баден-Вюртемберг» . Bsz-bw.de . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив немецкого Бундестага» . Webarchiv.bundestag.de . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Исландия — ВЕФСАФН» . Vefsafn.is . Проверено 17 ноября 2013 г.
- ^ «Цифровые коллекции». Годовой отчет Национальной библиотеки Ирландии . 2011.
- ^ Jump up to: Перейти обратно: а б с «Проект веб-архивирования (WARP), Национальная парламентская библиотека, Япония» . da.ndl.go.jp. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Национальная библиотека Кореи — ОАЗИС (Интернет-ресурс онлайн-архивирования и поиска)» . Оазис.go.kr. 01.08.2013. Архивировано из оригинала 31 октября 2013 г. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «WebART (инструменты поиска веб-архивов)» .
- ^ «Национальная библиотека Латвии – Расмошана» .
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Новой Зеландии» . Natlib.govt.nz . Проверено 26 февраля 2021 г.
- ^ Jump up to: Перейти обратно: а б с «Онлайн-архив» . Национальная библиотека (на норвежском букмоле) . Проверено 25 декабря 2019 г.
- ^ «Национальная библиотека Норвегии» . ИИПК . Проверено 25 декабря 2019 г.
- ^ Jump up to: Перейти обратно: а б "Arquivo.pt - поиск страниц из прошлого!" . arquivo.pt . Проверено 9 июня 2024 г.
- ^ «Arquivo.pt — португальский веб-архив: поиск по страницам из прошлого» . Фонд национальных научных вычислений (FCCN). 13 августа 2013 года . Проверено 13 августа 2013 г.
- ^ Jump up to: Перейти обратно: а б с Веб-архив Чачака [ постоянная мертвая ссылка ] . digital.cacak.dis.rs
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Сингапура» . eresources.nlb.gov.sg/webarchives . Проверено 3 февраля 2023 г.
- ^ Цифровые ресурсы (Архив цифровых ресурсов университетской библиотеки в Братиславе) [1]
- ^ Jump up to: Перейти обратно: а б с «Словенский веб-архив» . Национальная и университетская библиотека Словении . Проверено 2 февраля 2018 г.
- ^ Jump up to: Перейти обратно: а б с Национальная библиотека Испании. «Архив испанского сайта» . Архивировано из оригинала 23 февраля 2014 г. Проверено 20 февраля 2014 г.
- ^ Jump up to: Перейти обратно: а б с Национальная библиотека Каталонии (16 ноября 2012 г.). «PADICAT: Веб-архив Каталонии» . Национальная библиотека Каталонии . Проверено 16 ноября 2012 г.
- ^ Jump up to: Перейти обратно: а б с Кай Освальд Зейдлер. «Архив цифрового наследия Басков (ONDARENET)» . euskadi.net. Архивировано из оригинала 20 декабря 2012 г. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Kulturarw3 - Королевская библиотека» (на шведском языке). Кб.се. 01.01.2020 . Проверено 4 мая 2021 г.
- ^ Jump up to: Перейти обратно: а б с ААВ Дизайн. «Архив Алеф» . aleph-archives.com . Проверено 17 ноября 2013 г.
- ^ «Архив блога Центра архивов экспатриантов» . xpatarchive.com . Проверено 3 февраля 2020 г.
- ^ «Ковш веб-архивирования» . webarchivbucket.com . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Швейцарии» . Электронная почта : helvetica.nb.admin.ch . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Система веб-архивирования NTU, NTUWAS» . ntu.edu.tw. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Тайваня» . ncl.edu.tw. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Великобритании» . 07.07.2005 . Проверено 17 ноября 2013 г.
- ^ «Веб-архив правительства Великобритании (UKGWA)» . Nationalarchives.gov.uk . Проверено 30 октября 2015 г.
- ^ «Веб-архив выхода ЕС - Национальный архив» . webarchive.nationalarchives.gov.uk . Проверено 9 июня 2024 г.
- ^ Jump up to: Перейти обратно: а б «Веб-архив выхода ЕС - Национальный архив» . webarchive.nationalarchives.gov.uk . Проверено 20 февраля 2021 г.
Текст был скопирован из этого источника, который доступен по лицензии Open Government License v3.0 . © Авторские права Короны.
- ^ «MirrorWeb: ваша единая платформа обеспечения соответствия» . www.mirrorweb.com . Проверено 9 июня 2024 г.
- ^ Jump up to: Перейти обратно: а б с «Интернет-архив (предоставляет услугу Archive-it)» . 10 марта 2001 г. Проверено 17 ноября 2013 г.
- ^ «Веб-архивирование | Библиотеки Стэнфордского университета» . Проверено 26 марта 2014 г.
- ^ Jump up to: Перейти обратно: а б с «Программа сбора веб-ресурсов библиотек Колумбийского университета» . Колумбия.edu . Проверено 1 октября 2019 г.
- ^ Jump up to: Перейти обратно: а б с «Архив веб-сайта правительства штата Северная Каролина» . ncdcr.gov . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Латиноамериканский проект веб-архивирования» . utexas.edu . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с Даурс, Стю. «Исследовательские руководства: проект веб-архивирования островов Тихого океана: Введение» . guides.library.manoa.hawaii.edu . Проверено 25 декабря 2019 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Библиотеки Конгресса» . Лок.gov . Проверено 17 ноября 2013 г.
- ^ «Коллекции веб-архивов» . сохранение.library.harvard.edu . Проверено 22 февраля 2021 г.
- ^ «Веб-архив» . сохранение.library.harvard.edu . Проверено 22 февраля 2021 г.
- ^ Jump up to: Перейти обратно: а б с «Служба веб-архивирования Калифорнийской цифровой библиотеки (служба WAS)» . cdlib.org. 16 октября 2013 г. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Исторической библиотеки Бентли (Мичиганский университет)» . umich.edu. Архивировано из оригинала 3 октября 2013 г. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив Техасского университета в Сан-Антонио» . Архив-it.org . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б «Кумрам» . Кумрам.com. 30 июня 2011 г. Проверено 6 марта 2019 г.
- ^ САПЕРИОН АГ, Берлин. «Архив веб-контента Saperion ECM» . saperion.com . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архив АУЭБ» . aueb.gr. 21 октября 2011 г. Проверено 17 ноября 2013 г.
- ^ «Архивирование веб-сайтов Афинского университета экономики и бизнеса» (PDF) . aueb.gr. Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б с «Веб-архивы Всемирного банка0» . worldbank.org. 20 декабря 2012 г. Проверено 17 ноября 2013 г.
- ^ "Национальный цифровой архив России" .
- ^ «Веб-сайты/Вики-команда» . Проверено 5 февраля 2016 г.
- ^ Jump up to: Перейти обратно: а б с Департамент правительственных документов, Библиотеки Университета Северного Техаса, штат Техас (2 февраля 2009 г.). «Киберкладбище Университета Северного Техаса» . unt.edu . Проверено 17 ноября 2013 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «Киберкладбище» . Цифровая библиотека ЕНТ . Проверено 25 декабря 2019 г.
- «Сборник исследований ACIR» . 10 февраля 1998 г. Архивировано из оригинала 10 февраля 1998 г. Проверено 25 декабря 2019 г.
Сайт создан: июль 1997 г.
- Материалы... Ежегодной конференции Федеральных депозитарных библиотек . Типография правительства США. 1999. с. 45.
- «Сборник исследований ACIR» . 10 февраля 1998 г. Архивировано из оригинала 10 февраля 1998 г. Проверено 25 декабря 2019 г.
- ^ «[Обзор веб-сервиса] «Архив сегодня», сервис рисования рыб, который также поддерживает загрузку ZIP и изображений — CNET Japan» Проверено , сентября 2014 2 г. .
- ^ «Блог Archive.today» .
- ^ «Библиотеки Нью-Йоркского университета | Библиотека Тамимента и трудовой архив Роберта Ф. Вагнера» . Нью.еду . Проверено 19 августа 2013 г.
- ^ «Как работает Preservica — Preservica» . preservica.com . 12 мая 2014 года. Архивировано из оригинала 12 мая 2014 года . Проверено 12 мая 2014 г.
- ^ Центральный государственный электронный архив Украины (ЦГЭА Украины)
- ^ «Информационный буклет ЦГЭА Украины» (PDF) . Архивировано из оригинала (PDF) 13 апреля 2014 г. Проверено 10 апреля 2014 г.
- ^ Jump up to: Перейти обратно: а б с Библиотеки Йоркского университета, Торонто, Онтарио (01 ноября 2012 г.). «Машина обратного пути библиотек Йоркского университета» . библиотека.yorku.ca . Проверено 20 ноября 2023 г.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «Веб-архивирование - Нью-Йоркский консорциум художественных ресурсов» . nyarc.org . Проверено 17 декабря 2014 г.
- ^ Карл-Райнер Блюменталь (27 октября 2014 г.). «Теперь все вместе: NYARC и Национальная программа управления цифровыми технологиями» . Архивировано из оригинала 17 декабря 2014 года . Проверено 17 декабря 2014 г.
- ^ Jump up to: Перейти обратно: а б с д «Веб-архив Sound and Vision» . beeldengeluid.nl/en . Проверено 21 января 2015 г.
- ^ «Живые веб-архивы» . Проверено 21 января 2015 г.
- ^ «ВЕБ-АРХИВИРОВАНИЕ НА ЗВУКЕ И ВИДЕНИИ: РЕЗУЛЬТАТЫ НАШЕГО ПИЛОТНОГО ПРОЕКТА NTR» . 18 августа 2014 г. Архивировано из оригинала 21 января 2015 г. Проверено 21 января 2015 г.
- ^ Jump up to: Перейти обратно: а б «WSСОХРАНИТЬ ДАТУ: СТУДЕНЧЕСКАЯ ВЕБАРХИВЕРИНГ» . 19 августа 2014 г. Архивировано из оригинала 21 января 2015 г. Проверено 21 января 2015 г.
- ^ «Пионер сетевого искусства развивается в эпоху цифровых технологий: Rhizome исполняется 20 лет | ARTnews» . www.artnews.com . Проверено 13 ноября 2016 г.
- ^ «Домашняя страница Инициативы по документации по правам человека библиотек Техасского университета | Библиотеки Техасского университета» . lib.utexas.edu . Проверено 6 апреля 2017 г.
- ^ «Департамент библиотек и архивов Кентукки | Archive-It» .
- ^ «Archive-It — Калифорнийский университет в Сан-Франциско (UCSF)» . archive-it.org . Проверено 12 июля 2017 г.
- ^ «Библиотеки Айви Плюс» .
- ^ «Программа сбора веб-ресурсов библиотек Ivy Plus» .
- ^ «HTTP-архив» . httparchive.org . Проверено 28 декабря 2020 г.
- ^ «Сбор и архивирование веб-страниц NLM» . www.nlm.nih.gov . Проверено 19 февраля 2021 г.
- ^ «Смитсоновские библиотеки и архивы» . Проверено 19 августа 2021 г.
- ^ «Архивирование Интернета и социальных сетей» . Проверено 19 августа 2021 г.
- ^ «О веб-архиве Ghostarchive» . Архив призраков . Проверено 10 сентября 2022 г.
- ^ «Поиск Whois для Ghostarchive.org» . кто.есть . Проверено 10 сентября 2022 г.
Зарегистрировано 13 августа 2021 г.
- ^ «Общее ползание» . Обычное сканирование . Проверено 27 августа 2023 г.
- ^ Jump up to: Перейти обратно: а б «Наш цифровой остров, Тасманийский веб-архив» . tas.gov.au. Архивировано из оригинала 18 марта 2013 г. Проверено 29 мая 2014 г.
- ^ «LINC Tasmania Online — Домашняя страница» . Statelibrary.tas.gov.au. 26 июня 2012 г. Проверено 17 июля 2012 г.
- ^ «Нетаркивет» . www.kb.dk (на датском языке) . Проверено 9 июня 2024 г.
- ^ Jump up to: Перейти обратно: а б «Электронные диаспоры (Télécom ParisTech, FMSH)» . ediasporas.ticmigrations.fr. Архивировано из оригинала 27 сентября 2013 г. Проверено 17 ноября 2013 г.
- ^ «Европейский архив» . Архивировано из оригинала 8 декабря 2007 г. Проверено 17 ноября 2013 г.
- ^ Фонд науки и технологий (FCT) (2 февраля 2023 г.). «Arquivo.pt в цифрах» . Фонд науки и технологий (FCT) . Проверено 2 февраля 2023 г.
- ^ «Цифровые ресурсы (Веб-хранилище Университетской библиотеки в Братиславе)» . Цифровые ресурсы . 3 января 2021 г.
- ^ Jump up to: Перейти обратно: а б «Архив Ханзо» . hanzoarchives.com . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б «Веб-архив правительства Великобритании» . Nationalarchives.gov.uk . Проверено 17 ноября 2013 г.
- ^ Jump up to: Перейти обратно: а б «Библиотека Гарвардского университета: Служба сбора веб-архивов (WAX)» . Гарвард.edu . Проверено 17 ноября 2013 г.
- ^ «Archive-It — Конфедерация библиотек Ivy Plus» . archive-it.org . Проверено 19 февраля 2021 г.
- ^ «Находка (поиск в Архиве Пандоры)» . nla.gov.au. Проверено 17 ноября 2013 г.
- ^ «Библиотека и Национальный архив Квебека (BAnQ)» . Banq.qc.ca.
- ^ «Нетаркивет.дк» . Netarkivet.dk. 17 октября 2013 г. Проверено 17 ноября 2013 г.
- ^ «Веб-архив немецкого Бундестага» . Bundestag.de . Проверено 17 ноября 2013 г.
- ^ «Национальная библиотека Кореи — ОАЗИС» . го.кр. 01.08.2013. Архивировано из оригинала 20 марта 2012 г. Проверено 17 ноября 2013 г.
- ^ "Поиск Национальной библиотеки Норвегии" . NB.нет.
- ^ Дэниел Гомес (ноябрь 2022 г.). «Веб-архивы как исследовательская инфраструктура для цифровых обществ: пример Arquivo.pt» (PDF) . Архейон . Проверено 2 февраля 2023 г.
- ^ «Веб-хранилище цифровых ресурсов Университетской библиотеки в Братиславе» . Цифровые ресурсы . 3 февраля 2020 г.
- ^ «Веб-архив Швейцарии — e-Helvetica» . nb.admin.ch . Проверено 17 ноября 2013 г.
- ^ «Полнотекстовый поиск в веб-архиве правительства Великобритании» . Проверено 8 февраля 2018 г.
- ^ «Список Аризоны веб-архива правительства Великобритании» . Nationalarchives.gov.uk . Проверено 17 ноября 2013 г.
- ^ "Исследователь - Документация" . archive.org.
- ^ «Использование Archive.org» . archive.org.
- ^ Jump up to: Перейти обратно: а б «Архив-это: библиотеки Колумбийского университета» . архив-it.org.
- ^ "Альтернативные средства массовой информации цифровой библиотеки Калифорнии" . cdlib.org.
- ^ "Партнеры Archive-it" . архив-it.org
- ^ "Онлайн-архивные хранилища Техаса" . utexas.edu.
- ^ «Проект веб-архивирования библиотеки Tamiment». Архивировано 25 сентября 2012 г., в Wayback Machine.
- ^ «Учреждение: библиотеки Нью-Йоркского университета / библиотека Тамимент (лейбористы и левые)» . cdlib.org . Проверено 19 августа 2013 г.
- ^ «Поисковые средства, размещенные в Нью-Йоркском университете» . Нью.еду . Проверено 19 августа 2013 г.