archive.today
Тип сайта | Веб-архивирование |
---|---|
Доступно в | Многоязычный |
URL-адрес |
|
Регистрация | Нет |
Запущен | 16 мая 2012 г [2] |
archive.today (или archive.is ) — это сайт веб-архивирования , основанный в 2012 году, который сохраняет снимки по запросу и поддерживает сайты с большим количеством JavaScript , такие как Google Maps и Twitter . [3] archive.today записывает два снимка: один копирует исходную веб-страницу, включая все функциональные действующие ссылки; другой — скриншот страницы. [4]
Личность его оператора не очевидна. [5]
История [ править ]
Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is. [6]
В январе 2019 года домен archive.is начал отказываться от поддержки в пользу других зеркал. [7]
По состоянию на 2021 год archive.today сохранил около 500 миллионов страниц. [5]
Особенности [ править ]
Функциональность [ править ]
Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей. [8] [9] [10] С самого начала он поддерживал сканирование страниц с URL-адресами , содержащими устаревший фрагмент хеш-bang ( #! ). [11]
Archive.today записывает только текст и изображения, исключая XML , RTF , электронные таблицы ( xls или ods ) и другой нестатический контент. Однако видео с некоторых сайтов, например X (ранее Twitter) , сохраняются. [12] Он отслеживает историю сохраненных снимков, запрашивая подтверждение перед добавлением нового снимка уже сохраненной страницы. [13] [14]
Страницы захватываются при ширине браузера 1024 пикселя. CSS преобразуется во встроенный CSS, при этом удаляются адаптивный веб-дизайн и такие селекторы, как :hover
и :active
. Содержимое, созданное с помощью JavaScript в процессе сканирования, отображается в замороженном состоянии. [15] Имена классов HTML сохраняются внутри old-class
атрибут .Когда текст выделен , апплет JavaScript генерирует фрагмент URL-адреса браузера , отображаемый в адресной строке , который автоматически выделяет эту часть текста при повторном посещении.
Веб-страницы можно дублировать из archive.today в web.archive.org в качестве резервной копии второго уровня , но archive.today не сохраняет свои снимки в формате WARC. Возможен и обратный вариант — с web.archive.org на archive.today. [16] но копирование обычно занимает больше времени, чем прямой захват. Исторически владельцы веб-сайтов имели возможность отказаться от Wayback Machine с помощью стандарта исключения роботов (robots.txt), и эти исключения также применялись задним числом. [17] Archive.today не подчиняется robots.txt, поскольку действует «как прямой агент пользователя-человека». [10] С 2019 года Wayback Machine больше не подчиняется robots.txt.
Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя *
в качестве подстановочного знака . Пара кавычек адресует поиск к точной последовательности ключевых слов, присутствующих в заголовке или теле веб-страницы, тогда как оператор внутреннего сайта ограничивает его конкретным доменом Интернета. [18]
После того как веб-страница заархивирована, ни один пользователь Интернета не может ее удалить напрямую. [19] Удалить рекламу, всплывающие окна или расширить ссылки с заархивированных страниц можно, попросив владельца сделать это в его блоге. [20]
При сохранении динамического списка в поле поиска archive.today отображается только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу). [21] Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений. [13] [ нужны разъяснения ]
Функция поиска поддерживается Google CustomSearch. Если результатов нет, archive.today пытается использовать Поиск Яндекса . [22]
При сохранении страницы список URL-адресов отдельных элементов страницы и размеров их содержимого, статусы HTTP и типы MIME отображается . Этот список можно просмотреть только в процессе сканирования.
Заархивированные страницы можно скачать в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года. [update] когда archive.today сменил движок браузера с PhantomJS на Chromium . [23]
В июле 2013 года Archive.today начал поддержку API проекта Memento . [24] [25]
Доступность по всему миру [ править ]
Австралия и Новая Зеландия [ править ]
В марте 2019 года сайт был заблокирован на шесть месяцев несколькими интернет-провайдерами в Австралии и Новой Зеландии после стрельбы в мечети Крайстчерча в попытке ограничить распространение видеозаписи нападения. [26] [27]
Китай [ править ]
По данным GreatFire.org , archive.today заблокирован в материковом Китае с марта 2016 года. [update][28] archive.li с сентября 2017 г., [update][29] archive.fo с июля 2018 г., [update][30] а также archive.ph с декабря 2019 года. [update][31]
Finland[editФинляндия
21 июля 2015 года операторы заблокировали доступ к сервису со всех финских IP-адресов , заявив в Twitter, что сделали это во избежание эскалации спора, который у них якобы возник с правительством Финляндии. [32]
Россия [ править ]
В 2016 году Роскомнадзор начал блокировать доступ к archive.is из России. [33] [34]
Доступность Cloudflare DNS [ править ]
С мая 2018 года [35] [36] Cloudflare Служба 1.1.1.1 DNS не разрешала веб-адреса archive.today, что делало ее недоступной для пользователей службы DNS Cloudflare. Обе организации заявили, что ответственность за проблему несет другая. Сотрудники Cloudflare заявили, что проблема была в DNS-инфраструктуре archive.today, поскольку ее авторитетные серверы имен возвращали неверные записи, когда сетевые системы Cloudflare отправляли запросы archive.today. archive.today возразил, что проблема возникла из-за того, что запросы Cloudflare не соответствовали стандартам DNS, поскольку Cloudflare не отправляет информацию о подсети клиента EDNS в своих DNS-запросах. [37] [38]
См. также [ править ]
Ссылки [ править ]
- ^ @archiveis (29 октября 2019 г.). «Текущий список всех доменов Tor и доменов Clear Net» ( Твит ) – через Твиттер .
- ^ Блог Archive.is (18 февраля 2014 г.). «Когда впервые был запущен сайт Archive-is?» . Тамблер . Архивировано из оригинала 20 марта 2021 года . Проверено 10 апреля 2021 г.
- ^ Бринкманн, Мартин (22 апреля 2015 г.). «Создавайте общедоступные архивы веб-страниц с помощью Archive.is» . Гаки . Архивировано из оригинала 12 апреля 2019 года . Проверено 13 июня 2015 г.
- ^ Брунель, Джастин Ф.; Келли, Мэт; Вейгл, Мишель К.; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на архивируемость» (PDF) . Международный журнал цифровых библиотек . 17 (2): 95–117. дои : 10.1007/s00799-015-0140-8 . S2CID 8433375 . Архивировано (PDF) из оригинала 27 мая 2019 г.
- ↑ Перейти обратно: Перейти обратно: а б Патокаллио, Яни (5 августа 2023 г.). "archive.today: По следам загадочного партизана-архивиста Интернета" . Джироваг . Архивировано из оригинала 13 августа 2023 года . Проверено 1 января 2024 г.
- ^ «Почему вы изменили URL-адрес обратно с «архив-сегодня» на «архив-есть»? . Блог Archive.is . 3 мая 2015 г. Архивировано из оригинала 1 июня 2015 г. Проверено 6 января 2019 г.
- ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для связывания, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» ( твит ). Архивировано из оригинала 6 января 2019 года — через Twitter .
- ^ Даскалеску, Дэн (18 февраля 2013 г.). «Архивирование веб-страниц – Wiki Дэна Даскалеску (обзор)» . Wiki.dandascalescu.com. Архивировано из оригинала 22 сентября 2013 года . Проверено 3 октября 2013 г.
- ^ Кеблер, Джейсон (29 октября 2014 г.). «Дорогой GamerGate: пожалуйста, прекратите воровать наше дерьмо» . Материнская плата . Архивировано из оригинала 27 мая 2019 года . Проверено 22 марта 2017 г.
Веб-сайт не может защитить себя от зеркалирования сайта пользователем Archive.today.
- ↑ Перейти обратно: Перейти обратно: а б «Часто задаваемые вопросы Archive.today» . архив.сегодня . Проверено 15 февраля 2019 г.
- ^ «Главная страница Archive.is в 2013 году» . Архивировано из оригинала 12 января 2013 года.
- ^ «Блог Archive.today» . Архивировано из оригинала 7 сентября 2021 года.
- ↑ Перейти обратно: Перейти обратно: а б Архивирование веб-сайтов с помощью Archive.is , заархивировано из оригинала 27 января 2022 г. , получено 27 января 2022 г.
- ^ «Пример истории снимков на archive.is» .
- ^ Сгенерированная JavaScript анимация загрузки Dailymotion, видео появляющаяся в замороженном состоянии.
- ^ «Пример: страница сохранена из веб-архива в Archive.is» (на испанском языке). Архивировано из оригинала 20 мая 2013 года . Проверено 23 октября 2019 г.
- ^ «Часто задаваемые вопросы. Некоторые сайты недоступны из-за файла Robots.txt или других исключений. Что это значит?» . Интернет-архив Wayback Machine . Архивировано из оригинала 15 апреля 2011 года.
- ^ Например, строка на сайте: https://en.wikipedia.org «Чемпионат мира» возвращает «World+Cup»/связанные снимки.
- ^ «Некоторые часто задаваемые вопросы» (блог) . архив.есть . 24 января 2013 года. Архивировано из оригинала 26 сентября 2013 года . Проверено 12 ноября 2018 г.
- ^ «Пример запроса пользователя в блоге Archive.is» . Блог Archive.is . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
- ^ Пример динамического списка: "au:"Фома Аквинский" " . МирКэт . Архивировано из оригинала 23 марта 2019 года . Проверено 15 декабря 2018 г.
- ^ «Только что сегодня понял, что могу искать архив по ключевым словам в строке поиска. Это недавно добавленная функция?» . Блог Archive.is . 18 января 2022 года. Архивировано из оригинала 27 января 2022 года . Проверено 27 января 2022 г.
- ^ «Кнопка «Загрузить zip» уже некоторое время выдает ошибку «Не найдено» . Блог Archive.is . 17 июля 2020 г. Архивировано из оригинала 3 октября 2020 г.
- ^ Нельсон, Майкл Л. (9 июля 2013 г.). «Archive.is поддерживает Memento» . Обновления исследований и преподавания . Группа исследования веб-науки и цифровых библиотек в Университете Олд-Доминион . Архивировано из оригинала 27 июля 2013 года . Проверено 17 сентября 2013 г.
- ^ "архив.is" . Информация протокола на память . Группа развития Мементо. Архивировано из оригинала 15 сентября 2013 года . Проверено 17 сентября 2013 г.
- ^ «Интернет-провайдеры в Австралии и Новой Зеландии начинают цензурировать Интернет без каких-либо юридических прецедентов» . Частный доступ в Интернет . 19 марта 2019 года. Архивировано из оригинала 28 апреля 2023 года . Проверено 20 марта 2019 г.
- ^ «Новозеландские интернет-провайдеры заявляют, что блокируют сайты, которые не могут удалить видео стрельбы в Крайстчерче» . Гизмодо Австралия . 19 марта 2019 года. Архивировано из оригинала 18 мая 2019 года . Проверено 20 марта 2019 г.
- ^ «archive.is на 100% заблокирован в Китае» . Анализатор GreatFire . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
- ^ «archive.li на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
- ^ «archive.fo на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
- ^ «archive.ph заблокирован на 100% в Китае» . ru.greatfire.org . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
- ^ Лапинти, Ласси (22 июля 2015 г.). «Доступ финнов к веб-сайту, используемому хактивистами, заблокирован» [Доступ финнов к веб-сайту, используемому хактивистами, заблокирован]. Илталехти (на финском языке). Архивировано из оригинала 27 мая 2019 года . Проверено 4 марта 2016 г.
- ^ Elistratov, Vladimir (29 January 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov" Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов . TJournal (на русском языке). Архивировано из оригинала 30 августа 2017 года . Проверено 30 января 2016 г.
- ^ Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, поскольку он может содержать старые страницы о наркотиках» . Техдирт . Архивировано из оригинала 23 марта 2019 года . Проверено 26 февраля 2016 г.
- ^ «Архив.is — Ошибка 1001» . Сообщество Cloudflare . 15 мая 2018 года. Архивировано из оригинала 2 декабря 2021 года . Проверено 2 декабря 2021 г.
- ^ «Archive.today и связанные с ним сайты снова терпят неудачу» . Сообщество Cloudflare . 3 марта 2024 года. Архивировано из оригинала 3 апреля 2024 года . Проверено 20 марта 2024 г.
- ^ @archiveis (16 июля 2018 г.). « Необходимо сделать» здесь не так однозначно. Отсутствие EDNS и массовое несоответствие (не только на уровне AS/страны, но даже на уровне континента) того, откуда поступают DNS и связанные с ним HTTP-запросы, вызывают так много проблем, поэтому я рассматриваю EDNS. -меньше запросов от Cloudflare как недействительных» ( твит ). Архивировано из оригинала 2 августа 2023 года — через Twitter .
- ^ «Комментарий Мэтью Принса к Hacker News» . Хакерские новости . 4 мая 2019 года. Архивировано из оригинала 13 мая 2022 года . Проверено 4 октября 2021 г.
Внешние ссылки [ править ]
- archive.today на archiveteam.org
- archive.ph/faq
- «archive.today: По следам загадочного партизана-архивиста Интернета» , Жироваг , 5 августа 2023 г.