Jump to content

archive.today

archive.today
Скриншот главной страницы archive.today
Тип сайта
Веб-архивирование
Доступно в Многоязычный
URL-адрес
Регистрация Нет
Запущен 16 мая 2012 г .; 12 лет назад ( 16 мая 2012 г. ) [2]

archive.today (или archive.is ) — это сайт веб-архивирования , основанный в 2012 году, который сохраняет снимки по запросу и поддерживает сайты с большим количеством JavaScript , такие как Google Maps и Twitter . [3] archive.today записывает два снимка: один копирует исходную веб-страницу, включая все функциональные действующие ссылки; другой — скриншот страницы. [4]

Личность его оператора не очевидна. [5]

История [ править ]

Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is. [6]

В январе 2019 года домен archive.is начал отказываться от поддержки в пользу других зеркал. [7]

По состоянию на 2021 год archive.today сохранил около 500 миллионов страниц. [5]

Особенности [ править ]

Функциональность [ править ]

Archive.today может захватывать отдельные страницы в ответ на явные запросы пользователей. [8] [9] [10] С самого начала он поддерживал сканирование страниц с URL-адресами , содержащими устаревший фрагмент хеш-bang ( #! ). [11]

Archive.today записывает только текст и изображения, исключая XML , RTF , электронные таблицы ( xls или ods ) и другой нестатический контент. Однако видео с некоторых сайтов, например X (ранее Twitter) , сохраняются. [12] Он отслеживает историю сохраненных снимков, запрашивая подтверждение перед добавлением нового снимка уже сохраненной страницы. [13] [14]

Страницы захватываются при ширине браузера 1024 пикселя. CSS преобразуется во встроенный CSS, при этом удаляются адаптивный веб-дизайн и такие селекторы, как :hover и :active. Содержимое, созданное с помощью JavaScript в процессе сканирования, отображается в замороженном состоянии. [15] Имена классов HTML сохраняются внутри old-class атрибут .Когда текст выделен , апплет JavaScript генерирует фрагмент URL-адреса браузера , отображаемый в адресной строке , который автоматически выделяет эту часть текста при повторном посещении.

Веб-страницы можно дублировать из archive.today в web.archive.org в качестве резервной копии второго уровня , но archive.today не сохраняет свои снимки в формате WARC. Возможен и обратный вариант — с web.archive.org на archive.today. [16] но копирование обычно занимает больше времени, чем прямой захват. Исторически владельцы веб-сайтов имели возможность отказаться от Wayback Machine с помощью стандарта исключения роботов (robots.txt), и эти исключения также применялись задним числом. [17] Archive.today не подчиняется robots.txt, поскольку действует «как прямой агент пользователя-человека». [10] С 2019 года Wayback Machine больше не подчиняется robots.txt.

Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя * в качестве подстановочного знака . Пара кавычек адресует поиск к точной последовательности ключевых слов, присутствующих в заголовке или теле веб-страницы, тогда как оператор внутреннего сайта ограничивает его конкретным доменом Интернета. [18]

После того как веб-страница заархивирована, ни один пользователь Интернета не может ее удалить напрямую. [19] Удалить рекламу, всплывающие окна или расширить ссылки с заархивированных страниц можно, попросив владельца сделать это в его блоге. [20]

При сохранении динамического списка в поле поиска archive.today отображается только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу). [21] Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений. [13] [ нужны разъяснения ]

Функция поиска поддерживается Google CustomSearch. Если результатов нет, archive.today пытается использовать Поиск Яндекса . [22]

При сохранении страницы список URL-адресов отдельных элементов страницы и размеров их содержимого, статусы HTTP и типы MIME отображается . Этот список можно просмотреть только в процессе сканирования.

Заархивированные страницы можно скачать в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года. когда archive.today сменил движок браузера с PhantomJS на Chromium . [23]

В июле 2013 года Archive.today начал поддержку API проекта Memento . [24] [25]

Доступность по всему миру [ править ]

Австралия и Новая Зеландия [ править ]

В марте 2019 года сайт был заблокирован на шесть месяцев несколькими интернет-провайдерами в Австралии и Новой Зеландии после стрельбы в мечети Крайстчерча в попытке ограничить распространение видеозаписи нападения. [26] [27]

Китай [ править ]

По данным GreatFire.org , archive.today заблокирован в материковом Китае с марта 2016 года. [28] archive.li с сентября 2017 г., [29] archive.fo с июля 2018 г., [30] а также archive.ph с декабря 2019 года. [31]

Finland[editФинляндия

21 июля 2015 года операторы заблокировали доступ к сервису со всех финских IP-адресов , заявив в Twitter, что сделали это во избежание эскалации спора, который у них якобы возник с правительством Финляндии. [32]

Россия [ править ]

В 2016 году Роскомнадзор начал блокировать доступ к archive.is из России. [33] [34]

Доступность Cloudflare DNS [ править ]

С мая 2018 года [35] [36] Cloudflare Служба 1.1.1.1 DNS не разрешала веб-адреса archive.today, что делало ее недоступной для пользователей службы DNS Cloudflare. Обе организации заявили, что ответственность за проблему несет другая. Сотрудники Cloudflare заявили, что проблема была в DNS-инфраструктуре archive.today, поскольку ее авторитетные серверы имен возвращали неверные записи, когда сетевые системы Cloudflare отправляли запросы archive.today. archive.today возразил, что проблема возникла из-за того, что запросы Cloudflare не соответствовали стандартам DNS, поскольку Cloudflare не отправляет информацию о подсети клиента EDNS в своих DNS-запросах. [37] [38]

См. также [ править ]

Ссылки [ править ]

  1. ^ @archiveis (29 октября 2019 г.). «Текущий список всех доменов Tor и доменов Clear Net» ( Твит ) – через Твиттер .
  2. ^ Блог Archive.is (18 февраля 2014 г.). «Когда впервые был запущен сайт Archive-is?» . Тамблер . Архивировано из оригинала 20 марта 2021 года . Проверено 10 апреля 2021 г.
  3. ^ Бринкманн, Мартин (22 апреля 2015 г.). «Создавайте общедоступные архивы веб-страниц с помощью Archive.is» . Гаки . Архивировано из оригинала 12 апреля 2019 года . Проверено 13 июня 2015 г.
  4. ^ Брунель, Джастин Ф.; Келли, Мэт; Вейгл, Мишель К.; Нельсон, Майкл Л. (25 января 2015 г.). «Влияние JavaScript на архивируемость» (PDF) . Международный журнал цифровых библиотек . 17 (2): 95–117. дои : 10.1007/s00799-015-0140-8 . S2CID   8433375 . Архивировано (PDF) из оригинала 27 мая 2019 г.
  5. Перейти обратно: Перейти обратно: а б Патокаллио, Яни (5 августа 2023 г.). "archive.today: По следам загадочного партизана-архивиста Интернета" . Джироваг . Архивировано из оригинала 13 августа 2023 года . Проверено 1 января 2024 г.
  6. ^ «Почему вы изменили URL-адрес обратно с «архив-сегодня» на «архив-есть»? . Блог Archive.is . 3 мая 2015 г. Архивировано из оригинала 1 июня 2015 г. Проверено 6 января 2019 г.
  7. ^ @archiveis (4 января 2019 г.). «Пожалуйста, не используйте зеркало archive.IS для связывания, используйте другие зеркала [.TODAY .FO .LI .VN .MD .PH]. .IS может скоро перестать работать» ( твит ). Архивировано из оригинала 6 января 2019 года — через Twitter .
  8. ^ Даскалеску, Дэн (18 февраля 2013 г.). «Архивирование веб-страниц – Wiki Дэна Даскалеску (обзор)» . Wiki.dandascalescu.com. Архивировано из оригинала 22 сентября 2013 года . Проверено 3 октября 2013 г.
  9. ^ Кеблер, Джейсон (29 октября 2014 г.). «Дорогой GamerGate: пожалуйста, прекратите воровать наше дерьмо» . Материнская плата . Архивировано из оригинала 27 мая 2019 года . Проверено 22 марта 2017 г. Веб-сайт не может защитить себя от зеркалирования сайта пользователем Archive.today.
  10. Перейти обратно: Перейти обратно: а б «Часто задаваемые вопросы Archive.today» . архив.сегодня . Проверено 15 февраля 2019 г.
  11. ^ «Главная страница Archive.is в 2013 году» . Архивировано из оригинала 12 января 2013 года.
  12. ^ «Блог Archive.today» . Архивировано из оригинала 7 сентября 2021 года.
  13. Перейти обратно: Перейти обратно: а б Архивирование веб-сайтов с помощью Archive.is , заархивировано из оригинала 27 января 2022 г. , получено 27 января 2022 г.
  14. ^ «Пример истории снимков на archive.is» .
  15. ^ Сгенерированная JavaScript анимация загрузки Dailymotion, видео появляющаяся в замороженном состоянии.
  16. ^ «Пример: страница сохранена из веб-архива в Archive.is» (на испанском языке). Архивировано из оригинала 20 мая 2013 года . Проверено 23 октября 2019 г.
  17. ^ «Часто задаваемые вопросы. Некоторые сайты недоступны из-за файла Robots.txt или других исключений. Что это значит?» . Интернет-архив Wayback Machine . Архивировано из оригинала 15 апреля 2011 года.
  18. ^ Например, строка на сайте: https://en.wikipedia.org «Чемпионат мира» возвращает «World+Cup»/связанные снимки.
  19. ^ «Некоторые часто задаваемые вопросы» (блог) . архив.есть . 24 января 2013 года. Архивировано из оригинала 26 сентября 2013 года . Проверено 12 ноября 2018 г.
  20. ^ «Пример запроса пользователя в блоге Archive.is» . Блог Archive.is . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
  21. ^ Пример динамического списка: "au:"Фома Аквинский" " . МирКэт . Архивировано из оригинала 23 марта 2019 года . Проверено 15 декабря 2018 г.
  22. ^ «Только что сегодня понял, что могу искать архив по ключевым словам в строке поиска. Это недавно добавленная функция?» . Блог Archive.is . 18 января 2022 года. Архивировано из оригинала 27 января 2022 года . Проверено 27 января 2022 г.
  23. ^ «Кнопка «Загрузить zip» уже некоторое время выдает ошибку «Не найдено» . Блог Archive.is . 17 июля 2020 г. Архивировано из оригинала 3 октября 2020 г.
  24. ^ Нельсон, Майкл Л. (9 июля 2013 г.). «Archive.is поддерживает Memento» . Обновления исследований и преподавания . Группа исследования веб-науки и цифровых библиотек в Университете Олд-Доминион . Архивировано из оригинала 27 июля 2013 года . Проверено 17 сентября 2013 г.
  25. ^ "архив.is" . Информация протокола на память . Группа развития Мементо. Архивировано из оригинала 15 сентября 2013 года . Проверено 17 сентября 2013 г.
  26. ^ «Интернет-провайдеры в Австралии и Новой Зеландии начинают цензурировать Интернет без каких-либо юридических прецедентов» . Частный доступ в Интернет . 19 марта 2019 года. Архивировано из оригинала 28 апреля 2023 года . Проверено 20 марта 2019 г.
  27. ^ «Новозеландские интернет-провайдеры заявляют, что блокируют сайты, которые не могут удалить видео стрельбы в Крайстчерче» . Гизмодо Австралия . 19 марта 2019 года. Архивировано из оригинала 18 мая 2019 года . Проверено 20 марта 2019 г.
  28. ^ «archive.is на 100% заблокирован в Китае» . Анализатор GreatFire . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  29. ^ «archive.li на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  30. ^ «archive.fo на 100% заблокирован в Китае» . Отличный анализатор пожаров . 12 августа 2018 г. Архивировано из оригинала 12 августа 2018 г.
  31. ^ «archive.ph заблокирован на 100% в Китае» . ru.greatfire.org . Архивировано из оригинала 29 апреля 2022 года . Проверено 7 апреля 2022 г.
  32. ^ Лапинти, Ласси (22 июля 2015 г.). «Доступ финнов к веб-сайту, используемому хактивистами, заблокирован» [Доступ финнов к веб-сайту, используемому хактивистами, заблокирован]. Илталехти (на финском языке). Архивировано из оригинала 27 мая 2019 года . Проверено 4 марта 2016 г.
  33. ^ Elistratov, Vladimir (29 January 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov" Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов . TJournal (на русском языке). Архивировано из оригинала 30 августа 2017 года . Проверено 30 января 2016 г.
  34. ^ Кушинг, Тим (4 февраля 2016 г.). «Россия блокирует еще один архивный сайт, поскольку он может содержать старые страницы о наркотиках» . Техдирт . Архивировано из оригинала 23 марта 2019 года . Проверено 26 февраля 2016 г.
  35. ^ «Архив.is — Ошибка 1001» . Сообщество Cloudflare . 15 мая 2018 года. Архивировано из оригинала 2 декабря 2021 года . Проверено 2 декабря 2021 г.
  36. ^ «Archive.today и связанные с ним сайты снова терпят неудачу» . Сообщество Cloudflare . 3 марта 2024 года. Архивировано из оригинала 3 апреля 2024 года . Проверено 20 марта 2024 г.
  37. ^ @archiveis (16 июля 2018 г.). « Необходимо сделать» здесь не так однозначно. Отсутствие EDNS и массовое несоответствие (не только на уровне AS/страны, но даже на уровне континента) того, откуда поступают DNS и связанные с ним HTTP-запросы, вызывают так много проблем, поэтому я рассматриваю EDNS. -меньше запросов от Cloudflare как недействительных» ( твит ). Архивировано из оригинала 2 августа 2023 года — через Twitter .
  38. ^ «Комментарий Мэтью Принса к Hacker News» . Хакерские новости . 4 мая 2019 года. Архивировано из оригинала 13 мая 2022 года . Проверено 4 октября 2021 г.

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 27860f791006e0314b03ece04072ba8b__1716349140
URL1:https://arc.ask3.ru/arc/aa/27/8b/27860f791006e0314b03ece04072ba8b.html
Заголовок, (Title) документа по адресу, URL1:
archive.today - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)