Вейбэк-машина
Тип сайта | Архив |
---|---|
Основан |
|
Обслуживаемая территория | По всему миру ( кроме Китая , России и Бахрейна ) |
Владелец | Интернет-архив |
URL-адрес | сеть |
Коммерческий | Нет |
Регистрация | Необязательный |
Текущий статус | Активный |
Написано в | HTML , CSS , JavaScript , Java , Python |
Wayback Machine — цифровой архив Всемирной паутины, основанный Internet Archive , американской некоммерческой организацией, базирующейся в Сан-Франциско, Калифорния . Созданный в 1996 году и представленный публике в 2001 году, он позволяет пользователю вернуться «в прошлое», чтобы увидеть, как веб-сайты выглядели в прошлом. Ее основатели Брюстер Кале и Брюс Гиллиат разработали Wayback Machine, чтобы обеспечить «универсальный доступ ко всем знаниям» путем сохранения архивных копий несуществующих веб-страниц. [1]
Запущенная 10 мая 1996 года система Wayback Machine по состоянию на конец 2009 года сохранила более 38,2 миллиарда веб-страниц. По состоянию на 3 января 2024 года Wayback Machine заархивировала более 860 миллиардов веб-страниц и более 99 петабайт данных. [2] [3]
История [ править ]
Wayback Machine начала архивировать кэшированные веб-страницы в 1996 году. Одна из самых ранних известных страниц была заархивирована 10 мая 1996 года по адресу ( УНИВЕРСАЛЬНОЕ ГЛОБАЛЬНОЕ ВРЕМЯ ). [4]
Internet Archive Основатели Брюстер Кале и Брюс Гиллиат запустили Wayback Machine в Сан-Франциско , Калифорния . [5] в октябре 2001 года, [6] [7] в первую очередь для решения проблемы исчезновения веб-контента при его изменении или закрытии веб-сайта. [8] Служба позволяет пользователям просматривать архивные версии веб-страниц во времени, что в архиве называется «трехмерным индексом». [9] Кале и Гиллиат создали машину, надеясь заархивировать весь Интернет и обеспечить «универсальный доступ ко всем знаниям». [10] Название «Wayback Machine» является отсылкой к вымышленному устройству для путешествий во времени и перевода, « Wayback Machine », используемому персонажами Мистером Пибоди и Шерманом в мультфильме « Приключения Рокки, Буллвинкля и друзей» . [11] [12] В одном из фрагментов мультфильма, «Невероятная история Пибоди», персонажи использовали машину, чтобы стать свидетелями, участвовать и часто изменять известные исторические события.
С 1996 по 2001 год информация хранилась на цифровой ленте, и Кале время от времени позволял исследователям и учёным подключиться к «неуклюжей» базе данных . [13] Когда в 2001 году архиву исполнилось пять лет, он был представлен и открыт для публики на церемонии в Калифорнийском университете в Беркли . [14] К моменту запуска Wayback Machine она уже содержала более 10 миллиардов заархивированных страниц. [15] Данные хранятся в большом кластере узлов Linux Интернет-архива . [10] Время от времени он пересматривает и архивирует новые версии веб-сайтов (см. технические подробности ниже). [16] Сайты также можно захватить вручную, введя URL-адрес веб-сайта в поле поиска, при условии, что веб-сайт позволяет Wayback Machine « сканировать » его и сохранять данные. [17]
30 октября 2020 года Wayback Machine начала проверку контента. [18] По состоянию на январь 2022 года захват доменов рекламных серверов отключен. [19]
В мае 2021 года, к 25-летию Интернет-архива, Wayback Machine представила «Wayforward Machine», которая позволяет пользователям «путешествовать в Интернет в 2046 году, где знания находятся под угрозой ». [20] [21]
Техническая информация [ править ]
Программное обеспечение Wayback Machine было разработано для « сканирования » Интернета и загрузки всей общедоступной информации и файлов данных на веб-страницах, в иерархии Gopher , в системе досок объявлений Netnews (Usenet) и загружаемом программном обеспечении. [22] Информация, собираемая этими «сканерами», не включает всю информацию, доступную в Интернете, поскольку большая часть данных ограничена издателем или хранится в недоступных базах данных. Чтобы преодолеть несоответствия на частично кэшированных веб-сайтах, Archive-It.org был разработан в 2005 году Интернет-архивом как средство, позволяющее учреждениям и создателям контента добровольно собирать и сохранять коллекции цифрового контента, а также создавать цифровые архивы. [23]
Сканирование осуществляется из различных источников: некоторые импортируются от третьих сторон, а другие создаются внутри Архива. [16] Например, сканирование осуществляется Sloan Foundation и Alexa , сканирование осуществляется Internet Archive от имени NARA и Internet Memory Foundation , зеркалами Common Crawl . [16] «Сканирование всемирной паутины» проводится с 2010 года и охватывает глобальную сеть. [16] [24]
Документы и ресурсы хранятся с URL-адресами с отметками времени, такими как 20240606235642
. Отдельные ресурсы страниц, такие как изображения, таблицы стилей и сценарии, а также исходящие гиперссылки, связаны с отметкой времени просматриваемой в данный момент страницы, поэтому они автоматически перенаправляются на отдельные фрагменты, наиболее близкие по времени. [25]
Частота создания снимков варьируется в зависимости от веб-сайта. [16] Веб-сайты, включенные в список «Сканирование во всемирной сети», включаются в «список сканирования», при этом сайт архивируется один раз за каждое сканирование. [16] Сканирование может занять месяцы или даже годы, в зависимости от размера. [16] Например, «Широкий обход номер 13» начался 9 января 2015 г. и завершился 11 июля 2016 г. [26] Однако одновременно может выполняться несколько обходов, и сайт может быть включен в несколько списков сканирования, поэтому частота сканирования сайта сильно различается. [16]
Начиная с октября 2019 года пользователи ограничены 15 архивными запросами и извлечениями в минуту. [27] [ почему? ]
Емкость хранилища и рост [ править ]
По мере развития технологий с течением времени емкость памяти Wayback Machine увеличивалась. В 2003 году, всего через два года публичного доступа, Wayback Machine росла со скоростью 12 терабайт в месяц. Данные хранятся в стеллажных системах PetaBox, специально разработанных сотрудниками Интернет-архива. Первая стойка емкостью 100 ТБ была полностью введена в эксплуатацию в июне 2004 года, хотя вскоре стало ясно, что потребуется гораздо больше места для хранения данных. [28] [29]
В 2009 году компания Internet Archive перенесла свою специализированную архитектуру хранения данных на Sun Open Storage и разместила новый центр обработки данных в модульном центре обработки данных Sun в Sun Microsystems в Калифорнии. кампусе [30] По состоянию на 2009 год [update], Wayback Machine содержала около трех петабайт данных и росла со скоростью 100 терабайт каждый месяц. [31]
Новая улучшенная версия Wayback Machine с обновленным интерфейсом и более свежим индексом архивного контента была доступна для публичного тестирования в 2011 году, где снимки отображаются в макете календаря с кругами, ширина которых отображает количество обходов каждый день. но нет маркировки дубликатов звездочками или страницы расширенного поиска. [32] [33] верхняя панель инструментов Была добавлена для облегчения навигации между снимками. Гистограмма визуализирует частоту захватов данных в месяц на протяжении многих лет. [34] Впоследствии были добавлены такие функции, как «Изменения», «Сводка» и графическая карта сайта.
В марте того же года на форуме Wayback Machine было сказано, что «бета-версия новой Wayback Machine имеет более полный и актуальный индекс всех просканированных материалов на 2010 год и будет продолжать регулярно обновляться. Индекс «Вождение классической машины Wayback Machine» содержит лишь немного материалов после 2008 года, и никаких дальнейших обновлений индекса не планируется, поскольку в этом году его выпуск будет прекращен». [35] Также в 2011 году Интернет-архив установил шестую пару стоек PetaBox, что увеличило емкость хранилища Wayback Machine на 700 терабайт. [36]
В январе 2013 года компания объявила о достижении 240 миллиардов URL-адресов. [37]
В октябре 2013 года компания представила функцию «Сохранить страницу». [38] [39] которая позволяет любому пользователю Интернета архивировать содержимое URL-адреса и быстро создает постоянную ссылку в отличие от предыдущей функции liveweb .
В декабре 2014 года Wayback Machine содержала 435 миллиардов веб-страниц — почти девять петабайт данных, и объем данных рос примерно на 20 терабайт в неделю. [15] [40] [41]
Сообщалось, что в июле 2016 года Wayback Machine содержала около 15 петабайт данных. [42]
В сентябре 2018 года Wayback Machine содержала более 25 петабайт данных. [43] [44]
По состоянию на декабрь 2020 года Wayback Machine содержала более 70 петабайт данных. [45]
Интернет-архив по состоянию на январь 2024 года свидетельствует, что на данный момент в нем хранится более 99 петабайт данных. [46] [47]
Wayback Machine по годам | Страницы в архиве |
---|---|
2004 | 30 000 000 000 (0–100B: светло-синий) |
2005 | 40,000,000,000 |
2008 | 85,000,000,000 |
2012 | 150 000 000 000 (100B-450B: Желтый) |
2013 | 373,000,000,000 |
2014 | 400,000,000,000 |
2015 | 452 000 000 000 (450B-600B: оранжевый) |
2016 | 459,000,000,000 |
2017 | 279,000,000,000 |
2018 | 310,000,000,000 |
2019 | 345,000,000,000 |
2020 | 405,000,000,000 |
2021 | 514,000,000,000 |
2022 | 640 000 000 000 (600B-: Красный) |
API Wayback Machine [ править ]
Служба Wayback Machine предлагает три общедоступных API: SavePageNow, Availability и CDX. [50] SavePageNow можно использовать для архивирования веб-страниц. API доступности для проверки статуса доступности архива веб-страницы, [51] проверка наличия или отсутствия архива веб-страницы. CDX API предназначен для сложных запросов, фильтрации и анализа захваченных данных. [52] [53]
Политика исключения веб-сайтов [ править ]
Исторически Wayback Machine соблюдала стандарт исключения роботов (robots.txt) при определении того, будет ли веб-сайт сканироваться – или, если он уже просканирован, будут ли его архивы доступны для публичного просмотра. Владельцы веб-сайтов имели возможность отказаться от Wayback Machine, используя файл robots.txt. Он применил правила robots.txt задним числом; если сайт блокировал Интернет-архив, все ранее заархивированные страницы домена также немедленно становились недоступными. Кроме того, Интернет-архив заявил, что «иногда владелец веб-сайта обращается к нам напрямую и просит прекратить сканирование или архивирование сайта. Мы выполняем эти запросы». [54] Кроме того, на сайте говорится: «Интернет-архив не заинтересован в сохранении или предоставлении доступа к веб-сайтам или другим интернет-документам лицам, которые не хотят, чтобы их материалы были в коллекции». [55] [56]
17 апреля 2017 года появились сообщения о сайтах, которые прекратили свое существование и превратились в припаркованные домены , которые использовали robots.txt для исключения себя из поисковых систем, в результате чего они были непреднамеренно исключены из Wayback Machine. [57] Интернет-архив изменил политику и теперь требует явного запроса на исключение для удаления из Wayback Machine. [25]
Окленда архивирования Политика
Политика ретроактивного исключения Wayback частично основана на Рекомендациях по управлению запросами на удаление и сохранению целостности архивов, опубликованных Школой управления информацией и системами Калифорнийского университета в Беркли в 2002 году, которые дают владельцу веб-сайта право заблокировать доступ к архивам сайта. . [58] Wayback соблюдает эту политику, чтобы избежать дорогостоящих судебных разбирательств. [59]
Политика ретроактивного исключения Wayback начала ослабляться в 2017 году, когда на веб-сайтах правительства и военных США перестали поощрять роботов как за сканирование, так и за отображение веб-страниц. По состоянию на апрель 2017 года Wayback игнорирует robots.txt в более широком смысле, а не только на веб-сайтах правительства США. [60] [61] [62] [63]
Использует [ править ]
С момента своего публичного запуска в 2001 году Wayback Machine изучалась учеными как на предмет способов хранения и сбора данных, так и на предмет самих страниц, содержащихся в ее архиве. По состоянию на 2013 год ученые написали около 350 статей о Wayback Machine, в основном из области информационных технологий, библиотечного дела и социальных наук. Ученые-социологи использовали Wayback Machine, чтобы проанализировать, как развитие веб-сайтов с середины 1990-х годов по настоящее время повлияло на рост компании. [15]
Когда Wayback Machine архивирует страницу, она обычно включает в себя большую часть гиперссылок, сохраняя эти ссылки активными, хотя они с такой же легкостью могли быть повреждены из-за нестабильности Интернета. Исследователи из Индии изучили эффективность способности Wayback Machine сохранять гиперссылки в научных онлайн-публикациях и обнаружили, что она сохраняет чуть более половины из них. [64]
«Журналисты используют Wayback Machine для просмотра мертвых веб-сайтов, устаревших новостных репортажей и изменений в содержимом веб-сайтов. Его контент использовался для привлечения политиков к ответственности и разоблачения лжи на поле боя». [65] В 2014 году на архивной странице в социальной сети Игоря Гиркина , лидера сепаратистских повстанцев на Украине, было показано, как он хвастался тем, что его войска сбили предполагаемый украинский военный самолет, прежде чем стало известно, что это на самом деле гражданский самолет Malaysian Airlines ( Malaysia Airlines). Рейс 17 ), после чего удалил пост и обвинил в сбитии самолета украинских военных. [65] [66] В 2017 году « Марш науки» возник в результате дискуссии на Reddit , в которой говорилось, что кто-то посетил Archive.org и обнаружил, что все упоминания об изменении климата были удалены с веб-сайта Белого дома. В ответ пользователь прокомментировал: «На Вашингтон нужен марш ученых». [67] [68] [69]
Кроме того, сайт активно используется для проверки, предоставляя доступ к ссылкам и контенту, созданному редакторами Википедии . [70] Когда в Википедию добавляются новые URL-адреса, Интернет-архив архивирует их. [70]
В сентябре 2020 года было объявлено о партнерстве с Cloudflare для автоматического архивирования веб-сайтов, обслуживаемых через его службу «Всегда онлайн», что также позволит ему направлять пользователей на свою копию сайта, если он не может связаться с исходным хостом. [71]
Ограничения [ править ]
В 2014 году между сканированием веб-сайта и моментом его доступности для просмотра в Wayback Machine прошло шесть месяцев. [72] В настоящее время время задержки составляет от 3 до 10 часов. [25] Wayback Machine предлагает лишь ограниченные возможности поиска. Его функция «Поиск по сайту» позволяет пользователям находить сайт по словам, описывающим сайт, а не по словам, найденным на самих веб-страницах. [73]
Wayback Machine не включает в себя все когда-либо созданные веб-страницы из-за ограничений его веб-сканера. Wayback Machine не может полностью архивировать веб-страницы, содержащие интерактивные функции, такие как платформы Flash и формы, написанные на JavaScript, а также прогрессивные веб-приложения , поскольку эти функции требуют взаимодействия с хост-сайтом. Это означает, что примерно с 9 июля 2013 года Wayback Machine не может отображать комментарии YouTube при сохранении страниц просмотра видео, поскольку, по словам команды архивирования, комментарии больше не «загружаются внутри самой страницы». [74] Веб-сканер Wayback Machine испытывает трудности с извлечением чего-либо, что не закодировано в HTML или одном из его вариантов, что часто может приводить к неработающим гиперссылкам и отсутствию изображений. Из-за этого веб-сканер не может архивировать «бесхозные страницы», на которые не ссылаются другие страницы. [73] [75] Сканер Wayback Machine следует только по заранее определенному количеству гиперссылок на основе заданного ограничения глубины, поэтому он не может архивировать каждую гиперссылку на каждой странице. [24]
В качестве юридического доказательства [ править ]
Гражданский процесс [ править ]
Netbula LLC v. Chordiant Software Inc. [ edit ]
В деле 2009 года Netbula, LLC против Chordiant Software Inc. ответчик Chordiant подал ходатайство о том, чтобы заставить Netbula отключить файл robots.txt на своем веб-сайте, из-за которого Wayback Machine задним числом закрывала доступ к предыдущим версиям страниц, которые у нее были. заархивировано с сайта Netbula, страницы, которые, по мнению Chordiant, подтверждают ее версию. [76]
Netbula возражала против ходатайства на том основании, что ответчики просили изменить веб-сайт Netbula и что им следовало напрямую вызвать в суд Internet Archive для получения страниц. [77] Сотрудник Интернет-архива подал заявление под присягой в поддержку ходатайства Chordiant, однако заявив, что компания не может создавать веб-страницы каким-либо другим способом «без значительного бремени, затрат и нарушения своей деятельности». [76]
Мировой судья Говард Ллойд в Северном округе Калифорнии, округ Сан-Хосе, отклонил доводы Netbula и приказал им временно отключить блокировку robots.txt, чтобы позволить Chordiant получить заархивированные страницы, которые они искали. [76]
Telewizja Polska USA, Inc. v. Echostar Satellite [ edit ]
В деле, рассмотренном в октябре 2004 года, Telewizja Polska USA, Inc. против Echostar Satellite , № 02 C 3293, 65 Fed. Р. Эвид. Серв. 673 (ND III, 15 октября 2004 г.), истец попытался использовать архивы Wayback Machine в качестве источника допустимых доказательств, возможно, впервые. Telewizja Polska является провайдером TVP Polonia , а EchoStar управляет сетью Dish Network . Перед судебным разбирательством EchoStar заявила, что намерена предложить снимки Wayback Machine в качестве доказательства прошлого контента веб-сайта Telewizja Polska. ходатайство Telewizja Polska подала о закрытии снимков на основании слухов и непроверенного источника, но мировой судья Арландер Киз отклонил утверждение Telewizja Polska о слухах и отклонил ходатайство TVP об исключении доказательств в суде. [78] [79] Однако на суде судья окружного суда Рональд Гузман, судья первой инстанции, отменил выводы магистрата Киса и постановил, что ни письменные показания сотрудника Интернет-архива, ни соответствующие страницы (т. е. веб-сайт Telewizja Polska) не могут быть приняты в качестве доказательства. Судья Гузман пришел к выводу, что письменные показания сотрудника содержали как слухи, так и неубедительные подтверждающие заявления, а распечатки предполагаемой веб-страницы не были самодостоверными. [80] [81]
Патентное право [ править ]
Ведомство США по патентам и товарным знакам и Европейское патентное ведомство будут принимать отметки с датами из Интернет-архива в качестве доказательства того, когда данная веб-страница была доступна публике. Эти даты используются для определения того, доступна ли веб-страница в качестве предшествующего уровня техники , например, при рассмотрении заявки на патент. [82]
Ограничения утилиты [ править ]
Существуют технические ограничения на архивирование веб-сайта, и, как следствие, противоборствующие стороны в судебном процессе могут неправомерно использовать результаты, полученные из архивов веб-сайта. Эта проблема может усугубляться практикой предоставления снимков экрана веб-страниц в жалобах, ответах или отчетах свидетелей-экспертов, когда основные ссылки не раскрываются и, следовательно, могут содержать ошибки. Например, такие архивы, как Wayback Machine, не заполняют формы и, следовательно, не включают в свои архивы содержимое отличных от RESTful . баз данных электронной коммерции, [83]
Юридический статус [ править ]
В Европе Wayback Machine может быть истолкована как нарушение закона об авторском праве . Только создатель контента может решать, где публиковать или дублировать его контент, поэтому Архиву придется удалять страницы из своей системы по запросу создателя. [84] Политику исключения для Wayback Machine можно найти в разделе часто задаваемых вопросов на сайте. [85]
Некоторые дела были возбуждены против Интернет-архива специально за его усилия по архивированию Wayback Machine.
Юридические вопросы, связанные с архивным контентом [ править ]
Саентология [ править ]
различные сайты, критиковавшие саентологию . В конце 2002 года Интернет-архив удалил из Wayback Machine [86] В сообщении об ошибке говорилось, что это было ответом на «запрос владельца сайта». [87] Позже выяснилось, что юристы Церкви Саентологии , а владельцы сайта не хотели, чтобы их материалы были удалены. удаления потребовали [88]
Healthcare Advocates, Inc. [ править ]
В 2003 году компания Harding Earley Follmer & Frailey защитила клиента в споре о товарном знаке, используя Archive's Wayback Machine. Адвокаты смогли продемонстрировать, что требования истца недействительны, основываясь на содержании их веб-сайта, опубликованном несколькими годами ранее. Истец, Healthcare Advocates, затем внес поправки в свою жалобу, включив в нее Интернет-архив, обвинив организацию в нарушении авторских прав, а также в нарушениях DMCA и Закона о компьютерном мошенничестве и злоупотреблениях . Адвокаты здравоохранения заявили, что, поскольку они установили файл robots.txt на свой веб-сайт, даже если после подачи первоначального иска Архив должен был удалить все предыдущие копии веб-сайта истца с Wayback Machine, однако некоторые материалы продолжали удаляться. быть общедоступным на Wayback. [89] Иск был урегулирован во внесудебном порядке после того, как Wayback устранила проблему. [90]
Сюзанна Шелл [ править ]
Активистка Сюзанна Шелл подала иск в декабре 2005 года, требуя, чтобы Интернет-архив заплатил ей 100 000 долларов США за архивирование ее сайта profane-justice.org в период с 1999 по 2004 год. [91] [92] 20 января 2006 г. компания Internet Archive подала иск о декларативном решении в Окружной суд США Северного округа Калифорнии , добиваясь судебного определения того, что Internet Archive не нарушил авторские права Shell . Shell отреагировала и подала встречный иск против Internet Archive за архивирование ее сайта, что, по ее утверждению, нарушает ее условия обслуживания . [93] 13 февраля 2007 года судья Окружного суда США по округу Колорадо отклонил все встречные иски, за исключением нарушения контракта . [92] Интернет-архив не стал отклонять иски о нарушении авторских прав , которые, по утверждению Shell, возникли в результате ее деятельности по копированию, которая также будет продолжена. [94]
25 апреля 2007 г. Internet Archive и Сюзанна Шелл совместно объявили об урегулировании своего иска. [91] В Интернет-архиве заявили, что «...не заинтересованы во включении в Wayback Machine материалов лиц, которые не желают архивировать свой веб-контент. Мы признаем, что г-жа Шелл имеет действительные и подлежащие исполнению авторские права на ее веб-сайт, и мы сожалею, что включение ее веб-сайта в Wayback Machine привело к этому судебному разбирательству». Shell заявила: «Я уважаю историческую ценность цели Internet Archive. Я никогда не намеревалась мешать достижению этой цели или причинять ей какой-либо вред». [95]
Даниил Давыдюк [ править ]
В период с 2013 по 2016 год порноактер по имени Даниэль Давыдюк пытался удалить свои архивные изображения из архива Wayback Machine, сначала отправив в архив несколько запросов DMCA , а затем обратившись в Федеральный суд Канады . [96] [97] [98] В 2017 году изображения были окончательно удалены с сайта.
FlexiSpy [ править ]
архивы сайта сталкерского приложения В 2018 году с Wayback Machine были удалены FlexiSpy. Компания заявила, что связалась с Интернет-архивом, предположительно для того, чтобы удалить архивы ее сайта. [99]
Цензура и другие угрозы [ править ]
Archive.org заблокирован в Китае . [100] [101] [102] Интернет-архив был полностью заблокирован в России в 2015–2016 годах якобы за размещение пропагандистского видео о джихаде. [65] [103] [104] С 2016 года сайт вернулся и доступен в полном объеме, хотя в 2016 году российские коммерческие лоббисты подали в суд на Интернет-архив с требованием запретить его на основании авторских прав. [105]
В марте 2015 года было опубликовано, что исследователям безопасности стало известно об угрозе, которую представляет непреднамеренный хостинг службы вредоносных двоичных файлов с архивных сайтов. [106] [107]
Элисон Макрина , директор проекта «Свобода библиотеки» , отмечает, что «хотя библиотекари глубоко ценят личную конфиденциальность, мы также решительно выступаем против цензуры». [65]
Известен как минимум один случай, когда статья была удалена из архива вскоре после того, как она была удалена с исходного веб-сайта. Репортер Daily Beast в 2016 году написал статью, в которой разоблачил нескольких спортсменов-геев-олимпийцев после того, как он создал фейковый профиль, выдавая себя за гея в приложении для знакомств. Daily Beast удалила статью после того, как она вызвала всеобщий фурор; Вскоре после этого Интернет-архив вскоре сделал то же самое, но решительно заявил, что они сделали это ни по какой другой причине, кроме как для защиты безопасности разоблаченных спортсменов. [65]
Другие угрозы включают стихийные бедствия, [108] уничтожение (дистанционное или физическое), [109] манипулирование содержимым архива (см. также: кибератака , резервное копирование ), проблемные законы об авторском праве. [110] и наблюдение за пользователями сайта. [111]
Александр Роуз, исполнительный директор фонда Long Now Foundation , подозревает, что в долгосрочной перспективе несколько поколений «почти ничего» выживут с пользой, заявив: «Если у нас есть преемственность в нашей технологической цивилизации, я подозреваю, что многие голые данные останутся доступными для поиска и поиска. Но я подозреваю, что почти ничего из формата, в котором они были доставлены, не будет распознаваемым», потому что сайты «с глубокими серверными системами управления контентом, такими как Drupal, Ruby и Django», труднее архивировать. [112]
В 2016 году в статье, посвященной сохранению человеческих знаний, The Atlantic отметила, что Интернет-архив, который описывает себя как созданный на долгосрочную перспективу, [113] «Яростно работает над сбором данных, прежде чем они исчезнут без какой-либо долгосрочной инфраструктуры». [114]
См. также [ править ]
Ссылки [ править ]
- ^ Кале, Брюстер (23 ноября 2005 г.). «Универсальный доступ ко всем знаниям» . Интернет-архив . Архивировано из оригинала 14 августа 2022 года . Проверено 5 июня 2022 г.
- ^ «Интернет-архив: Wayback Machine» . веб.архив.орг . Архивировано из оригинала 13 марта 2023 года. архива Текущее количество заархивированных страниц можно увидеть на главной странице .
- ^ Кале, Брюстер. «Сообщение основателя Интернет-архива Брюстера Кале» . Интернет-архив . Проверено 10 января 2024 г.
- ^ PepsiCo , Inc. (10 мая 1996 г.). «Главная страница PepsiCo» . Интернет-архив / Wayback Machine . Архивировано из оригинала 10 мая 1996 года . Проверено 8 октября 2022 г.
- ^ «Общая информация о машине Wayback» . Интернет-архив . Архивировано из оригинала 5 декабря 2019 года . Проверено 2 марта 2021 г.
- ^ «WayBackMachine.org WHOIS, DNS и информация о домене – DomainTools» . КТОИС . Архивировано из оригинала 14 мая 2020 года . Проверено 13 марта 2016 г.
- ^ «InternetArchive.org WHOIS, DNS и информация о домене – DomainTools» . КТОИС . Архивировано из оригинала 12 мая 2020 года . Проверено 13 марта 2016 г.
- ^ Нотс, Грег Р. (март – апрель 2002 г.). «Машина Wayback: Архив Интернета». Онлайн . 26 : 59–61. ИНИСТ 13517724 .
- ^ «The Wayback Machine» , Часто задаваемые вопросы , заархивировано из оригинала 18 сентября 2018 г. , получено 18 сентября 2018 г.
- ↑ Перейти обратно: Перейти обратно: а б «20 000 жестких дисков на задании» . Интернет-архив блогов . 25 октября 2016. Архивировано из оригинала 20 октября 2018 года . Проверено 15 октября 2018 г.
- ^ Грин, Хизер (28 февраля 2002 г.). «Библиотека, большая, как мир» . БизнесУик . Архивировано из оригинала 20 декабря 2011 года.
- ^ Тонг, Джуди (8 сентября 2002 г.). «Ответственная сторона - Брюстер Кале; Интернет-библиотека в Интернете» . Нью-Йорк Таймс . Архивировано из оригинала 20 февраля 2011 года . Проверено 15 августа 2011 г.
- ^ Кук, Джон (1 ноября 2001 г.). «Веб-сайт переносит вас в историю Интернета» . Сиэтлский пост-разведчик . Архивировано из оригинала 12 августа 2014 года . Проверено 15 августа 2011 г.
- ^ Мэйфилд, Кендра (28 октября 2001 г.). «Wayback возвращается в Интернет» . Проводной . Архивировано из оригинала 16 октября 2017 года . Проверено 16 октября 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б с Арора, Санджай К.; Ли, Инь; Юти, Ян; Шапира, Филип (5 мая 2015 г.). «Использование машины обратного пути для поиска веб-сайтов по общественным наукам: методологический ресурс» . Журнал Ассоциации информационных наук и технологий . 67 (8): 1904–1915. дои : 10.1002/asi.23503 . ISSN 2330-1635 .
- ↑ Перейти обратно: Перейти обратно: а б с д и ж г час Литару, Калев (28 января 2016 г.). «Интернет-архиву исполняется 20 лет: взгляд за кулисы архивирования Интернета» . Форбс . Архивировано из оригинала 16 октября 2017 года . Проверено 16 октября 2017 г.
- ^ «Интернет-архив: Wayback Machine» . Интернет-архив . Архивировано из оригинала 3 января 2014 года . Проверено 15 октября 2018 г.
- ^ Грэм, Марк (30 октября 2020 г.). «Проверка фактов и контекст для страниц Wayback Machine» . Интернет-архив блогов . Проверено 17 января 2021 г.
- ^ Попытки «сохранить страницу сейчас» в доменах, таких как tpc.googlesyndiction.com, s0.2mdn.net, atdmt.com или adbrite.com, приводят к выводу «Этот URL-адрес находится в нашем черном списке и не может быть захвачен».
- ^ «25 лет Интернет-архиву – универсальный доступ ко всем знаниям» . Проверено 13 января 2022 г.
- ^ «Машина Wayforward • Посетите будущее Интернета» . Машина пути вперед . Проверено 13 января 2022 г.
- ^ Кале, Брюстер. «Архивирование Интернета» . Scientific American – выпуск за март 1997 г. Архивировано из оригинала 3 апреля 2012 года . Проверено 19 августа 2011 г.
- ^ Каплан, Джефф (27 октября 2014 г.). «Archive-It: вместе ползаем по сети» . Интернет-архив блогов . Архивировано из оригинала 12 октября 2017 года . Проверено 16 октября 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б «Сканирование по всемирной паутине» . Интернет-архив. Архивировано из оригинала 19 октября 2017 года . Проверено 16 октября 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б с «Использование Wayback Machine» . Интернет-архив . Проверено 3 апреля 2022 г.
- ^ «Широкий обход номер 13» . Интернет-архив. Архивировано из оригинала 19 октября 2017 года . Проверено 16 октября 2017 г.
- ^ «Слишком много запросов» . Интернет-архив. 10 ноября 2019 г. . Проверено 27 ноября 2021 г.
- ^ «Петабокс» . Интернет-архив . Проверено 25 октября 2018 г.
- ^ Канеллос, Майкл (29 июля 2005 г.). «Большое хранилище по дешевке» . Новости CNET. Архивировано из оригинала 3 апреля 2007 года . Проверено 29 июля 2007 г.
- ^ «Интернет-архив и Sun Microsystems создают живую историю Интернета» . Сан Микросистемс . 25 марта 2009 года. Архивировано из оригинала 26 марта 2009 года . Проверено 27 марта 2009 г.
- ^ Мериан, Лукас (19 марта 2009 г.). «Интернет-архив представит огромный центр обработки данных Wayback Machine» . Компьютерный мир. Архивировано из оригинала 23 марта 2009 года . Проверено 22 марта 2009 г.
- ^ Годзёмо (24 января 2011 г.). «Обновленная Wayback Machine в стадии бета-тестирования» . Архивировано из оригинала 23 августа 2011 года . Проверено 19 августа 2011 г.
- ^ «Расширенный поиск» . Машина обратного пути . Архивировано из оригинала 31 января 2010 года . Проверено 3 апреля 2022 г.
- ^ «В чем разница между классической Wayback Machine и новой бета-версией?» . Архивировано из оригинала 25 декабря 2010 года . Проверено 17 ноября 2021 г.
- ^ «Бета-версия Wayback Machine, на форуме» . Архивировано из оригинала 17 апреля 2014 года . Проверено 16 апреля 2014 г.
- ^ «Форумы Интернет-архива: 6-я пара стоек введена в эксплуатацию: использовано более 2 ПБ пространства для данных» . Интернет-архив . Архивировано из оригинала 24 октября 2016 года . Проверено 25 октября 2018 г.
- ^ «Wayback Machine: теперь с 240 000 000 000 URL-адресов | Блоги Интернет-архива» . 9 января 2013. Архивировано из оригинала 14 апреля 2014 года . Проверено 16 апреля 2014 г.
- ^ Росси, Алексис (25 октября 2013 г.). «Исправление неработающих ссылок в Интернете» . Интернет-архив . Сан-Франциско, Калифорния, США: Группа по сбору коллекций, Интернет-архив. Архивировано из оригинала 7 ноября 2014 года . Проверено 25 марта 2015 г.
Мы добавили возможность мгновенно архивировать страницу и получать постоянный URL-адрес этой страницы в Wayback Machine. Этот сервис позволяет любому — редакторам Википедии, ученым, юристам, студентам или домашним поварам, таким как я, — создать стабильный URL-адрес, чтобы цитировать, делиться или добавлять в закладки любую информацию, к которой он хочет иметь доступ в будущем.
- ^ Барон Александр (23 октября 2013 г.). «Новая машина интернет-архива Wayback теперь онлайн» . Цифровой журнал . Архивировано из оригинала 19 ноября 2020 года . Проверено 19 ноября 2020 г.
- ^ «Интернет-архив: часто задаваемые вопросы» . Архивировано из оригинала 21 октября 2009 года . Проверено 17 января 2015 г.
- ^ «Интернет-архив: часто задаваемые вопросы» . 18 декабря 2014. Архивировано из оригинала 18 декабря 2014 года . Проверено 13 декабря 2018 г.
- ^ «Может ли манипулирование большими данными изменить мировое мышление?» . Национальный . Архивировано из оригинала 12 января 2017 года . Проверено 14 мая 2017 г.
- ^ Крокетт, Закари (28 сентября 2018 г.). «Внутри Wayback Machine, капсулы времени Интернета» . Суета . Архивировано из оригинала 2 октября 2018 года . Проверено 26 октября 2018 г.
- ^ Хеффернан, Вирджиния (18 сентября 2018 г.). «В Интернете все ломается и приходит в упадок — это хорошо» . ПРОВОДНОЙ . Архивировано из оригинала 25 сентября 2018 года . Проверено 26 октября 2018 г.
- ^ «Пожертвуйте Интернет-архиву: цифровую библиотеку бесплатных и доступных напрокат книг, фильмов, музыки и Wayback Machine» . адафрут. Архивировано из оригинала 2 декабря 2020 года . Проверено 2 декабря 2020 г.
- ^ «Интернет-архив: Wayback Machine» . веб.архив.орг . Архивировано из оригинала 13 марта 2023 года. архива Текущее количество заархивированных страниц можно увидеть на главной странице .
- ^ Кале, Брюстер. «Сообщение основателя Интернет-архива Брюстера Кале» . Интернет-архив . Проверено 10 января 2024 г.
- ^ Мишель (9 мая 2014 г.). «Wayback Machine набрала 400 000 000 000!» . Интернет-архив. Архивировано из оригинала 26 августа 2014 года . Проверено 25 марта 2015 г.
- ^ «Интернет-архив» . Интернет-архив. Архивировано из оригинала 31 декабря 2020 года . Проверено 8 марта 2021 г.
- ^ «API-интерфейсы Wayback Machine | Интернет-архив» . Интернет-архив .
- ^ waybackpy на GitHub
- ^ «Разработчики» . Интернет-архив блогов . 22 августа 2014 г. Архивировано из оригинала 12 февраля 2024 г.
- ^ Гонсалес, Джон (13 декабря 2018 г.). «Документация по общедоступным API в Интернет-архиве» . Интернет-архив блогов . Архивировано из оригинала 13 января 2024 года.
- ^ «Часто задаваемые вопросы. Некоторые сайты недоступны из-за файла Robots.txt или других исключений. Что это значит?» . Интернет-архив Wayback Machine . Архивировано из оригинала 15 апреля 2011 года.
- ^ «Часто задаваемые вопросы» . Интернет-архив . Архивировано из оригинала 17 апреля 2014 года.
- ^ Кокс, Джозеф (22 мая 2018 г.). «The Wayback Machine удаляет доказательства продажи вредоносного ПО сталкерам» . Порок . Архивировано из оригинала 22 мая 2018 года . Проверено 23 мая 2018 г.
- ^ «Robots.txt, предназначенный для поисковых систем, не подходит для веб-архивов» . Интернет-архив . 17 апреля 2017 года . Проверено 29 июня 2019 г.
- ^ «Рекомендации по управлению запросами на удаление и сохранению целостности архива» . Калифорнийский университет . 14 декабря 2002 года. Архивировано из оригинала 18 сентября 2017 года . Проверено 14 сентября 2017 г.
- ^ «Ретроактивное удаление файла robots.txt из прошлых сканирований, также известное как Политика архивирования Окленда» . Интернет-архив. 7 июля 2014. Архивировано из оригинала 10 октября 2017 года . Проверено 14 сентября 2017 г.
- ^ Грэм, Марк (17 апреля 2017 г.). «Robots.txt, предназначенный для поисковых систем, не подходит для веб-архивов» . Интернет-архив блогов . Архивировано из оригинала 17 апреля 2017 года . Проверено 16 апреля 2017 г.
- ^ «Архивирование Интернета: Интернет-архив в будущем будет игнорировать файл robots.txt» (на немецком языке). Хейз онлайн. 25 апреля 2017 года. Архивировано из оригинала 27 апреля 2017 года . Проверено 14 мая 2017 г.
- ^ «Поисковые системы: Интернет-архив хочет в будущем игнорировать записи Robots.txt – Golem.de» (на немецком языке). Архивировано из оригинала 19 июня 2017 года . Проверено 14 мая 2017 г.
- ^ «Интернет-архив будет игнорировать файлы robots.txt, чтобы сохранить точность исторических данных» . Цифровые тенденции . 24 апреля 2017. Архивировано из оригинала 16 мая 2017 года . Проверено 14 мая 2017 г.
- ^ Сампат Кумар, Британская Колумбия; Притхвирадж, КР (21 октября 2014 г.). «Оживление мертвых: роль Wayback Machine в поиске исчезнувших URL-адресов». Журнал информатики . 41 (1): 71–81. дои : 10.1177/0165551514552752 . ISSN 0165-5515 . S2CID 28320982 .
- ↑ Перейти обратно: Перейти обратно: а б с д и Нельсон, Стивен (17 августа 2016 г.). «Wayback Machine не будет подвергать архив цензуре ради вкуса, - заявил директор после удаления статьи об Олимпийских играх» . Новости США и мировой отчет . Архивировано из оригинала 6 января 2017 года . Проверено 14 мая 2017 г.
- ^ Лепор, Джилл (26 января 2015 г.). «Что Интернет сказал вчера» . Житель Нью-Йорка . Архивировано из оригинала 25 января 2015 года . Проверено 14 мая 2017 г.
- ^ Гуарино, Бен (21 апреля 2017 г.). «Марш науки начался с «одноразовой строчки» этого человека на Reddit» . Вашингтон Пост . Архивировано из оригинала 23 апреля 2017 года . Проверено 23 апреля 2017 г.
- ^ Каплан, Сара (25 января 2017 г.). «Собираются ли ученые идти маршем на Вашингтон?» . Вашингтон Пост . Архивировано из оригинала 31 января 2017 года . Проверено 31 января 2017 г.
- ^ Фоли, Кэтрин Эллен (22 апреля 2017 г.). «Глобальный Марш науки начался с одной темы на Reddit» . Кварц . Архивировано из оригинала 24 апреля 2017 года . Проверено 23 апреля 2017 г.
- ↑ Перейти обратно: Перейти обратно: а б Грэм, Марк (1 октября 2018 г.). «Более 9 миллионов неработающих ссылок в Википедии теперь спасены» . Интернет-архив блогов . Архивировано из оригинала 8 апреля 2023 года.
- ^ Грэм, Марк (17 сентября 2020 г.). «Cloudflare и Wayback Machine объединяют усилия для более надежной сети» . Интернет-архив блогов . Проверено 17 сентября 2020 г.
- ^ «Интернет-архив: часто задаваемые вопросы» . Интернет-архив . 2 апреля 2014 года. Архивировано из оригинала 2 апреля 2014 года . Проверено 23 ноября 2018 г.
- ↑ Перейти обратно: Перейти обратно: а б Бейтс, Мэри Эллен (2002). «Машина обратного пути». Онлайн . 26:80 .
- ^ «Ютуб – Архивная команда» . archiveteam.org . Архивировано из оригинала 5 августа 2020 года . Проверено 6 августа 2020 г.
- ^ «Интернет-архив: часто задаваемые вопросы» . Интернет-архив . Архивировано из оригинала 20 апреля 2013 года . Проверено 18 октября 2018 г.
- ↑ Перейти обратно: Перейти обратно: а б с Ллойд, Ховард (октябрь 2009 г.). «Приказ об отключении файла Robots.txt» (PDF) . Архивировано из оригинала (PDF) 8 августа 2019 года . Проверено 15 октября 2009 г.
- ^ Кортес, Антонио (октябрь 2009 г.). «Предложение против удаления Robots.txt» . Архивировано из оригинала 27 октября 2010 года . Проверено 15 октября 2009 г.
- ^ Гельман, Лорен (17 ноября 2004 г.). «Снимки веб-страниц Интернет-архива считаются допустимыми в качестве доказательства» . Пакеты . 2 (3). Архивировано из оригинала 30 апреля 2011 года . Проверено 4 января 2007 г.
- ^ Хауэлл, Берил А. (февраль 2006 г.). «Доказательство истории веб-поиска: как использовать Интернет-архив» (PDF) . Журнал интернет-права : 3–9. Архивировано из оригинала (PDF) 5 июля 2010 г. Проверено 6 августа 2008 г.
- ^ «Поиск доказательств в виртуальных местах. Допустимость доказательств в Интернете» . Архивировано из оригинала 1 июля 2019 года . Проверено 14 июня 2020 г.
- ^ Левитт, Кэрол А.; Рош, Марк Э. (2010). Найдите информацию как профессионал: анализ общедоступных ресурсов Интернета для проведения расследовательских исследований, Том 1 . Американская ассоциация адвокатов. стр. 194–196. ISBN 978-1-60442-890-2 . Архивировано из оригинала 18 декабря 2020 года . Проверено 14 июня 2020 г.
- ^ Коггинс, Винн В. (осень 2002 г.). «Известный уровень техники в области патентов на бизнес-методы – когда электронный документ является печатной публикацией для целей предшествующего уровня техники?» . ВПТЗ США . Архивировано из оригинала 21 сентября 2012 года . Проверено 15 августа 2012 г.
- ^ «Разоблачение машины Wayback» . Архивировано из оригинала 29 июня 2010 года.
- ^ Бахр, Мартин (2002). «The Wayback Machine и Google Cache – нарушение немецкого закона об авторском праве?» . JurPC (на немецком языке): 9. doi : 10.7328/jurpcb/20021719 . Архивировано из оригинала 23 августа 2009 года.
- ^ «Часто задаваемые вопросы об Интернет-архиве» . Архивировано из оригинала 17 апреля 2014 года . Проверено 16 апреля 2014 г.
- ^ Боуман, Лиза М. (24 сентября 2002 г.). «Сетевой архив заставляет замолчать саентологического критика» . Новости CNET. Архивировано из оригинала 15 мая 2012 года . Проверено 4 января 2007 г.
- ^ Джефф (23 сентября 2002 г.). «исключения из Wayback Machine» (Блог) . Форум Wayback Machine . Интернет-архив. Архивировано из оригинала 11 февраля 2007 года . Проверено 4 января 2007 г. Автор и Дата указывают на начало ветки форума .
- ^ Миллер, Эрнест. «Шерман, установи машину обратного пути для саентологии» . ЗаконМем . Йельская юридическая школа. Архивировано из оригинала (Блог) 16 ноября 2012 года . Проверено 4 января 2007 г.
- ^ Дай, Джессика (2005). «Веб-сайту предъявлен иск за спорное путешествие в прошлое Интернета» . Электронное содержание . 28. 11 :8–9.
- ^ Бангеман, Эрик (31 августа 2006 г.). «Интернет-архив урегулировал иск по поводу Wayback Machine» . Арс Техника . Архивировано из оригинала 5 ноября 2007 года . Проверено 29 ноября 2007 г.
- ↑ Перейти обратно: Перейти обратно: а б Интернет-архив против Shell , 505 F.Supp.2d 755 на justia.com , 1:2006cv01726 ( Окружной суд Колорадо, 31 августа 2006 г.) («Объявлено об мировом соглашении 25 апреля 2007 г.». Подача 65, 30 апреля 2007 г.) : «...поэтому ПРИКАЗЫВАЛО, что это дело должно быть ОТКРЫТО С ПРЕДВАРИТЕЛЬНЫМ СУДЕБИЕМ...»»).
- ↑ Перейти обратно: Перейти обратно: а б Бэбкок, Льюис Т. (13 февраля 2007 г.). « Интернет-архив против Гражданского иска Shell № 06cv01726LTBCBS» (PDF) . Архивировано (PDF) из оригинала 25 января 2014 г. Проверено 25 марта 2015 г.
1) Ходатайство Internet Archive об отклонении встречного иска Shell о конверсии и гражданской краже (Вторая причина иска) ОТВЕРГАЕТСЯ, 2) Ходатайство Internet Archive об отклонении встречного иска Shell в связи с нарушением договора (Третья причина иска) ОТКАЗЫВАЕТСЯ; 3) Ходатайство Интернет-архива об отклонении встречного иска Shell о рэкете согласно RICO и COCCA (Четвертое основание иска) ПРИНЯТО.
- ^ Клэберн, Томас (16 марта 2007 г.). «Женщина из Колорадо подала в суд на принуждение веб-сканеров к заключению контрактов» . Нью-Йорк, Нью-Йорк, США: InformationWeek , UBM Tech, UBM LLC. Архивировано из оригинала 4 сентября 2014 года . Проверено 25 марта 2015 г.
Компьютеры могут заключать контракты от имени людей. В Едином законе об электронных транзакциях (UETA) говорится, что «договор может быть заключен путем взаимодействия электронных агентов сторон, даже если ни одно лицо не знало и не проверяло действия электронных агентов или вытекающие из них условия и соглашения».
- ^ Самсон, Мартин Х. (2007). «Интернет-архив против Сюзанны Шелл» . Интернет-библиотека по праву и судебным решениям. Архивировано из оригинала 3 августа 2014 года . Проверено 25 марта 2015 г.
Что еще более важно, по мнению суда, простое копирование Интернет-архивом сайта Shell и его отображение в своей базе данных не представляет собой необходимое осуществление владычества и контроля над собственностью ответчика. Важно отметить, что, как отметил суд, ответчик всегда владел и управлял собственным сайтом. Суд заявил: «Shell не представила факты, свидетельствующие о том, что Internet Archive осуществлял доминирование или контроль над ее веб-сайтом, поскольку в жалобе Shell прямо говорится, что она продолжала владеть и управлять веб-сайтом, пока он был заархивирован на машине Wayback. Shell не указывает ни одного авторитетного источника, поддерживающего идею о том, что копирование документов само по себе является достаточным лишением использования для поддержки конверсии. И наоборот, многочисленные округа пришли к выводу, что это не так».
- ^ Брюстер (25 апреля 2007 г.). «Интернет-архив и иск Сюзанны Шелл об урегулировании» . Интернет-архив . Денвер, Колорадо, США. Архивировано из оригинала 5 декабря 2010 года . Проверено 25 марта 2015 г.
Обе стороны искренне сожалеют о любых потрясениях, которые судебный процесс мог причинить друг другу. Ни Интернет-архив, ни г-жа Шелл не одобряют любое поведение, которое могло причинить вред любой из сторон в результате общественного внимания к этому иску. Стороны не занимались подобным поведением и просят, чтобы общественная реакция на мирное разрешение этого судебного процесса соответствовала их желанию, чтобы ни одна из сторон не причиняла дальнейшего вреда или беспорядков.
- ^ Стоббе, Ричард (5 декабря 2014 г.). «Последствия «права на забвение» для авторских прав? Или как уничтожить интернет-архив» . Мондак . Архивировано из оригинала 18 ноября 2018 года . Проверено 8 марта 2019 г.
- ^ Маквей, Гленнис (16 октября 2014 г.). Филпотт, Джеймс; Вайсман, Адам; Бухольц, Рен; Чайники, Брент; Перл, Аарон (ред.). «Давыдюк против Интернет-архива Канады, FC 944, 2014 г.» . МожетЛИИ . Федерация юридических обществ Канады . Архивировано из оригинала 18 декабря 2020 года . Проверено 8 марта 2019 г.
- ^ Сауткотт, Ричард Ф. (30 ноября 2016 г.). Филпотт, Джон; Альтон, Алекс; Бухольц, Рен (ред.). «Давыдюк против Интернет-архива Канады и Интернет-архива, 2016 FC 1313 (CanLII)» . МожетЛИИ . Оттава, Онтарио: Федерация юридических обществ Канады . Архивировано из оригинала 29 июня 2019 года . Проверено 8 марта 2019 г.
- ^ Кокс, Джозеф (22 мая 2018 г.). «The Wayback Machine удаляет доказательства продажи вредоносного ПО сталкерам» . Порок . Архивировано из оригинала 24 января 2022 года . Проверено 24 января 2022 г.
- ^ Конгер, Кейт. «Резервное копирование истории Интернета в Канаде, чтобы спасти его от Трампа» . ТехКранч . Архивировано из оригинала 27 декабря 2016 года . Проверено 14 мая 2017 г.
- ^ «Где найти то, что пропало в Интернете, и многое другое: Интернет-архив» . Международное общественное радио. Архивировано из оригинала 28 марта 2017 года . Проверено 14 мая 2017 г.
- ^ «Интернет-цензура в Китае» . Великий Огонь . 22 октября 2023 г. . Проверено 22 октября 2023 г.
- ^ Чиргвин, Ричард. «В России нет пути назад: Путин блокирует Archive.org» . Регистр . Архивировано из оригинала 7 октября 2016 года . Проверено 14 мая 2017 г.
- ^ «Россия не пойдет вспять, блокирует Интернет-архив» . Цифровые тенденции. 26 июня 2015. Архивировано из оригинала 17 апреля 2016 года . Проверено 14 мая 2017 г.
- ^ "В России разблокирован крупнейший интернет-архив" . Российская газета (in Russian). April 18, 2016. Archived from the original on April 5, 2019 . Retrieved October 18, 2020 .
- ^ Команда VirusTotal (25 марта 2015 г.). «Информация об IP-адресе 207.241.226.190» . www.virustotal.com . Дублин, Ирландия: VirusTotal . Архивировано из оригинала 14 июля 2014 года . Проверено 25 марта 2015 г.
25 марта 2015 г.: Последние URL-адреса, размещенные на этом IP-адресе, обнаружены как минимум одним сканером URL-адресов или вредоносным набором данных URL-адресов. ... 2/62 2015-03-25 16:14:12 [полный URL-адрес отредактирован]/Renegotiating_TLS.pdf ... 1/62 25-03-2015 04:46:34 [полный URL-адрес отредактирован]/CBLightSetup.exe
- ^ «Страница диагностики безопасного просмотра для archive.org» . google.com/safebrowsing . Маунтин-Вью, Калифорния, США. 25 марта 2015. Архивировано из оригинала 6 апреля 2015 года . Проверено 25 марта 2015 г.
25.03.2015: Часть этого сайта была внесена в список подозрительной активности 138 раз за последние 90 дней. ... Что произошло, когда Google посетил этот сайт? ... Из 42410 страниц, которые мы протестировали на сайте за последние 90 дней, 450 страниц привели к загрузке и установке вредоносного программного обеспечения без согласия пользователя. Последний раз Google посещал этот сайт 25 марта 2015 г., а последний раз подозрительный контент был обнаружен на этом сайте 25 марта 2015 г. ... Вредоносное программное обеспечение включает 169 троянов, 126 вирусов, 43 бэкдора.
- ^ «Помогите нам сохранить архив бесплатным, доступным и конфиденциальным для читателей | Блоги Интернет-архивов» . 29 ноября 2016 года. Архивировано из оригинала 21 мая 2017 года . Проверено 14 мая 2017 г.
- ^ Сакр, Шариф (7 ноября 2013 г.). «Веб-архив Wayback Machine пережил разрушительный пожар, но нуждается в помощи для восстановления» . Архивировано из оригинала 9 ноября 2020 года . Проверено 3 апреля 2022 г.
- ^ «Интернет-архив: предлагаемые изменения в DMCA заставят нас «цензурировать Интернет» » . Потребитель. 7 июня 2016. Архивировано из оригинала 11 ноября 2016 года . Проверено 14 мая 2017 г.
- ^ Херб, Ульрих (6 декабря 2016 г.). «Страх перед Трампом процветает» (на немецком языке). Хейз онлайн. Архивировано из оригинала 7 декабря 2016 года . Проверено 14 мая 2017 г.
Помимо цензуры и манипулирования цифровыми записями, операторы архивов также опасаются слежки за пользователями архивов. [Операторы архива опасаются не только цензуры и манипуляций с цифровыми записями, но и слежки за пользователями архива].
- ^ ЛаФранс, Адриенн (14 октября 2015 г.). «Темные века Интернета» . Атлантика . Архивировано из оригинала 7 мая 2017 года . Проверено 14 мая 2017 г.
- ^ «Весь Интернет будет заархивирован в Канаде, чтобы защитить его от Трампа» . Материнская плата. 29 ноября 2016. Архивировано из оригинала 16 мая 2017 года . Проверено 14 мая 2017 г.
- ^ ЛаФранс, Адриенн (3 июня 2016 г.). «Человеческий страх перед тотальным знанием» . Атлантика . Архивировано из оригинала 2 декабря 2016 года . Проверено 14 мая 2017 г.
Внешние ссылки [ править ]
- Официальный сайт
- История Интернета хрупка. Этот архив следит за тем, чтобы он не исчез . Сан-Франциско: Час новостей PBS. Архивировано из оригинала 6 января 2022 года . Проверено 19 сентября 2018 г.