Wayback Machine
Wayback Machine (с англ. — «Машина времени») — бесплатный онлайн-архив некоммерческой библиотеки «Архив Интернета». С помощью поисковых роботов Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета[2]. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате HTML, JavaScript и CSS[3]. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок[4]. По состоянию на июль 2021 года Wayback Machine предоставляет доступ к более чем 591 млрд сохранённым веб-страницам[5].
Wayback Machine | |
---|---|
| |
URL | web.archive.org |
Тип сайта | веб-архив |
Язык(-и) | английский |
Язык программирования | Java, Python |
Владелец | Архив Интернета |
Начало работы | 24 октября 2001 |
Рейтинг Alexa | 173[1] |
Страна |
Создание
В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «Архив Интернета» — некоммерческая организация, созданная программистами Брюстером Кейлом и Брюсом Галлиатом в 1996 году. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «Архива Интернета» находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции Kawl в 2019 году сравнивал офис «Архива» с римским храмом[6][7][8]. Организация ставит перед собой цель спасти интернет от исчезновения[9].
Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкля». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страниц[4][10][11]. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими[12]. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале[13].
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей[14]. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц[4]. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру[2]. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ[15]. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта[16][17].
Характеристика
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом веб-архивирования[4][9]. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм[7]. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений[17]. Сами создатели организации сравнивали свою коллекцию с Александрийской библиотекой[7]. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц[15] — больше, чем документов в Библиотеке Конгресса[18][7][17].
Принцип работы
Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям[3].
Поисковые роботы
Коллекция Wayback Machine по годам | Архивированные страницы (в миллиардах) |
---|---|
2005 | 40 |
2008 | 85 |
2012 | 150 |
2013 | 373 |
2014 | 400 |
2015 | 452 |
2020 | 514 |
2021 | 581 |
Изначально коллекция архива пополнялась за счёт браузерного плагина от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта[17].
В 2002 году «Архив» запустил собственного поискового робота с открытым исходным кодом — Heritrix. Коды краулеров записаны с помощью комбинации программных языков Cи и Perl. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров[7]. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 терабайт в месяц[20].
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая HTML-, JavaScript- и CSS-страницы[3]. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine[9]. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс[15]. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита[21]. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии[3]. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере[11][15][4].
Интерфейс
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов[13][22][18][23]. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org[24][15].
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт[25][25].
Хранение
На 2018 год коллекция «Архива Интернета» составляла более 40 петабайт или 40 млн гигабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов[26]. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц[27]. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц[5].
Использование
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о патентном праве или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети[3][13]. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии[28]. В 2018 году Апелляционный суд США по второму федеральному апелляционному округу постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес Апелляционный суд США по третьему федеральному апелляционному округу[29]; позднее Апелляционный суд США по седьмому федеральному апелляционному округу также признал скриншоты веб-архивов допустимыми электронными доказательствами[30].
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию[31]. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик[2][32]. Также Wayback Machine позволяет получать доступ к журналам открытого доступа. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным[33][34][35].
Активисты и исследователи используют портал для борьбы с дезинформацией, особенно усилившейся после избрания президента Дональда Трампа в США. В ответ на участившиеся противоречивые заявления со стороны администрации президента «Архив» создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и твиты. «Архив» надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент[36][37]. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом пандемии коронавируса сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе[38]. В качестве контрмер в ноябре 2020 года «Архив» внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт[39].
В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, с помощью портала было выяснено, что официальный представитель Министерства здравоохранения и социальных служб США Майкл Капуто в серии уже удалённых твитов публиковал расистские и уничижительные комментарии о китайском народе[40]. Помимо этого, Wayback Machine хранит копию удалённого сообщения со страницы, озаглавленной «Сводки от Стрелкова Игоря Ивановича» в социальной сети «ВКонтакте», о сбитом самолёте АН-26, который в действительности оказался пассажирским Boeing 777[41][42]. В мае 2021 года издание Bellingcat выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine[43].
Правовой статус
«Архив Интернета» не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Например, владельцам веб-сайтов предоставляется возможность «отказаться» от архивирования через стандартный файл robots.txt, который исключает веб-сайты из списка порталов для веб-краулеров[9][44]. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении[45]. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocate, так и на «Архив», утверждая что архив нарушил Закон об авторском праве в цифровую эпоху. Впоследствии дело было урегулировано в досудебном порядке[46].
В 2002 году «Архив» удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов Церкви Саентологии, заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте[47][48].
Ограничения
Исследователи и активисты критикуют Wayback Machine и деятельность «Архива Интернета» за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой «Архива», который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли свое мнение[49]. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам[50]. Сканеры захватывают только статический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется[9].
Блокировки
В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в «Архиве Интернета» была добавлена в официальный реестр запрещенных веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт «Архива»[51][52][53]. Доступ к Wayback Machine был заново открыт в 2016 году, после того как запрещённые ролики удалили с портала[54].
В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года «Архив Интернета» по-прежнему продолжал свою работу[55][56][57][58].
В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов»[59][60][61]. По данным на 2021 год, сайт заблокирован в Китае[62].
Примечания
- Overview (англ.). alexa.com. Дата обращения: 8 декабря 2021. Архивировано 18 мая 2020 года.
- Arora, 2015.
- Lerner, 2017, pp. 1741—1755.
- Michael Bryant. What is the Wayback Machine and Why is it Useful? (англ.). Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021. Архивировано 18 мая 2021 года.
- Wayback Machine (англ.). Wayback Machine. Дата обращения: 7 июня 2021.
- Dominic Cummings: how the internet knows when you’ve updated your blog (англ.). The Conversation (28 мая 2020). Дата обращения: 3 июня 2021. Архивировано 25 июля 2021 года.
- Odgen, 2017.
- In An Old Church, The Internet Archive Stores Our Digital History (англ.). Kalw. San Francisco local public radio (11 сентября 2019). Дата обращения: 3 июня 2021. Архивировано 6 мая 2021 года.
- Price, 2011.
- Jack Schofield. The Time Machine (англ.). The Guardian (19 ноября 2007). Дата обращения: 1 июня 2021. Архивировано 19 апреля 2021 года.
- Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress (англ.). WPMudev (25 мая 2017). Дата обращения: 29 мая 2021. Архивировано 13 апреля 2021 года.
- Adrienne LaFrance. Raiders of the Lost Web (англ.). The Atlantic (14 октября 2015). Дата обращения: 7 июня 2021. Архивировано 7 мая 2017 года.
- Rogers, 2017, pp. 160—172.
- Hartelius, 2020, p. 378.
- Bowyer, 2021, pp. 43—57.
- Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard (англ.). Vox (23 января 2020). Дата обращения: 29 мая 2021. Архивировано 18 августа 2021 года.
- Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web (англ.). Forbes (18 января 2016). Дата обращения: 5 июня 2021. Архивировано 15 августа 2021 года.
- O'Connor, 2008, p. 64.
- michelle. Wayback Machine Hits 400,000,000,000! (англ.). Internet Archive (9 мая 2014). Дата обращения: 25 марта 2015. Архивировано 26 августа 2014 года.
- Richard Koman. How the Wayback Machine Works (англ.). Xml.com (21 января 2002). Дата обращения: 5 июня 2021. Архивировано 28 мая 2021 года.
- A. Rossi. Worldwide Web Crawls (англ.). Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
- Laura Bohannon. Wayback Machine archives websites for over 20 years (англ.). Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Maemura, 2018.
- Notess, 2002.
- Mark Graham. Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation (англ.). Global Investigative Journalism Network (5 мая 2021). Дата обращения: 29 мая 2021. Архивировано 29 мая 2021 года.
- Zachary Crockett. Inside Wayback Machine, the internet’s time capsule (англ.). The Hustle (28 сентября 2018). Дата обращения: 29 мая 2021. Архивировано 2 октября 2018 года.
- Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц (англ.). vc.ru (26 февраля 2020). Дата обращения: 1 июня 2021. Архивировано 24 июня 2021 года.
- Eltgroth, 2009.
- Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule (англ.). The Register (4 сентября 2018). Дата обращения: 4 июня 2021. Архивировано 2 июня 2021 года.
- Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности . Гарант (26 октября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Pearce, 2009, p. 875.
- Milligan, 2016.
- Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them (англ.). Science (8 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 15 октября 2020 года.
- Diana Kwon. More than 100 scientific journals have disappeared from the Internet (англ.). Nature (10 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 3 октября 2020 года.
- avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил . Хабр (10 сентября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Camilla Hodgson. How the Internet Archive is waging war on misinformation (англ.). Financial Times (17 сентября 2019). Дата обращения: 3 июня 2021. Архивировано 28 июня 2021 года.
- Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive (англ.). PRI.org (23 февраля 2017). Дата обращения: 7 июня 2021. Архивировано 28 марта 2017 года.
- Acker, 2020.
- Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц . Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США . Красная весна (24 апреля 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? (англ.). Open Culture (19 июля 2014). Дата обращения: 3 июня 2021. Архивировано 24 июня 2021 года.
- Jil Lepore. The Cobweb (англ.). New Yorker (19 января 2015). Дата обращения: 7 июня 2021. Архивировано 25 января 2015 года.
- Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях (англ.). TJournal (30 мая 2021). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Carolyn Wimbly Martin. Internet Archive’s Open Library and Copyright Law (англ.). Lutzker (15 мая 2020). Дата обращения: 4 июня 2021. Архивировано 24 июня 2021 года.
- Nate Anderson. Copy some webpages, owe more than the national debt (англ.). Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Eric Bangeman. Internet Archive settles suit over Wayback Machine . Ars Technica (31 августа 2006). Дата обращения: 7 июня 2021. Архивировано 5 ноября 2007 года.
- Lisa M. Bowman. Net archive silences Scientology critic (англ.). CNET (24 сентября 2002). Дата обращения: 10 июня 2021.
- Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology (англ.). LawMeme (24 сентября 2002). Дата обращения: 10 июня 2021.
- Nora Caplan-Bricker. Preservation Acts (англ.). Harper's Magazine (декабрь 2018). Дата обращения: 2 июня 2021. Архивировано 5 мая 2021 года.
- Crudo, 2014.
- Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page (англ.). Tech dirt (26 июня 2015). Дата обращения: 3 июня 2021. Архивировано 4 июня 2021 года.
- Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" . Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Роскомнадзор заблокировал страницу «архива интернета» за экстремизм . Lenta (25 июня 2015). Дата обращения: 5 июня 2021. Архивировано 22 сентября 2021 года.
- Дмитрий Шестоперов, Анастасия Евтушенко. «Архив интернета» снова в сети . Газета.ru (18 апреля 2016). Дата обращения: 9 декабря 2021. Архивировано 3 мая 2021 года.
- АЗАПИ хочет навечно заблокировать «Архив Интернета» . Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021. Архивировано 4 июня 2021 года.
- «Архив интернета» могут навечно заблокировать в России . CNews (23 августа 2019). Дата обращения: 7 июня 2021. Архивировано 24 июня 2021 года.
- Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru . CNews (19 августа 2020). Дата обращения: 7 июня 2021. Архивировано 24 июня 2021 года.
- Американские издатели книг подали в суд на Internet Archive . Ведомости (2 июня 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Access to Internet Archive’s Wayback Machine Blocked in India (англ.). The Wire (8 августа 2017). Дата обращения: 3 июня 2021. Архивировано 24 июня 2021 года.
- Wayback Machine has been blocked in India (англ.). The Verge (9 августа 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds (англ.). Global Voices. Дата обращения: 5 июня 2021. Архивировано 18 мая 2021 года.
- Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever (англ.). Protocol (10 марта 2021). Дата обращения: 9 июня 2021. Архивировано 1 июня 2021 года.
Литература
- Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. (англ.) // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi:10.37016/mr-2020-41.
- Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts (англ.) // Internet Histories. — 2018. — doi:10.1080/24701475.2018.1455412.
- Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource (англ.). — 2015. — Vol. 67, iss. 8. — P. 1904—1915. — doi:10.1002/asi.23503.
- Bowyer S. The Wayback Machine: notes on a re‑enchantment (англ.) // Archival Science. — 2021. — Vol. 21. — P. 43—57.
- Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence (англ.) // Fordham L. Rev.. — 2009. — Vol. 78, iss. 181.
- Greg R. Notess. The Wayback Machine: The Web's Archive (англ.) // Online. — 2002. — Vol. 26, iss. 2.
- Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine (англ.) // Quarterly Journal of Speech. — 2020. — Vol. 106, iss. 4. — P. 377—398.
- James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation (англ.) // Landslide. — 2014. — Vol. 6, iss. 3.
- Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present (англ.) // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
- Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance (англ.) // Journal of the association for information science and technology. — 2018. — Vol. 69, iss. 10. — P. 1223—1233.
- Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives (англ.) // International Journal of Humanities and Arts Computing. — 2016.
- Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine (англ.) // Journal of Computer-Mediated Communication. — 2008. — Iss. 13. — P. 60—75.
- Odgen J., Halford S., Carr L. Observing Web Archives (англ.) // WebSci. — 2017. — P. 299—308.
- Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) (англ.) // Medical Hypothesis. — 2009. — P. 875.
- Price. Internet Archiving – The Wayback machine (англ.) // MLA Commons. — 2011.
- Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information (англ.) // Feminist Collections. — 2011. — Vol. 32, iss. 2.
- Rogers R. Doing Web history with the Internet Archive: screencast documentaries (англ.) // Internet Histories. — 2017. — Vol. 1, iss. 1—2. — P. 160—172. — doi:10.1080/24701475.2017.1307542.