Perma.cc

Perma.cc
Perma.cc
Изображение логотипа
URL perma.cc
Коммерческий Нет
Тип сайта Веб-архив
Язык (-и) Английский
Начало работы 2013 год
Текущий статус работает

Perma.cc (Perma) — некоммерческий сервис по архивированию интернет-источников, цитируемых в научных работах и в области правосудия. Портал был создан в 2013 году в рамках сотрудничества между Library Innovation Lab и библиотекой Гарвардской школы права. Предпосылкой создания Perma.cc послужило проведённое профессорами юридического факультета Гарвардского университета исследование вымирания ссылок в документах правовой сферы. Оно показало, что более 50 % используемых в судебных решениях электронных ссылок больше не ведут на исходный материал. Для научных журналов аналогичный показатель составил более 60 %.

Perma.cc архивирует документы и осуществляет дальнейшее долгосрочное хранение архивированных материалов в партнёрстве с широкой сетью институциональных партнёров, каждый из которых имеет доступ к зеркалам базы данных. К 2019 году на портале было зарегистрировано около 25 000 пользователей, которые заархивировали более 1 млн ссылок. На 2022 год в сеть Perma.сс входили более 150 учреждений, в том числе Библиотеки Стэнфордского университета[англ.], Бостонский колледж, Техасский университет в Остине, «Архив Интернета», «Цифровая публичная библиотека Америки», Библиотека Конгресса, Министерство юстиции США, а также суды штатов Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана и других.

История

Создатели Perma.cc Лоуренс Лессиг и Джонатан Зиттрейн[англ.]

Сервис Perma.cc был создан в 2013 году в рамках сотрудничества библиотеки Гарвардской школы права и Library Innovation Lab[1][2]. Предпосылкой для его создания стало проведённое профессорами юридического факультета Гарвардского университета исследование распространённости вымирания ссылок в области юриспруденции. Авторы проанализировали судебные решения Верховного суда США и статьи трёх основных юридических журналов Гарвардского университета — Harvard Law Review[англ.] (HLR), Harvard Journal of Law & Technology[англ.] (HJLT) и Harvard Human Rights Journal (HRJ). Согласно результатам исследования, более 50 % ссылок в судебных решениях и более 60 % ссылок в научных статьях больше не вели на исходный материал[3][4][1][3]. Исследование согласовало результаты проводимого ранее анализа решений Верховного суда США за 2009—2010 год, согласно которому 29 % цитируемых онлайн-материалов перестали быть доступными[3][5][6].

Авторы опубликованного исследования — Джонатан Зиттрейн[англ.], Лоуренс Лессиг и Кендра Альберт — предложили учёным и специалистам в сфере юриспруденции архивировать цитируемые веб-страницы и, таким образом, предотвратить вымирание ссылок. Решить поставленную задачу был призван сервис Perma.cc или Perma, над созданием которого работали исследователи Гарвардского университета и разработчики ПО. Ведущим исполнителем проекта стал Мэтт Филлипс[1][2]. В обсуждении Perma.cc принимали участие представители более шестидесяти библиотек юридических факультетов, а также Центра Беркмана по изучению Интернета и общества[англ.], «Архива Интернета» и «Цифровой публичной библиотеки Америки»[7][8][1]. Проект был задуман как некоммерческий, с финансированием за счёт бюджетов партнёрских библиотек и грантов[9][10].

Perma.cc обеспечивает долгосрочное хранение архивированных материалов благодаря широкой сети институциональных партнёров, каждый из которых воспроизводит и пополняет зеркало основной базы данных[1]. На момент запуска у Perma.cc были заключены соглашения с 26 научными учреждениями и некоммерческими организациями, включая Библиотеки Стэнфордского университета[англ.], Бостонский колледж, Техасский университет в Остине, «Архив Интернета» и «Цифровую публичную библиотеку Америки». Спустя два года после запуска коллекция Perma.cc включала более 104 тыс. заархивированных страниц[11], а количество партнёрских организаций увеличилось до 90[12][6]. К 2019 году на портале зарегистрировались около 25 000 пользователей, которые в общей сложности заархивировали более 1 млн ссылок[2]. На 2022 год в сеть Perma.сс входили более 150 учреждений[13], включая Библиотеку Конгресса, Министерство юстиции США, суды штата Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана[14][6].

В 2015 году сервис стал победителем международной профессиональной интернет-премии Webby Awards и получил награду как лучший веб-проект в области права[15][16].

В 2016 году Институт музейного и библиотечного обслуживания США[англ.] выделил Гарвардской Library Innovation Lab грант размером 700 000 долларов США на расширение деятельности сервиса на все области науки[17][18]. Средства были вложены в техническое сопровождение расширения базы пользователей, работу по внедрению Perma.cc в национальные академические библиотеки, а также на разработку системы коммерческих подписок[19].

В августе 2021 года портал подвергся критике за несовершенную систему хранения материалов — опубликованное в New Scientist исследование 16 627 статей, заархивированных 17 европейскими и американскими организациями, показало, что некоторые генерируемые Perma.cc ссылки больше не работают[20][21].

Принцип работы

Для научных учреждений, журналов и судов доступ к Perma.сс предоставляется бесплатно. Организации-члены могут зарегистрировать для своих сотрудников неограниченное количество учётных записей с безлимитным доступом к архивации веб-материалов[22][14][23][5]. Для каждого члена сети Perma.cc создаётся отдельное пространство, где все аффилированные с организацией пользователи могут совместно работать[24]. В 2017-м портал добавил возможность создания бесплатных учётных записей с возможностью сохранения 10 веб-страниц ежемесячно, а также внедрил систему коммерческих подписок для не связанных с наукой или судебной системой учреждений (таких как частные юридические фирмы)[22][10][25][26][6][27]. С 2019 года лимит ссылок на архивацию для бесплатных учётных записей был ограничен десятью, без возможности продления ежемесячной подписки[28].

В отличие от другого крупного сервиса веб-архивирования — Wayback Machine — Perma.cc не использует поисковых роботов для сохранения интернет-страниц, пользователи сервиса самостоятельно архивируют необходимые источники. После получения запроса на архивацию Perma.cc добавляет веб-страницу в формате WARC[англ.] в хостинг Amazon S3. Через несколько секунд после этого копия файла WARC автоматически сохраняется на расположенный в Германии сервер[29][14][6]. Архивированные версии веб-страниц содержат дополнительные метаданные, такие как время и дата архивации[24]. Также Perma.cc сохраняет список архиваций каждой отдельной учётной записи[30].

В результате пользователи получают так называемую perma link — постоянную ссылку на исходный материал, действующую даже в том случае, если первоисточник был удалён[31][22][32][33]. Перейдя по perma link пользователь получает доступ к снимку экрана в формате PNG, сделанному в момент архивирования страницы, а также к сохранённой HTML-версии страницы[11][9]. Впоследствии авторы могут использовать данную ссылку в цитировании, вставляя её либо вместо оригинального URL-адреса, либо в дополнении к нему[31][24][34].

Большинство заархивированных через Perma.cc документов находится в открытом доступе[24]. Сервис не архивирует защищённые пейволлом материалы. Например, при попытке создать perma link на статью в The Wall Street Journal пользователь увидит баннер с просьбой приобрести подписку, а не текст статьи[1]. Однако у сервиса есть и так называемый dark archive («тёмный архив») — коллекция архивированных сайтов, закрытых от публичного доступа по желанию пользователей. Туда сохраняются и веб-страницы, владельцы которых включили в код сайта стандарт исключений для роботов. Для получения доступа к таким материалам пользователь может оставить запрос через любую партнёрскую организацию[11][8][35].

Perma.cc не несёт ответственности за содержание архивируемых материалов. Согласно правилам сервиса, пользователи могут использовать коллекцию Perma.cc только для некоммерческих целей, не нарушающих чьи-либо авторские и другие права[22].

Примечания

  1. 1 2 3 4 5 6 Ian Chant. Perma.cc Aims to Bring Staying Power to Online Legal Citations  (неопр.). Library Journal (2 октября 2013). Дата обращения: 12 ноября 2021. Архивировано 3 декабря 2021 года.
  2. 1 2 3 Pausing the Internet  (неопр.). The Practice (март 2019). Дата обращения: 15 ноября 2021. Архивировано 1 декабря 2021 года.
  3. 1 2 3 Flyntz, 2015, с. 39—59.
  4. Adam Liptak. In Supreme Court Opinions, Web Links to Nowhere  (неопр.). The New York Times (23 сентября 2013). Дата обращения: 10 ноября 2021. Архивировано 20 октября 2021 года.
  5. 1 2 Евгения Ударцева. Вечная жизнь для ссылок  (неопр.). Nag News (18 октября 2010). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
  6. 1 2 3 4 5 Stanton, 2019, с. 14—15.
  7. Jill Lepore. The Cobweb  (неопр.). New Yorker (19 января 2015). Дата обращения: 12 ноября 2021. Архивировано 25 января 2015 года.
  8. 1 2 Jefrey Perkel. The Trouble with Reference Rot  (неопр.). Nature. Дата обращения: 13 ноября 2021. Архивировано 3 декабря 2021 года.
  9. 1 2 Flyntz, 2015, с. 39=59.
  10. 1 2 Death To “Link Rot”: Here’s Where The Internet Goes To Live Forever  (неопр.). Fast Company (28 марта 2014). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
  11. 1 2 3 Jonathan Zittrain: Fighting ‘link rot’ in court opinions and legal scholarship  (неопр.). ABA Journal (24 сентября 2014). Дата обращения: 16 ноября 2021. Архивировано 3 декабря 2021 года.
  12. Aaron Gustafson. Avoiding Link Rot in Print with the Help of Perma.cc  (неопр.). Medium (3 декабря 2015). Дата обращения: 13 ноября 2021. Архивировано 24 ноября 2021 года.
  13. About  (неопр.). Perma.cc. Дата обращения: 17 ноября 2021. Архивировано 17 ноября 2021 года.
  14. 1 2 3 Probst, 2020, с. 35—59.
  15. Meg Kribble. Congrats to the Webby Award-winning Perma.cc!  (неопр.) HLSL. Дата обращения: 8 ноября 2021. Архивировано 3 декабря 2021 года.
  16. Webby Awards, Winners 2015  (неопр.). Webby Awards. Дата обращения: 17 ноября 2021. Архивировано 23 июня 2020 года.
  17. Harvard’s Perma.cc receives grant to expand its tools for saving sources on the Web  (неопр.). Harvard Law Today (14 апреля 2016). Дата обращения: 12 ноября 2021. Архивировано 3 декабря 2021 года.
  18. Leif Johnson. The Million Dollar Homepage is a Million Dollar Graveyard  (неопр.). Vice (24 июля 2017). Дата обращения: 11 ноября 2021. Архивировано 3 декабря 2021 года.
  19. Dulin, 2017.
  20. Chris Stokel-Walker. Digital archives meant to be permanent seem to be lost on the web  (неопр.). New Scientist (30 августа 2021). Дата обращения: 18 ноября 2021. Архивировано 3 декабря 2021 года.
  21. Веб-архивы не гарантируют сохранности данных — американские ученые  (неопр.). Красная Весна. Дата обращения: 18 ноября 2021. Архивировано 3 декабря 2021 года.
  22. 1 2 3 4 Callister, 2021, с. 1—57.
  23. Lepore, 2015.
  24. 1 2 3 4 Zittrain, 2014, с. 165—188.
  25. Jacob Kastrenakes. Supreme Court citations are falling apart as web links begin to change and disappear  (неопр.). The Verge (23 сентября 2013). Дата обращения: 13 ноября 2021. Архивировано 23 ноября 2021 года.
  26. About  (неопр.). Perma.cc. Дата обращения: 16 ноября 2021. Архивировано 24 ноября 2021 года.
  27. How should we guard against link rot?  (неопр.) Thomas Whitley (13 марта 2015). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
  28. Introducing Individual Account Subscription Tiers for Perma  (неопр.). Harvard Blogs (7 января 2019). Дата обращения: 10 ноября 2021. Архивировано 28 октября 2021 года.
  29. Ben Steinberg  (неопр.). Library Innovation Lab. Дата обращения: 17 ноября 2021. Архивировано 3 декабря 2021 года.
  30. Joseph Cox. Motherboard Made a Tool That Archives Websites on Demand  (неопр.). Vice (1 мая 2018). Дата обращения: 6 ноября 2021. Архивировано 3 декабря 2021 года.
  31. 1 2 Riss, 2015, с. 1251—1252.
  32. Новый сервис сделает интернет-ссылки «вечными»  (неопр.). Lenta.ru (16 октября 2013). Дата обращения: 15 ноября 2021. Архивировано 4 декабря 2021 года.
  33. Библиотекари США разработали новый сервис, который позволит создавать "вечные" интернет-ссылки  (неопр.). Фокус (17 октября 2013). Дата обращения: 18 ноября 2021. Архивировано 4 декабря 2021 года.
  34. Craigle, 2021.
  35. Craigle, 2021, с. 1—13.

Литература

  • Callister P.G. Perma.cc and Web Archival Dissonance with Copyright Law // Legal Reference Services Quarterly. — 2021. — Т. 40, вып. 1. — С. 1—57. — doi:10.1080/0270319X.2021.1886785.
  • Craigle V. Adopting DOI in Legal Citation: A Roadmap for the Legal Academy // Virtual Symposium on Citation and the Law, University of Utah College of Law Research Paper. — 2021. — С. 1—13.
  • Dulin K., Ziegler A. Scaling Up Perma.cc: Ensuring the Integrity of the Digital Scholarly Record // D-Lib Magazine. — 2017. — Т. 23, вып. 6. — doi:10.1045/may2017-dulin.
  • Flyntz M. Ever Onward: Expanding the Use of Perma.cc // Legal Reference Services Quarterly. — 2015. — Т. 34, вып. 1. — С. 39—59.
  • Gertler A., Bullock J. Reference Rot: An Emerging Threat to Transparency in Political Science // American Political Science Association. — 2017. — С. 166—171.
  • Klein M., Sompel H., Sanderson R., Shankar H., Balakireva L., Zhou K., Tobin R. Scholarly Context Not Found: One in Five Articles Suffers from Reference Rot // PLoS One. — 2014. — Т. 9, вып. 12. — doi:10.1371/journal.pone.0115253.
  • Lepore J. The Cobweb // Annals of Technology. — 2015. — С. 1—13.
  • Probst S. Available At?: The Tenuous Nature of Online Authority Cited in Arkansas Judicial Opinion // Arkansas Law Notes. — 2020. — Вып. 35. — С. 25—39.
  • Riss P. Reference rot: does it matter? // Int Urogynecol J. — 2015. — Вып. 26. — С. 1251—1252. — doi:10.1007/s00192-015-2707-8.
  • Stanton C. Perma and Citation at the Modern Law Firm // Michigan Bar Journal. — 2019. — С. 14—15.
  • Zittrain J., Albert K., Lawrence Lessig L. Perma: scoping and addressing the problem of link and reference rot in legal citations // Harvard Law Review Forum. — 2014. — Т. 125, вып. 165. — С. 165—188.

Ссылки

  • Официальный сайт