Archive.org – dijital hafızamız tehlikede

Dijital hafızamızın koruyucusu olan "Wayback Machine", hayatta kalma mücadelesi veriyor. Hacker saldırıları ve telif hakkı davalarının ardından, giderek daha fazla medya kuruluşu içeriklerinin arşivlenmesine izin vermeyi reddediyor.

1206 görüntüleme 0 yorum(a)
İllüstrasyon, Fotoğraf: Shutterstock
İllüstrasyon, Fotoğraf: Shutterstock
Uyarı: Çeviriler çoğunlukla yapay zeka çevirmeni aracılığıyla yapılır ve %100 doğru olmayabilir.

İnternet portalı archive.org, 30 yıldır dijital içerik arşivliyor. Wayback Machine, bir trilyondan fazla arşivlenmiş web sayfası içeriyor ve silinmiş veya değiştirilmiş içeriğe orijinal haliyle erişmek isteyen gazeteciler, araştırmacılar, tarihçiler ve avukatlar için vazgeçilmez bir araç olarak kabul ediliyor. Ancak San Francisco merkezli kar amacı gütmeyen kuruluşun bu eşsiz projesi varoluşsal bir krizle karşı karşıya ve son tehdit, arşive en acil ihtiyaç duyanlardan geliyor: medyanın kendisinden.

Giderek artan sayıda büyük medya kuruluşu, İnternet Arşivi'nin içeriklerine erişimini engelliyor. Harvard Üniversitesi'ndeki Nieman Gazetecilik Vakfı'nın araştırmasına göre, dokuz ülkeden en az 241 haber portalı, Arşiv'in web tarayıcılarını engelliyor; bunlar arasında The Guardian, The New York Times, Le Monde ve Amerika Birleşik Devletleri'ndeki en büyük gazete grubu olan USA Today Company de bulunuyor.

Kendilerini önemli bir araca erişimden mahrum bırakıyorlar.

USA Today gazetesi yakın zamanda ABD Göçmenlik ve Gümrük Muhafaza Teşkilatı'nın (ICE) gözaltı politikaları hakkındaki bilgileri sistematik olarak nasıl gizlediğine dair sansasyonel bir haber yayınladı. Araştırmanın temeli, archive.org'daki Wayback Machine'den elde edilen verilerdi. Bu arşiv sayesinde haberi yazabilen aynı medya kuruluşu, şimdi içeriğe erişimi engelliyor.

Peki medya kuruluşları neden bu araçlardan birini kendilerinden mahrum bırakıyor? Cevap basit: Yapay zekâ (YZ) korkusu. Yayıncılar, OpenAI veya Google gibi YZ şirketlerinin, izinsiz ve tazminat ödemeden, gazetecilik içeriklerine toplu olarak erişip dil ​​modellerini eğitmek için arşivi kullanacağından korkuyorlar. New York Times sözcüsü Graham James konuyla ilgili olarak kamuoyuna şu açıklamayı yaptı: "Sorun şu ki, YZ şirketleri telif hakkımızı ihlal ederek doğrudan bizimle rekabet etmek için İnternet Arşivi'ndeki içeriğimizi kullanıyor."

Saniyede on bin bot

Veriler, archive.org web sitesini hedef alan çok sayıda botun, VI modellerini eğitmek için medya içeriği aradığını ve böylece kendilerine erişimi engellenen verilere erişim sağladığını gösteriyor. Wayback Machine'in direktörü Mark Graham, Wired dergisine bazı şirketlerin zaman zaman saniyede on binlerce istek göndererek arşive eriştiğini ve bunun sunucuları geçici olarak aşırı yüklediğini doğruladı.

Archive.org, kâr amacı gütmeyen bir kuruluş olarak açık internet kurallarına tabi olduğu için böyle bir duruma hazırlıklı değildi. Sloganı şuydu: “Geleneksel bir kütüphane gibi, araştırmacılara, tarihçilere, akademisyenlere, okuma güçlüğü çekenlere ve genel halka ücretsiz erişim sunuyoruz. Amacımız, tüm bilgiye evrensel erişim sağlamaktır.” Bu durum, botların ve otomatik arama motorlarının (tarayıcıların) dışlanması yasağını da kapsıyor ve bu da büyük yayıncılık ve medya şirketleri tarafından yaptırımlara yol açtı.

Dijital konulara odaklanan bir insan hakları örgütü olan Elektronik Sınır Vakfı (EFF), yayıncının eylemlerini "bir gazete yayıncısının kütüphanelerin artık yayınlarının kopyalarını bulundurmasına izin verilmeyeceğini duyurmasına" benzetiyor.

İnternetin tarihi kaybolabilir.

Bu arada, 100'den fazla gazeteci İnternet Arşivi'ni destekleyen bir dilekçe imzaladı. Açık mektuplarında şu ifadeler yer alıyor: "Bağlantı kaybı, şirket birleşmeleri veya maliyet düşürme önlemleri nedeniyle makalelerin kaybolduğu dijital medya ortamında, gazeteciler genellikle aksi takdirde kaybolacak sayfaları geri yüklemek için arşivleme aracı Wayback Machine'e güveniyorlar. İnterneti korumaya yönelik bu sürekli çalışma olmasaydı, yakın gazetecilik tarihinin büyük bir kısmı çoktan kaybolmuş olurdu."

Mark Graham, Wired dergisine verdiği demeçte, içeriklerine erişimi yeniden sağlamak için medya şirketleriyle görüşmelerde bulunduğunu söyledi. Bu görüşmelerin nasıl sonuçlanacağı henüz belli değil. Ancak vardığı sonuç bir uyarı niteliğinde: "Kamuya açık internetin büyük bölümlerinin giderek daha fazla engellenmesinin, toplumun dünyamızda olup bitenleri anlama yeteneğini aşındırdığına şüphe yok."

"Web arşivleme, kamu altyapısının bir parçasıdır."

Gazeteci ve sosyal medya izleme blogu watchblog.de'nin kurucusu Martin Ferenzen, archive.org'u açık web için işlevsel tek kanıt zinciri olarak görüyor. DW'ye verdiği demeçte, eğer görevlerini yerine getiremezse bunun önemli sonuçları olacağını söyledi: "Milyonlarca Wikipedia kaynaklı alıntı geçerliliğini kaybedecek, platformu inceleme sorumluluğu - yani hangi genel şartlar ve koşulların ne zaman geçerli olduğu, hangi moderasyon kurallarının yeniden formüle edildiği ve nasıl yapıldığı - çok daha zorlaşacak ve yasal olarak geçerli dijital kanıtlar ortadan kaybolacak." Arşivin engellenmesinin, özellikle medya kuruluşları için tamamen saçma olduğunu belirtiyor.

Bu çatışmayı çözmek için iki yol olduğunu açıklıyor: "Yayıncılarla, arşivleme ve yapay zeka eğitiminin teknik olarak net bir şekilde ayrıldığı bir diyaloga ihtiyacımız var; çünkü çatışmaya esasen yol açan şey arşiv değil, bu ayrımdır." Fehrenzen, orta vadede web arşivleri için özel bir yasal statü oluşturulması gerektiğine inanıyor. Uzun vadede ise, "web arşivleme, San Francisco'daki bir STK'nın bağımsız bir projesi olarak değil, kamu altyapısı olarak ele alınmalıdır. 2026'da hala tek bir kuruluşa bağlı olması gerçek bir yapısal başarısızlıktır."

Bu, pek çok çatışmadan sadece biri, ama en dramatik olanı.

İnternet Arşivi'nin hayatta kalma mücadelesi ilk kez yaşanmıyor. Eylül 2024'te bir bilgisayar korsanı 31 milyon kullanıcı hesabından veri çaldı; bu, kuruluşun toparlanmakta zorlandığı bir darbe oldu. Aynı yıl, arşiv ABD Temyiz Mahkemesi'nde *Hatchett v. Internet Archive* davasında telif hakkı davasını da kaybetti. Yayıncılar Hatchett, Penguin Random House, HarperCollins ve Wiley, koronavirüs pandemisi sırasında arşivin başlattığı ücretsiz e-kitap ödünç verme programına karşı açtıkları davayı başarıyla sonuçlandırdılar. 500.000'den fazla kitap ödünç verme hizmetinden kaldırılmak zorunda kaldı. Ancak archive.org hala milyonlarca dolarlık tazminatla karşı karşıya.

Bu yenilgilerle karşılaştırıldığında, medya ablukalarının oluşturduğu mevcut tehdit yapısal olarak daha ciddidir; bir mahkeme kararıyla veya bir güncellemeyle çözülemez. Bu, bir araya geldiğinde Wayback Machine'in temel işini, yani kamuya açık web'in kapsamlı belgelendirilmesini baltalayan bir dizi kurumsal kararın sonucudur.

Daha fazlasını görün: