Wayback Machine Sob Pressão: O Fim da Preservação da Memória da Internet?
A crescente resistência da mídia pode ameaçar o acesso ao passado digital.

Você sabia que há 30 anos o portal archive.org é o guardião da memória da internet? A sua famosa Wayback Machine abriga mais de um bilhão de sites arquivados, funcionando como uma ferramenta essencial para jornalistas, pesquisadores, historiadores e juristas que buscam acessar conteúdos originais de páginas que já foram alteradas ou desaparecidas.
Contudo, esse projeto vital enfrenta uma crise existencial, e a última ameaça vem de quem mais deveria proteger os arquivos: os veículos de imprensa.
O Bloqueio da Mídia
Um aumento alarmante de empresas de comunicação decidiu bloquear o acesso do Internet Archive aos seus conteúdos. De acordo com uma pesquisa da Nieman Foundation for Journalism, da Universidade de Harvard, pelo menos 241 portais de notícias de nove países já adotaram essa prática. Nomes de peso como The Guardian, New York Times, Le Monde e USA Today estão nesta lista.
Irônico, Não?
O USA Today publicou recentemente uma matéria destacando que a polícia de imigração dos EUA estava ocultando informações de sua política de detenção. Para investigar, o jornal utilizou exatamente conteúdos da Wayback Machine — uma verdadeira contradição, considerando que agora eles barram o acesso da plataforma a seus próprios artigos.
Mas qual é a razão por trás dessa decisão? Os jornais temem que empresas de inteligência artificial, como OpenAI e Google, acessem os conteúdos arquivados sem autorização e sem pagar pelos direitos. Graham James, porta-voz do New York Times, declarou: "As empresas de IA utilizam conteúdo nosso do Internet Archive, infringindo direitos autorais e concorrendo diretamente conosco".
Um Exército de Robôs
Dados revelam que o archive.org é frequentemente alvo de robôs que garimpam conteúdos jornalísticos para treinar modelos de IA, obtendo informações que lhes são negadas. Mark Graham, diretor da Wayback Machine, comentou que algumas empresas chegam a fazer centenas de milhares de solicitações por segundo, sobrecarregando os servidores do Archive.
A Necessidade de Preservação
A Electronic Frontier Foundation (EFF) compara a atitude dos veículos de imprensa a uma situação em que "um jornal proíbe bibliotecas de manter cópias de seu periódico". Desde então, mais de 100 jornalistas assinaram uma petição em apoio ao Internet Archive, alertando: "Em um cenário de mídia digital onde artigos desaparecem, dependemos da Wayback Machine para recuperar páginas que estariam perdidas".
O desfecho é incerto. Graham, do NYT, está em diálogo com os veículos de comunicação para reestabelecer o acesso: "O bloqueio crescente da internet pública prejudica nossa compreensão do mundo".
Um Olhar para o Futuro da Internet
O repórter especializado em mídia, Martin Fehrensen, considera o archive.org como o único registro funcional da web aberta. Se a plataforma não conseguir cumprir essa função, as consequências podem ser severas para a memória da internet.
Ele sugere um diálogo entre editores e uma separação técnica clara entre arquivamento e o uso de conteúdo para treinar IA. Para o futuro, Fehrensen acredita que o arquivamento de internet deve ser tratado como uma infraestrutura pública, e não como um projeto isolado.
Um Conflito Acentuado
O Internet Archive tem enfrentado desafios anteriores, incluindo um ataque hacker e processos judiciais. Contudo, a pressão atual dos bloqueios pela mídia pode ser ainda mais grave, uma vez que resulta de decisões corporativas que ameaçam a essência do que a Wayback Machine representa: a documentação da internet pública.