Feito para durar

“Tem graça só ter persistido o papel. Tínhamos tudo em discos. Tudo, tudo, tudo.” — Funcionário de arquivo no filme Blade Runner 2049

No universo dos filmes de ficção científica Blade Runner a ocorrência de um evento sem precedentes no ano de 2022, referido como “Blackout”, destrói grande parte da informação digital existente, com repercussões desastrosas. A memória é um tema proeminente tanto no filme original como na sequela. À fragilidade dos registos electrónicos junta-se a fabilidade da memória humana e a sua relação com a identidade das personagens. Os perigos da perda do passado são bem claros: Sem memória não há sociedade.

Num passado muito recente decidimos, enquanto sociedade, apostar na transição para o digital. Decidimos que tudo o que é aspecto da nossa vivência conjunta, da nossa cultura e do nosso conhecimento deveria ser informatizado. Se trabalhas em tecnologia talvez isto te cause sentimentos contraditórios. Talvez o papel, como material a preservar, te apresente menos dúvidas do que o que está envolvido na manutenção de informação digital. Noutras palavras, sabes que há muito que pode dar errado em toda a pilha tecnológica, do hardware ao software.

“Vi coisas que vocês não acreditariam […] Todos esses momentos serão perdidos no tempo, como lágrimas na chuva.” — Roy Batty, Blade Runner (1982)

Estima-se que já tenham sido produzidos até hoje mais de 600.000 filmes, só contando as longas metragens, e existem várias instituições dedicadas à sua preservação. Um dos primeiros filmes a ser gravado, “L'Arrivée d'un train en gare de La Ciotat” de 1895 já foi digitalizado, estabilizado, a nitidez aperfeiçoada e até foi colorido com recurso à inteligência artificial. No entanto, se conversar com um técnico de alguma dessas instituições, é provável que lhe diga que o maior desafio que estas atravessam de momento não está tanto em preservar estas películas antigas mas sim em manter os filmes digitais. A manutenção de um arquivo digital requer um conjunto de competências muito diferentes. Requer conhecimento e equipamento que, para além de ser completamente diferente, fica obsoleto em poucos anos. Por essa razão, não só há falta de profissionais como há falta de equipamento necessário para reproduzir e preservar certos filmes.

Não se resolveram de todo as dificuldades de preservação ao se passar do analógico para o digital. Antes pelo contrário, nalguns casos os conteúdos ficaram presos a formatos e suportes que são hoje impossíveis de ler. Como é que é possível que seja mais fácil preservar um artefacto físico do que um conteúdo digital? Esse é o problema dos dados digitais. No início, são muito atractivos pelas facilidades que nos apresentam, tanto na cópia como na manipulação. Contudo com o tempo tornam-se muito fáceis de perder de forma totalmente irrecuperável. A “simplicidade” de materiais físicos e químicos é substituída por tecnologia que só é simples em aparência. Falta de codecs, versões de software desactualizadas, formatos de ficheiros incompatíveis, sistemas de ficheiros não suportados, discos rígidos corrompidos, suportes de armazenamento obsoletos (disquetes de diversos tipos foram substituídas por CDs, por DVDs, por Blu-rays, por USBs, de tipo A, B, C)… Isso é o dia-a-dia do arquivista digital.

“A informação digital dura para sempre – ou cinco anos, o que vier primeiro.” — Jeff Rothenberg

O nosso “Blackout” não começou em 2022, prolonga-se há anos e as empresas que nos vendem tecnologia estão pouco preocupadas. Terá sido uma boa aposta confiar o nosso passado a negócios privados?


Kris De Decker é o autor do website Low-tech Magazine [1], uma revista tecnológica que em vez de se focar nos últimos gadgets e inovações, explora tecnologia considerada obsoleta, não de uma perspectiva museológica, mas com o objectivo de encontrar nestas aplicações para o futuro. Essa página web é servida directamente de um computador em Barcelona que está ligado a um painel solar. Se estiver tempo nublado durante muitas horas seguidas o site vai abaixo. Mas assim que o sol descobre, volta a estar online. Isto pode parecer impensável para alguns, e é, certamente, para muitos tipos de websites. Mas nem todos precisam de estar disponíveis 99.9% do tempo (sendo este o valor estipulado para sistemas de alta disponibilidade). De Decker não se importa se a sua revista está em baixo por uma hora ou por uma manhã, o que lhe interessa é que se mantenha disponível a longo prazo, e para garantir isso prefere manter uma instalação minimalista e pouco convencional.

Ao resolver um problema através de tecnologia deparamo-nos sempre com a necessidade de escolher as tecnologias mais adequadas para o trabalho, as quais variam de menos a mais poderosas. Grande parte do trabalho do engenheiro consiste em estudar os compromissos a serem feitos e a escolher a solução correta. Normalmente, quanto menos poderosa é uma tecnologia, mais fácil é configurá-la, mantê-la e, se houver necessidade, substituí-la. É por isso muitas vezes recomendado escolher a solução mais simples possível. Isso pode parecer senso comum mas infelizmente não é o caso.

As soluções mais poderosas são muito atraentes, podem parecer mais promissoras, mais adequadas face a um futuro de requisitos incertos e, como são mais caras, são amplamente difundidas e estudadas. Soluções minimais não são, muitas vezes, rentáveis ou mesmo vendáveis, e não se encaixam num modelo de subscrição ou contracto que exija manutenção contínua fornecida pelos autores.

Há interesse em promover sistemas cada vez mais recentes e em rotular o hardware e o software existentes como obsoletos. No entanto, como De Decker nos mostra, temos muito a aprender com tecnologia dita ultrapassada. Acredito que, em áreas como as humanidades digitais e em instituições dedicadas a preservar património cultural há espaço para este tipo de tecnologia minimal, que seja mais fácil de lidar e manter por décadas, que seja sustentável e com uma longa vida útil. [2]


Em Dezembro de 1990, Tim Berners-Lee publicou o primeiro website enquanto trabalhava no CERN. O site continua disponível hoje [3] e pode ser visualizado em qualquer navegador recente, seja através de um computador ou dispositivo móvel. Isto é, uma versão recente de um browser lançado neste ano consegue comunicar com um servidor e renderizar HTML escrito há mais de 30 anos. Este nível de compatibilidade tem sido tido em conta no desenvolvimento da web desde o seu início e é em parte responsável pelo seu sucesso. Quando uma especificação atinge um estado estável, espera-se que seja suportada indefinidamente pelos navegadores. Isto contrasta largamente com as aplicações que instalamos nos nossos computadores e dispositivos móveis. Assim sendo, poderá a web, baseada em standards abertos e guiada por consórcios internacionais sem fins lucrativos, ajudar na preservação e divulgação da nossa herança cultural?

“Quando as pessoas me dizem que a internet vai destruir as bibliotecas, eu digo que não. A internet é a resposta ao sonho do bibliotecário. O sonho sempre foi, desde a antiga Biblioteca de Alexandria, trazer todo o conhecimento do mundo e colocá-lo na ponta dos dedos de quem procura o conhecimento. Pela primeira vez, temos a tecnologia que permite que isso aconteça.” — Ismail Serageldin, director da nova Biblioteca de Alexandria no documentário Digital Amnesia

Ao falarmos destas especificações e funcionalidades, o que é mais visível a um programador web amador ou profissional são as linguagens que utiliza para programar o conteúdo em si. São essas as linguagens HTML, CSS e JavaScript. Um programador pode passar por diversos problemas de compatibilidade enquanto desenvolve, mas usualmente são causados por bibliotecas, frameworks e outras dependências que nós próprios ou terceiros criaram em torno destas linguagens. Estas são aplicadas para tornar o nosso trabalho mais fácil e acelerar o desenvolvimento de páginas cada vez mais sofisticadas.

Esses sistemas são muitas vezes necessários, se pensar em aplicações web complexas como o Google Maps. No entanto, um efeito colateral que ocorreu foi que o ecossistema em torno da programação de websites ficou tão complexo que se vedou a entrada a programadores não profissionais. Os programadores profissionais criaram por isso ferramentas que simplificam essa complexidade que eles próprios adicionaram e que vendem a quem é amador. E é hoje passada a ideia que usar essas ferramentas é um requisito necessário para se fazer um site moderno e rápido. Mas na verdade para websites que são essencialmente documentos, como este que está a ler agora, continua a ser possível simplificar drasticamente e abdicar dessas dependências e ferramentas.

Diria até que é recomendado não utilizar aplicações, como construtores de sites, que prendam e limitam a liberdade, para que se por alguma razão um dia as decidirmos abandonar, não percamos as nossas criações. Plataformas promissoras deixam de existir a toda a hora. Aconteceu no passado e acontecerá novamente. Depende do mercado e está completamente fora do nosso controlo.

“Um dia, Medium, Twitter e até mesmo serviços de hospedagem como o GitHub Pages serão explorados e descartados quando não puderem crescer mais ou não conseguirem encontrar um modelo de negócio funcional.” — Jeff Huang, autor do Manifesto para Preservar Conteúdo na Web [4]

Esta problemática real tem sido matéria de debate frequente no mundo da programação web. As directrizes de Jeff Huang são interessantes e indicam-nos na direcção de um regresso às origens, em que se removem essas abstracções em torno das linguagens nativas da web (que têm vindo a ser melhoradas ao longo dos anos). Essas directrizes envolvem nomeadamente programar HTML e CSS directamente e evitar dependências externas que não controlamos. Significa isto que ao seguir estas instruções vamos evitar para sempre os erros “404 Página não Encontrada” e o problema da quebra de ligações? Infelizmente não.

Essas directivas atacam apenas uma parte do problema. A essa juntam-se outras duas, sobre as quais irei escrever mais tarde: alojamento e endereçamento.


  1. Cópia do original arquivada em 2022-03-24. ↩︎
  2. É preciso também não ser fundamentalista. Por vezes ao combinarmos vários sistemas simples acabamos com um sistema mais complexo do que se tivessemos começado com um sistema menos simples. ↩︎
  3. A página esteve indisponível durante um longo período mas foi recuperada. ↩︎
  4. Cópia do original arquivada em 2022-03-24. ↩︎