Wie funktioniert das Internet-Archiv?
Sie möchten eine Reise durch die Web-Vergangenheit unternehmen oder verlorengeglaubte Inhalte wiederherstellen? Hier hilft das Internet-Archiv.
Wie funktioniert das Internet-Archiv?
Das Internet-Archiv funktioniert auf zwei Ebenen. Der Google-Cache legt Schnappschüsse des letzten Crawls an. Diese reichen oft nur wenige Tage zurück. Über die Wayback Machine bietet sich ein umfassendes Archiv über weite Teile einer URL-Lebensdauer an. Durch einfache Link-Eingabe können monate- und jahrealte Crawls gezielt angewählt und verlorene Inhalte mit etwas Glück wiederhergestellt werden.
Auf der Suche nach verlorenen Inhalten
Nostalgie ist eine schöne Sache. Wer möchte nicht in Erinnerungen schwelgen? Gerade im Netz kann das eine hochspannende Angelegenheit sein. Wie hat die Lieblingswebsite vor fünf, vor zehn Jahren ausgesehen? Ein kleiner Trip in die Vergangenheit weiß zu unterhalten. Das Internet-Archiv kann aber auch einen anderen Nutzen haben. Wenn Inhalte verlorengegangen sind – durch einen Server-Crash, ein defektes Backup oder den plötzlichen Wunsch, ein eingestelltes Projekt wiederzubeleben – muss guter Rat nicht teuer sein. Ein paar Klicks können kleine Katastrophen verhindern.
Die jüngste Vergangenheit: Google-Cache
Ein Großteil der Websuchen im europäischen und nordamerikanischen Raum wird über Google abgewickelt. Klickt man auf den nach unten zeigenden Pfeil nach der URL, öffnen sich weitere Auswahlmöglichkeiten, wie „Im Cache“. Alternativ kann der Permalink über den Browser nach folgendem Muster aufgerufen werden: https://www.google.at/search?q=cache:pinzweb.at. Für den Anfang ist dieser Schnappschuss gewiss nicht schlecht. Da allerdings nur der jüngste Crawl angezeigt wird, reicht er meist nur wenige Tage zurück.
Zurück in die Zukunft: Wayback Machine
Für ältere Inhalte will abgetaucht werden in die Untiefen der Wayback Machine. Unter archive.org wartet eine wahre Content-Schatzkiste auf Suchende und Findende. Der Archive-Crawler steuert Websites in unregelmäßigen Abständen an und erstellt Kopien. Wie umfangreich diese sind, ist ganz unterschiedlich. Manchmal werden nur einzelne Seiten und Hauptmenüpunkte, dann wieder komplette Websites gecrawlt und gespeichert. Um auf dieses umfangreiche Archiv zuzugreifen, will die URL der gewünschten Website in die Adresszeile eingegeben werden. Nun heißt es ein wenig warten, bevor die nach Jahren und Monaten sortierten Schnappschüsse aufgelistet werden. Per Klick auf das relevante Datum lädt der gewünschte „Zeitzeuge“. Diese Domain wurde seit Oktober 2008 übrigens über 170 Mal angesteuert.
Allerdings erhebt die Wayback Machine keinen Anspruch auf Vollständigkeit. Nicht alle Inhalte und Unterseiten werden zwischengespeichert, gerade bei Bildern kann das Archiv mitunter sehr lückenhaft sein. Wer somit sämtlichen Content von alten Projekten wiederherstellen möchte, muss sich mitunter auf langwierige Suchen und Klickstrecken gefasst machen. Für Web-Archäologen ist es aber gewiss ein spannendes Tool und unterstreicht zudem die Wichtigkeit von regelmäßigen, entsprechend gesicherten Backups.