Google-Cache und archive.org: verlorene Inhalte finden

Um sich den Google-Cache oder das Internet-Archiv anzuschauen gibt es mehrere Gründe. Einer der Gründe ist es, wenn man wissen möchte, wie eine Website in der Vergangenheit ausgesehen hat. Also aus Gründen der Web-Archäologie. 🙂

Ein anderer Grund warum man diese beiden Quellen aufsucht ist wenn alle anderen Maßnahmen versagt haben. Es kommt zu Problemen auf der Website, Inhalte gehen durch Update des Systems verloren und das Backup ist beschädigt oder nicht komplett.

In so einem Fall können der Cache von Google oder das Internet-Archiv helfen. Betonung liegt hierbei bei können, aber darauf gehe ich gleich noch näher ein.

Google Cache: schneller, aber vergesslicher Helfer

Die schnellere Variante ist das Google-Cache. Wenn man von einer bestimmten Adresse den Cache sehen möchte, dann ruft man die besagte URL folgendermaßen auf:

http://google.com/search?q=cache:www.deine-url.xyz

Wenn man jetzt Glück hat, dann liefert Google ein Ergebnis mit dem man etwas anfangen kann: Inhalte, wie sie vor dem Missgeschick aussahen. Das Ergebnis im folgenden Screenshot ist nur zwei Tage alt:

Google-Cache im Einsatz

Mit so einem Ergebnis kann man arbeiten und die Texte, Bilder und weitere Inhalte entnehmen. Allerdings darf man nicht zu optimistisch an das Ganze herangehen. Manchmal kommt das CSS nicht ganz mit, nicht von jedem Blog-Artikel gibt es einen Cache und in der Regel ist es so, dass nach ein bis zwei Wochen Google den Cache erneuert. Also ist Eile angesagt, wenn man die Inhalte retten möchte.

archive.org: das Langzeitgedächtnis

Findet man beim Google-Cache keine Ergebnisse, keine Panik, tief durchatmen und Internet-Archiv auch bekannt als Wayback Machine ansteuern. In, so weit ich das erkennen kann, unregelmäßigen Zeitabständen steuert der Crawler die Websites an und macht Kopien von denen. Wenn man sich folgende Abbildung anschaut, dann sieht man…

Internet-Archiv einer Website

… dass der Crawler von archive.org meine geschäftliche Website, seit September 2002 mehr als 650 Mal angesteuert hat. Die einzelnen Besuche werden auf Jahres-Kalendern abgebildet. Je älter eine Website ist, umso höher ist die Chance das man hier seinen alten Inhalte findet.

Das Fazit oder tl;dr

Sowohl Google-Cache als auch das Internet-Archiv können einem viele, viele Nerven retten. Dennoch sollte man sich nicht auf diese Tools verlassen. Besser ist es man baut auf vollständige Backups auf und spart sich diese beiden Werkzeuge nur für den absoluten Notfall auf. Denn auch wenn man das Glück haben sollte, alle Inhalte wieder zu finden, so ist es eine extrem mühsame Arbeit diese herauszufischen.

Diesen Blogartikel teilen:

Geschrieben von

Vladimir Simović, arbeitet seit 2000 mit HTML und CSS und seit Januar 2004 mit WordPress. Im Laufe der Jahre hat er diverse Fachbücher und Fachartikel publiziert. Weiterlesen…

3 Gedanken zu „Google-Cache und archive.org: verlorene Inhalte finden“

  1. Archive.org habe ich selbst schon benutzt, um ein altes Projekt von mir nach Jahren wieder aufleben zu lassen. Ich hatte es damals nicht archiviert, weil ich nicht dachte, dass es nochmal relevant wird. Es war ein kleines Projekt über meinen Heimatort mit nur wenigen Unterseiten. Ich konnte die Texte „kopieren“ und dann aktualisieren.

    Bei Archive.org muss man aber Glück haben, dass man einen brauchbaren „Snapshot“ findet. Bei vielen Projekten hat man da auch Pech.

    Vor allem nutze ich den Service vor der Registrierung einer neuen Domain. Der Erfolg eines neuen Projekts hängt ja auch von der Geschichte der Domain ab. War eine Domain geparkt oder anders minderwertig projektiert, lasse ich meistens die Finger davon.

    Den Google-Cache habe ich noch nicht genutzt.

    Antworten
    • Hallo Sebastian,

      wieder aufleben lassen von alten Projekten ist auch ein wichtiger Aspekt. Mir fällt ein, dass ich beim Aufleben eines alten Projektes ebenfalls bei einigen Unterseiten auf Internet-Archiv angewiesen war.

      Antworten

Schreibe einen Kommentar zu Google Cache - Seiten anzeigen, löschen & Alternativen – Datenwachschutz.de Antworten abbrechen