Oft besteht der Bedarf, alte Webseiten zu finden oder alte In­ter­net­sei­ten wie­der­her­zu­stel­len. Mithilfe von Tools wie der Wayback Machine, dem Google-Cache oder WebCite können Sie alte Webseiten aufrufen, alte In­ter­net­sei­ten wie­der­her­stel­len oder eine alte Homepage finden.

Profi-Website in Sekunden dank KI.
  • Profi-Website in Sekunden dank KI
  • Aus tausenden Vorlagen auswählen
  • 30 Tage kostenlos testen

Warum kann es sinnvoll sein, alte In­ter­net­sei­ten wie­der­her­zu­stel­len?

  • Offline-Seiten: Tech­ni­sche Probleme oder ge­kün­dig­te Hosting-Dienste machen Inhalte un­zu­gäng­lich – Archive sichern diese Inhalte. So lassen sich alte Webseiten aufrufen, auch wenn die Ori­gi­nal­sei­te nicht mehr existiert.
  • Recherche & Quel­len­prü­fung: Jour­na­lis­ten, Blogger und Wis­sen­schaft­ler können frühere Versionen nach­prü­fen und nach­voll­zieh­bar zitieren.
  • SEO-Zwecke: Ar­chi­vier­te Inhalte helfen, Links zu prüfen, Än­de­run­gen zu do­ku­men­tie­ren und die Link-Power alter Domains zu nutzen.
  • Recht­li­che Be­weis­si­che­rung: Screen­shots und ar­chi­vier­te Inhalte dienen als Nachweis bei Be­lei­di­gun­gen, Be­dro­hun­gen oder Ar­beits­rechts­pro­zes­sen.

Internet-Archive-Projekt: Alte In­ter­net­sei­ten und mehr

Das Internet Archive ist ein Non-Profit-Projekt von Brewster Kahle, das seit 1996 digitale Inhalte ar­chi­viert. Kernstück ist die Wayback Machine, mit der Sie alte Webseiten aufrufen und his­to­ri­sche Screen­shots, Texte, Bilder oder Videos einsehen können. Die frühesten ge­spei­cher­ten Websites stammen aus dem Jahr 1996. Die Wayback Machine enthält über 300 Mil­li­ar­den ar­chi­vier­te Seiten. So lassen sich alte In­ter­net­sei­ten wie­der­her­stel­len und alte Webseiten finden.

Neben Webseiten sammelt das Internet Archive auch:

  • Texte und Bücher
  • Au­dio­auf­zeich­nun­gen, darunter Live-Konzerte
  • Videos und TV-Beiträge
  • Bilder
  • Software-Programme

Die Inhalte stammen aus dem Gemeingut oder werden von Rech­te­inha­bern gespendet. Viele Inhalte kommen von Uni­ver­si­tä­ten, Re­gie­rungs­or­ga­ni­sa­tio­nen oder Di­gi­ta­li­sie­rungs­pro­jek­ten wie Project Gutenberg und LibriVox.

Wayback-Machine-Tutorial: Alte Webseiten finden und ar­chi­vie­ren

Wenn Inhalte Ihrer Website verloren gehen oder Sie frühere Versionen einer Seite einsehen möchten, hilft die Wayback Machine. In nur wenigen Schritten können Sie alte Webseiten wie­der­fin­den, alte In­ter­net­sei­ten aufrufen und sogar eigene Seiten ar­chi­vie­ren.

Schritt 1: URL direkt eingeben

Geben Sie die ge­wünsch­te Domain in die obere Such­leis­te ein und drücken Sie Enter, um direkt zur Er­geb­nis­sei­te zu gelangen.

Bild: Suchleistenfunktion der Wayback Machine
Tippen Sie die URL der Website, die Sie suchen, einfach in die Such­leis­te ein.

Schritt 2: Wayback-Haupt­sei­te aufrufen

Klicken Sie auf das gelbe Web-Icon, um zur Haupt­sei­te zu gelangen. Dort können Sie eine Domain-URL eingeben und auf „Browse History“ klicken, um ar­chi­vier­te Versionen zu sehen.

Bild: Archiv der Wayback Machine
Klicken Sie sich durch das Archiv der Wayback Machine.

Schritt 3: Nach Stich­wor­ten suchen

Geben Sie einen Such­be­griff in die untere Such­leis­te ein und wählen Sie „search archived web sites“. Klicken Sie auf „Go“, um die Tref­fer­lis­te zu erhalten, die Domain, Be­schrei­bung, Snapshots und Me­di­en­auf­nah­men anzeigt.

Bild: Stichwortsuche
Wählen Sie hier Kriterien aus, anhand denen Sie eine Website suchen wollen.
Fakt

Ein Snapshot ist eine Mo­ment­auf­nah­me einer Website. Dy­na­mi­sche Elemente wie Formulare funk­tio­nie­ren darin nicht, die Inhalte können aber gelesen oder kopiert werden.

Schritt 4: Timeline und Snapshots nutzen

Für jede ar­chi­vier­te URL zeigt die Wayback Machine eine Timeline mit Säulen für die Anzahl der Snapshots pro Datum. In der Ka­len­der­an­sicht sind die Snapshots farb­co­diert:

  • Blau: er­folg­rei­cher Crawl
  • Grün: Um­lei­tun­gen
  • Orange: nicht gefundene URL (4xx)
  • Rot: Server-Fehler (5xx)

So nutzen Sie die Timeline:

  1. Klicken Sie auf ein farbig mar­kier­tes Datum.
  2. Wählen Sie den ge­wünsch­ten Timestamp, um den Screen­shot der ar­chi­vier­ten Website zu sehen.
  3. Na­vi­gie­ren Sie innerhalb der Seite wie gewohnt und kopieren Sie Inhalte bei Bedarf.
Bild: Darstellung der Seitenaufnahmen von gutenberg.org
Die grünen und orangen Kreise zeigen an, dass die Crawler bei min­des­tens einem Versuch eine Umleitung re­gis­trier­ten, re­spek­ti­ve die URL nicht fanden. Das muss aber nicht auf jeden Versuch an dem Tag zutreffen.

Schritt 5: Eigene Website ar­chi­vie­ren (Self-Snapshot)

Nicht jede Website wird au­to­ma­tisch ar­chi­viert. Gründe können sein:

  • Ein noindex-Tag oder ein ent­spre­chen­der Eintrag in der robots.txt ver­hin­dern In­de­xie­rung
  • Pass­wort­ge­schütz­te Inhalte
  • Manuelles Entfernen aus dem Archiv
  • Dy­na­mi­sche Inhalte, die nicht korrekt erfasst werden

So sichern Sie Ihre Website:

  1. Gehen Sie zur Wayback Machine-Haupt­sei­te.
  2. Nutzen Sie das Feld „Save Page Now“ und geben Sie Ihre Domain ein.
Bild: Eigene Website speichern
Geben Sie hier Ihre Domain ein, um die Website zu speichern.
  1. Nach kurzer Zeit erstellt die Wayback Machine einen Snapshot, der dauerhaft ge­spei­chert wird. So können Sie alte Webseiten aufrufen, auch wenn die Live-Seite später nicht mehr verfügbar ist.
Tipp

Für weniger bekannte oder regionale Websites lohnt es sich, re­gel­mä­ßig eigene Snapshots zu erstellen.

Wie lädt man alte Webseiten herunter?

Für die wei­ter­ge­hen­de Nutzung, z. B. Quellcode, Links oder SEO-Tests, gibt es Tools wie:

  • Wayback-Machine-Down­loa­der (GitHub, Open Source): Lädt HTML-Dateien, Medien und Index-Seiten herunter.
  • Ar­chi­va­rix (Web-basiert): Kostenlos für Websites mit bis zu 200 Dateien; ZIP-Download nach Re­gis­trie­rung.
  • HTTrack Website Copier: Klas­si­sches Tool, um ganze Websites her­un­ter­zu­la­den (auch Archiv-Seiten, wenn Sie die Wayback-URLs angeben).

Archive.org selbst bietet keinen Website-Down­loa­der an, erlaubt aber das Her­un­ter­la­den von Texten, Bildern und Au­dio­da­tei­en, wenn die Rechte vorliegen.

Al­ter­na­ti­ve 1: Nicht ganz so alte Webseiten finden – mit der Google-Suche

Ist die gesuchte In­for­ma­ti­on noch relativ aktuell, kann eine einfache Google-Suche aus­rei­chen. Google-Crawler erfassen Webseiten ähnlich wie die Wayback Machine und speichern einen Snapshot im Cache. Dieser zeigt die zuletzt in­de­xier­te Version der Seite. Fällt die Live-Webseite kurz­zei­tig aus, kann der Cache weiterhin genutzt werden. Im Vergleich zu archive.org ist dieser Snapshot oft aktueller, al­ler­dings existiert nur ein Zeitpunkt (Timestamp) pro Version.

Um die gecachte Version einer Seite auf­zu­ru­fen, können Sie direkt den folgenden Befehl in der Adress­zei­le Ihres Browsers verwenden:

http://webcache.googleusercontent.com/search?q=cache:https://www.DOMAIN.com

Dabei ersetzen SieDOMAIN.com durch die ge­wünsch­te URL. Beachten Sie, dass auch Google-Snapshots dy­na­mi­sche Elemente oder Me­di­en­in­hal­te größ­ten­teils nicht anzeigen.

Tipp

Selbst wenn eine Seite auf noindex gesetzt ist und nicht in den Such­ergeb­nis­sen erscheint, kann der Cache manchmal noch eine ältere Version be­reit­stel­len.

Al­ter­na­ti­ve 2: Zugriff auf bereits ar­chi­vier­te Webseiten – mit WebCite

WebCite er­mög­licht es, auf bereits ar­chi­vier­te Webseiten zu­zu­grei­fen und diese zu zitieren. Aktuell werden jedoch keine neuen Ar­chi­vie­rungs­an­fra­gen mehr ak­zep­tiert. Bereits ar­chi­vier­te Snapshots können weiterhin auf­ge­ru­fen und in Quel­len­an­ga­ben genutzt werden. So lassen sich alte In­ter­net­sei­ten wie­der­her­stel­len und alte Webseiten aufrufen.

Um auf eine ar­chi­vier­te Version einer Website zu­zu­grei­fen, besuchen Sie die WebCite-Website und verwenden die Such­funk­ti­on, um die Domain oder die Snapshot-ID ein­zu­ge­ben. So können Sie ältere Versionen von Webseiten einsehen, die bereits ar­chi­viert wurden, und diese un­ver­än­der­bar als Quelle angeben.

Bild: Suchfunktion von WebCite
Geben Sie im Suchfeld die URL der Domain, die Sie suchen, an.
Zum Hauptmenü