Wordpress-Plugin des Internet Archive erweckt tote Links

vor 7 Stunden 1

Das Internet Archive hat in dieser Woche ein neues Plugin für Wordpress veröffentlicht. Die Software namens „Internet Archive Wayback Machine Link Fixer“ untersucht die Wordpress-Seite auf tote Links. Werden diese gefunden, und gibt es eine archivierte Version im Archiv, so leitet der Link künftig dorthin um. Eine bisher nicht archivierte Seite wird, sofern sie noch existiert, dann auch vom Internet Archive indiziert. Das Plugin hilft also auch dem Archivprojekt, seinen Datenbestand zu vervollständigen. Ob auch die eigene Wordpress-Installation indiziert werden soll, kann man selbst bestimmen.

Wie das Archive in seiner Vorstellung des Plugins schreibt, kann das bei umfangreichen Wordpress-Seiten einige Tage dauern. Ist die Überprüfung einmal abgeschlossen, so soll die Last auf die Systeme deutlich geringer ausfallen. Ein Link gilt als tot, wenn er bei den wöchentlichen Prüfungen des Archive dreimal in Folge unerreichbar ist. Wie bei allen Suchbots erlauben aber nicht alle Webseiten eine Indizierung durch das Internet Archive. Einen API-Key für das Archive benötigt das Plugin nicht, ist einer vorhanden, können die eigenen Seiten schneller indiziert werden.

Das Plugin soll dabei helfen, den entgegen der häufigen Behauptung „das Internet vergisst nichts“ durchaus existierenden Datenverlust im Web einzudämmen, hier den Effekt des „link rot“. Laut einer Studie von Pew Research aus dem Jahr 2024 waren in den vorherigen zehn Jahren 38 Prozent der Webseiten verschwunden, die noch 2013 existierten. Untersucht wurde also der Zeitraum von 2013 bis 2023. Überall, wo die Forscher suchten, ob etwa bei Wikipedia, journalistischen Angeboten oder Seiten von Behörden, fanden sich tote Links.

Informationen und deren Entwicklung nachzuvollziehen, wird so auf Dauer immer schwieriger. Manche Unternehmen, wie etwa Twitter nach der Übernahme durch Elon Musk, entziehen sich zunehmend durch Einschränkungen ihres API-Zugangs oder des Zugriffs ohne Account auch der Forschung und Archivierung.

Das zusammen mit Automattic, dem Inhaber von Wordpress, entwickelte Tool lässt sich bei wordpress.org herunterladen. Quellen und Dokumentation finden sich bei Github.

(nie)

Gesamten Artikel lesen