Standort: futurezone.ORF.at / Meldung: "Wie GeoCities archiviert wird"

Bild einer Festplatte

Wie GeoCities archiviert wird

WEB
02.05.2009|06:00

Demnächst wird Yahoo seinen Hosting-Dienst GeoCities schließen. Damit werden Terabytes echter "Homepages" aus der Frühzeit des ersten Web-Booms für immer aus dem Netz verschwinden. Ein Team von Web-Archivaren ist nun dabei, diesen Schatz der Popkultur für die Nachwelt zu bewahren.

"Die Feiglinge von Yahoo haben ganz heimlich, still und leise angekündigt, dass sie GeoCities dichtmachen werden", schreibt Jason Scott am 24. April in seinem Weblog. "Sie wollen diesen beinahe 20 Jahre alten Hosting-Dienst abschalten, der über die Jahre zur Heimat von Millionen Nutzern geworden ist." Für den begeisterten Sammler virtueller Artefakte aus dem frühen Web der 1990er Jahre war sofort klar: "Das ist ein Teil unserer Geschichte. Unserer Kultur. Es ist etwas, das ich für künftige Generationen bewahren möchte."

GeoCities wurde 1994 als Beverly Hills Internet gegründet. Die Firma wuchs im Boom des jungen Webs sehr schnell, für viele Menschen war das ab 1995 verfügbare Angebot, sich auf dem Server der Firma kostenlos eine Website einzurichten, eine erste Gelegenheit, sich am Aufbau einer eigenen Homepage zu versuchen. Es gibt dort die üblichen Sammlungen an "Under Construction"-Schildern und animierten GIFs, aber auch komplexe Websites von Hobbyisten, die in den jeweiligen Subkulturen als Referenz gegolten haben.

Ausdrucksmittel GeoCities

"Du bist zu GeoCities gegangen, um deine Ideen dem Publikum zu präsentieren", schreibt Scott. "Deine Aufzeichnungen über dein liebstes Hobby oder deine bevorzugte Verschwörungstheorie verließen zum ersten Mal die Festplatte deiner Windows-3.1-Kiste und wurden zu etwas, das du jedem Internet-Nutzer präsentieren konntest. In Farbe. Und zwar sofort." 1999 übernahm Yahoo GeoCities für rund 3,5 Milliarden US-Dollar. Der Plan, all die Enthusiasten-Websites über die Einblendung von Werbebannern und Textanzeigen zu monetarisieren, schlug fehl.

Scott rief Gleichgesinnte dazu auf, sich mit ihm im IRC-Channel #archiveteam zu treffen und Bandbreite sowie Speicherplatz für das Projekt zu organisieren. Schon am 26. April hatten er und das Team über 200.000 GeoCities-Websites gesichert, darunter die meisten Sites aus den Jahren vor 1999. "Wir wissen noch nicht, welches Datenvolumen GeoCities insgesamt hat", schreibt Scott auf Anfrage von ORF.at. "Einige schätzen, dass es bis zu 50 Terabyte sein können. Ich persönlich glaube, dass es nicht so umfangreich ist, ich vermute, dass wir es mit fünf bis 15 Terabyte zu tun haben."

Rackern auf der Kommandozeile

"Derzeit arbeiten rund 20 Leute im engeren Team mit", schreibt Scott an ORF.at. "Wir kommunizieren über unseren IRC-Channel." Die technischen Details des Archivierungsprozedere will er aber nicht preisgeben. "Sonst könnte noch jemand bei Yahoo auf die Idee kommen, gegen uns vorzugehen. Aber es läuft alles über ganz normale http-Verbindungen." Eines der im Einsatz befindlichen Tools ist das freie Datenübertragungsprogramm rsync.

Die wichtigste Frage, die sich heutzutage angesichts einer solchen Aktion aufdrängt, ist aber wohl die nach eventuellen Copyright-Problemen. "Die hätten wir nur dann, wenn wir die Websites spiegeln würden", so Scott. "Wir saugen aber nur die Daten ab und fertigen drei bis fünf redundante Kopien davon an. Wenn wir das Projekt abgeschlossen haben, werden wir fragen, ob Archive.org oder die Library of Congress eine Kopie davon haben wollen. Es kann sein, dass ein Teil der Sites wieder öffentlich übers Internet zugänglich gemacht wird."

Komplexe Strukturen

Angesichts der tief verschachtelten Struktur von GeoCities, toten Links und, wie es Scott ausdrückt, "verrückten Javascripts zur Anzeige von Werbung" ist es gar nicht so einfach, alle Inhalte zu finden und zu archivieren. "Ich weiß jetzt viel mehr über GeoCities, als ich jemals in Erfahrung bringen wollte", schreibt Scott, der sich durch die verschiedenen Schichten von Strukturen arbeiten muss, die GeoCities im Lauf der Zeit angelegt hat. So legte der Dienst zu Beginn noch traditionelle User-Homeverzeichnisse auf seinen Unix-basierten Systemen an. Später konstruierte man dann "Nachbarschaften", in denen beispielsweise Science-Fiction-Fans oder angehende Börsenmakler virtuell zusammenfinden konnten. Nach der Übernahme unternahm Yahoo eigene Versuche, den Hoster in seine Produktfamilie einzupassen.

Die Enthusiasten-Websites der 1990er schlossen sich auch gerne über die Grenzen der damaligen Hosting-Dienste hinaus zu Webrings zusammen. Die verbindenden Funktionen der privaten Websites und der Webrings werden heute hauptsächlich von Weblogs und Sozialen Netzwerken wahrgenommen. Diese werden die Archivare der Popkultur der 2000er Jahre sicher wieder vor ganz neue Aufgaben stellen.

(futurezone/Günter Hack)

Die ORF.at-Foren sind allgemein zugängliche, offene und demokratische Diskursplattformen. Die Redaktion übernimmt keinerlei Verantwortung für den Inhalt der Beiträge. Wir behalten uns aber vor, Werbung, krass unsachliche, rechtswidrige oder beleidigende Beiträge zu löschen und nötigenfalls User aus der Debatte auszuschließen. Es gelten die Registrierungsbedingungen.

Forum

 
  • in den geocities "briefcases"

    mben, vor 282 Tagen, 22 Stunden, 47 Minuten

    wurden damals erst files in splitarchiven geshared. szs war geocities der erste filehoster ^^

    • larzuk, vor 281 Tagen, 14 Stunden, 1 Minute

      stimmt. 10 MB online-speicher oder so.

      das waren noch zeiten...

  • tripod

    maxerl123, vor 282 Tagen, 23 Stunden, 20 Minuten

    viele begannen bei tripod.com.
    hat das auch jemand archiviert?

  • Terabytes?

    xderskalarvonperlx, vor 282 Tagen, 23 Stunden, 21 Minuten

    Das hört sich so wie ne Hand voll an. Ich glaub eher, dass es sich um ExaBytes handelt. 5 TBs haben die Kinder daheim schon an Raubkopienimages von DVDs. Und bei Geocities werden sicherlich auch in versteckten Foldern etliche Images bis zu Kinderpornos und Sprengstoffgürtelbastelanleitungen liegen. Bei vorsichtiger Schätzung komm ich auf 2,5 - 3 Zettabyte. Die Festplatten u. Raid-Hersteller werden sich die Hände reiben in der Krisenzeit!

    • muriem, vor 282 Tagen, 20 Stunden, 13 Minuten

      Warum muss ich dank des Internets soooooo ein Blödsinn lesen. Wieso kann ich beim ORF nicht einen User ausblenden?

    • @muriem

      sid666, vor 282 Tagen, 11 Stunden, 51 Minuten

      zum teil geht das: http://userscripts.org/scripts/show/32535

    • GeoCities entstand in den 90igern

      cptamerica, vor 282 Tagen, 11 Stunden, 23 Minuten

      daher ist die Schätzung von 5-15 Terrabyte schon eher realistisch. Man darf nicht vergessen dass damals etliche Leute noch mit 28er oder 56er Modems unterwegs war. Damals gab es noch keine ISOS's keine DVD's keine Massen an Raubkopien, damals war das Internet noch Internet und keine Illegale Zone.
      Daher werden diese "Homepages" meist nicht mehr als 500-1024 KByte insgesamt haben. Da es aber unzählig solcher Sites gibt, kommen trotzdem die Terrabyte zusammen.

  • *seufz*

    sunwalker2006, vor 283 Tagen, 4 Stunden, 50 Minuten

    Kindheiterinnerungen, nochmal 14 sein und mit dem Sidebuilder rumspielen..

  • clausdieter, vor 283 Tagen, 5 Stunden, 41 Minuten

    Als ich 13 Jahre jung war, erstellte ich meine erste eigene Homepage. Der Host war GeoCities. Ja, das waren noch Zeiten...

  • 1997

    datenpunk, vor 283 Tagen, 6 Stunden, 23 Minuten

    Meine erste "Homepage" auf GeoCities. Ich hatte das Windows Wolken Bitmap als Hintergrund gewählt und mich gewundert, wieso das Zeug so langsam ist...

    Geocities war echt eine freundliche Community und ich denke, dass es für viele der erste Schritt zur professionellen Web-Entwicklung war.
    1997 hatte es ja noch etwas anrüchiges "etwas mit Internet" zu machen :)

  • muriem, vor 283 Tagen, 7 Stunden, 7 Minuten

    zB das Phänomen Webring, das war zB in den 1990er ein wichtiges Konzept. Irgendwie komisch wie sehr es verschwunden ist... Ohne geocities lässt es sich vermutlich nicht mehr rekonstruieren.

    Ich persönlich glaub weniger, das soziale Netzseiten das übernommen haben, sondern die Suchmaschinen, liesen die in den 90er ja noch zu wünschen übrig, so war es für eine website wesentlich wichtiger als heute, links zu verwanden websites zu haben, damit ein user durch ein thema surfen kann. Heute gibt er den Oberbegriff nur noch in Google ein, und klickt sich dann seriell durch die von Google gemachte Reihenfolge durch.

  • Schatz der Popkultur?

    hardliner, vor 283 Tagen, 7 Stunden, 48 Minuten

    Warum sind das Schätze?

    • muriem, vor 283 Tagen, 7 Stunden, 12 Minuten

      Naja ob Schatz oder Trasch kann man streiten. Aber diese unachstamkeit mit Geschichte umzugehen ist in der Computerwelt schon bedenklich.

      Stellt euch vor, was wäre gewesen, wenn in den letzten 2000 Jahre auch die BÜcher jeweils von vor 10 Jahren alle "gelöscht" (verbrannt) worden wären. "Ist doch eh so alt, braucht doch keiner mehr"...

      Und viel was früher als unwichtig gegolten hat, sind jetzt Schätze der Geschichtswissenschaft, zB Tagebücher, alltägliche Briefe, usw.

      geocities war einmal ein wichtiger Drehpunkt in den jungen jahren der Entstehung des Webs. 15TB Daten, wieviel ist das in Euro ausgedrückt? Das ist doch nix, im vergleich zu dem was man verlieren würde.

      Klar ist keine Seite eine Shakespear, aber so einfach alles ausradieren, nur weils wir im moment nicht "verkaufen" können?

  • 15 Jahre = "fast 20 Jahre"?

    gululi, vor 283 Tagen, 7 Stunden, 55 Minuten

    interessant ;)

  • ach

    repent, vor 283 Tagen, 8 Stunden, 22 Minuten

    das waren noch zeiten. Die ersten versuche in HTML, die ewigen "under consruction" gifs ;)

    ich war aber leider nicht bei geocities sonder bei fortunecity, anno 2001. ich war voll begeistert das die einem 100 MB "schenken" ;)

    • :( :( ;(

      repent, vor 283 Tagen, 8 Stunden, 22 Minuten

      Wir bedauern es sehr Ihnen mitteilen zu müssen, dass die Dienste unter dem Domainnamen Fortunecity.de seit dem 01.05.2008 nicht mehr zur Verfügung stehen. Bitte wenden Sie sich in allen Angelegenheiten an Ihren Vertragspartner,

      :(