Gutenberg II: 5 Mio. Seiten und mehr als 27’000 Bücher unter www.freearchives.ch/demo
Pfaffhausen, 20. Mai 2009: Im Jahre 2004 benötigten wir für eine Testdatenbank Daten. Dabei sind wir auf das Projekt Gutenberg aufmerksam geworden. Beim Projekt Gutenberg werden alte (copyrightfreie) Bücher gescannt und neu gesetzt. Die Resultate werden im Internet zum freien Download veröffentlicht. Das Projekt wurde bereits 1971 ins Leben gerufen und leider ist das Benutzerinterface nicht unbedingt eine Augenweide. Im besten Falle können die Texte als HTML-Datei betrachtet werden, eine Freitextsuche gibt es nicht.
Gutenberg I: Ein erster Versuch im Jahre 2004
Aus diesem Grunde realisierten wir im Jahre 2004 eine Testdatenbank mit ca. 2 Millionen Seiten und stellten die Bücher zum Download bereit. Mehr Informationen zum Projekt finden Sie im damaligen Positionspapier. Der Erfolg damals war etwas zwiespältig. Zwar wurden die Bücher gut und gerne bezogen, eine aktivere Mitarbeit durch die Community ist allerdings nicht zustande gekommen.
Immerhin, das Testarchiv diente uns später bei der Entwicklung der ArchivistaBox als wertvolle Testumgebung. Leider (die ArchivistaBox-Systeme hatten Priorität) haben wir die damalige Gutenberg-Datenbank nie auf die endgültige ArchivistaBox migriert. Weiter hatte die damalige Lösung den Nachteil, dass nur die Texte der Bücher (ohne die Illustrationen) veröffentlicht wurden.
Verein freearchives.ch realisiert Gutenberg II
Im Jahre 2006 habe ich als Mitinitiator den Verein freearchives.ch ins Leben gerufen. Der Verein bezweckt die Förderung der Archivierung langlebiger Daten. Nachdem in den letzten zwei Jahren eine stattliche Anzahl an Mitgliedern zum Verein gestossen sind, hat der Verein bisher einige OpenSource-Projekte (z.B. exactimage) unterstützt.
Dank viel Fronarbeit kann der Verein freearchives.ch heute eine rundum erneuerte Version, d.h. Gutenberg II auf dem Vereinsrechner präsentieren. So finden sich neu unter freearchives.ch/demo mehr als 27’000 Bücher mit ca. 5 Millionen von Seiten. Im Zeitalter, wo der Markt für digitale Bücher fast ausschliesslich durch einen Player dominiert wird, mögen 27’000 Bücher nicht unbedingt herausragend erscheinen. Allerdings möchte ich doch die folgenden Pluspunkte bei freearchives.ch/demo anführen.
Darum ist www.freearchives.ch/demo eine offene und freie Lösung
a) Die Lösung basiert auf OpenSource. Bei freearchives.ch/demo kommt eine Standard-ArchivistaBox zum Einsatz. Ich denke, dieser Punkt wird heute vernachlässigt. Zwar beteuern grosse Player immer wieder, wie wichtig ihnen OpenSource sei, doch die eigenen Sourcen veröffentlichen, davon ist kaum je die Rede. Wie soll eine Lösung aber langfristig funktionieren, wenn die Verfügbarkeit genau von einer (juristischen) Person bzw. den dahintersteckenden Aktionären) abhängt?
b) Die Lösung läuft auf einem einzigen kleinen Box-Rechner. Im Zeitalter, wo fast überall Data-Centers aus dem Boden spriessen, mag das als wenig beeindruckend erscheinen. Bendenken wir aber, was für einen Aufwand es bedarf, Data-Centers bzw. Cluster am Leben zu erhalten, so erscheint uns ein einfachster Betrieb für eine langfristig ausgelegte Lösung allerdings nach wie vor matchentscheidend.
c) Werbefreie Inhalte: Zwar ist heute vieles auf dem Netz gratis, inklusive ständiger Bewerbung. Wer allerdings genauer hinsieht, wird schnell entdecken, dass frei nicht gleich frei bedeutet. Was heisst nun nichtkommerzieller Inhalt und warum darf ich den Inhalt nur als Privatperson beziehen? All diese Einschränkungen sollten nicht sein, müssen nicht sein. Zwar wird auch freearchives.ch/demo ein Minimum an Kosten verursachen, aber offen gestanden sind diese für die nächsten Jahre bereits heute durch die Mitgliederbeiträge problemlos gedeckt.
Nun aber wünschen wir viel Spass mit Gutenberg II. Denn wie gesagt, statt störender Werbeeinblendungen können Sie die Bücher ganz ohne Plugins online lesen. Oder, seien wir ehrlich, falls Sie ein Buch wirklich lesen möchten, werden Sie es wohl offline als PDF-Datei ausdrucken. Dazu ein Tipp zum Ausdrucken: Die Bücher wurden so erzeugt, dass Sie von A4 nach A5 verkleinert eine optimale Schriftgrösse enthalten.
Und noch etwas, falls Sie die Daten auf einer USB-Festlatte erhalten möchten, dann laden wir Sie herzlich dazu ein, Mitglied beim Verein freearchives.ch zu werden. Sobald Sie die Bestätigung zur Mitgliedschaft erhalten (das kann einige Zeit bzw. Wochen Zeit in Anspruch nehmen), können Sie die Daten auf einer USB-Festplatte (>400GB) beziehen. Oder noch besser, helfen Sie dem Verein freearchives.ch mit, das Online-Archiv zu erweitern.