Dokumenten-Management für die Ewigkeit
Egg, 31. März 2022: In diesen Tagen feiert die Archivista GmbH ihr 25-jähriges Bestehen. Seit nunmehr einem Vierteljahrhundert gibt es unsere Lösungen auf dem Markt. In einer globalisierten Zeit, indem sich viele an die Versprechen von gestern schon heute oder spätestens morgen nicht mehr erinnern, sind 25 Jahre ein stolzer Beweis der Kontinuität. Dabei geht es nicht nur um Versprechen, Daten über Jahrzehnte sauber verfügbar zu halten, sondern auch um die Philosophie, Datenstrukturen so zu pflegen, dass eine solche Langlebigkeit erst möglich wird. Nachfolgend erfolgt zum Jubiläum ein Rückblick über die Firmengeschichte mit einem Ausblick in die Zukunft. Unserer treuen Kundschaft möchten wir zudem ein kleines Präsent überreichen.
Die Archivista-Story beginnt weit vor 1998…
In den früher 90er-Jahren des vergangenen Jahrhunderts gab es in KMU-Unternehmen zwar durchaus bereits flächendeckend Computer, doch letztlich wurden erstellte Dokumente in einer Gewohnheit zu Papier gebracht und mit der Post versandt, dass die Papierberge nicht gerade zum Himmel wuchsen, aber dennoch Archivregal um Archivregal füllten. Die Festplatten der Computer bewegten sich bei einigen wenigen GBytes, wer mehr als paar MByte RAM hatte, war in der Oberklasse unterwegs. Wer einen Scanner hatte, lebte gut und gerne damit, dass das Erfassen einer A4-Seite eine Minute oder mehr Zeit in Anspruch nahm. Die Texterkennung (OCR) steckte in den Anfängen.
Und doch war bereits im Jahre 1990 dieser Traum, alle in Papierform vorliegenden Informationen digitalisiert auf dem Computer verfügbar zu haben. Letztlich begann das Projekt damit, irgendwelche Makros in Photoshop so zu programmieren, dass das Erfassen und Finden der Scans einfacher und schneller funktionierte. Kurz und gut, die Handarbeit sollte minimalisiert werden. Schnell musste erkannt werden, dass bereits bei einigen Hundert Dateien die Recherche nicht nur mühsam, sondern sogar zeitaufwändiger wurde, als die damaligen Papierordner von Hand zu sichten.
Jahre 1993-1998: Das Suchen nach der idealen Lösung
So entstand 1993 die erste Software, um den gescannten Belegen in einer Datenbankmaske strukturiert Begriffe zuweisen zu können. Zunächst war nicht geplant, dass daraus ein Produkt entstehen sollte. Vielmehr war irgendwann der Zeitpunkt gekommen, wo die eigens erstellte Lösung durch ein Produkt ersetzt werden sollte. In der Schweiz war damals die Orbit-Computermesse das Mass aller (neuen) Errungenschaften. Leider jedoch hatten alle einigermassen zahlbaren Lösungen den Nachteil, dass die Grösse des Archivs durch die Grösse der Festplatte limitiert waren.
Zwar gab es CD-Brenner, um 700 MByte an Daten auf einer nicht wiederbeschreibbaren CD auszulagern. Die Hersteller winkten ab. Es sei nicht langlebig, es gebe keine Standards dafür, die CD sei zu langsam, es sei zu kompliziert etc… Heute darf angefügt werden, die damalige CD kann nach wie vor gelesen werden. Und auch wenn mittlerweile 100 GB pro Scheibe archiviert werden können, so sind die Argumente der Hersteller gegen das Auslagern der Daten geblieben. Es lohne sich nicht, redundante Festplatten und das Auslagern der Daten in die Cloud seien viel sicherer. Es scheint fast so, als die Argumente gleich bleiben…
1998-2000: Firmengründung mit Archivista Version 4.x
Ende März 1998 war es soweit. Die erste Archivista-Lösung konnte käuflich erworben werden. Über die Anfänge unserer Lösung erinnert unser Web-Museum. Der Anfang war nicht gerade einfach. Schon damals galt, eine Schweizer Standard-Softwarelösung, wie geht denn dies? Der Country-Manager eines japanischen Konzerns, der bis heute Dokumenten-Scanner verkauft, zitierte mich zu sich und wollte mir klarmachen, es sei verrückt, ein Produkt für einige Hundert Franken auf den Markt zu bringen.
Besser agierte da der Landesvertreter von Kodak. Mit viel Fingerspitzengefühl sondierte er, ob sich die Firma Archivista GmbH nicht in den Konzern integrieren liesse. Es kam gar zu einer Partnerschaft. Die Firma Archivista GmbH kaufte die Texterkennung bei Kodak Schweiz ein, und wir verkauften die Archivista-Lösung an Kodak, damit diese ein KMU-Produkt im Angebot hatte. Ein halbes Jahr später rief er an, noch heute müsse die Rechnung zugeschickt werden, dann würde er diese morgen noch in die Wege leiten, die Schweizer Niederlassung werde in einigen Tagen “geschlossen”. Zehn Jahr später sollte es Kodak gar nicht mehr geben… So sehr die damalige Übernahme durch den Riesen gelockt hatte, so sehr wären die Archivista-Lösungen damit früher oder später wohl vom Markt verschwunden.
Eine weitere kleine Anekdote sei hier angefügt: Ein Mitarbeiter einer Schweizer Bank wollte eine Archivista-Lösung bestellen. Offenbar konnte er sich bei den Vorgesetzten nicht wirklich durchsetzen, was ihn am 25. Mai 2000 dazu veranlasste, mit dem kopiertem Logo der Bank ein System über mehrere Tausend Franken zu bestellen. Die Bank zahlte anstandslos, jedoch der Mitarbeiter musste seinen Posten räumen — und das Projekt versandete. Damals war die Enttäuschung bei der Archivista GmbH recht gross, heute ist bekannt, besagte Bank verschwindet aktuell gerade von der Bildfläche. Auch wenn Grosskonzerne als Kunden ihren Reiz haben, so entspricht es wohl eher der Philosophie unserer Produkte, wenn diese von einer KMU für KMUs entwickelt und gepflegt werden.
Und noch etwas sei aus dieser Zeitspanne berichtet. Eine grosse Zeitschrift testete die Archivista-Lösung damals und befand, die Daten würden für die Ewigkeit eingemottet. Dies löste damals bei uns jetzt nicht wahnsinnige Begeisterungstürme aus. Rückblickend betrachtet darf bis heute festgehalten werden, Daten über Jahrzehnte mit dem richtigen “Pflegemittel” (sprich ArchivistaBox) verfügbar zu halten, ist keine Kleinigkeit und ergibt nach 25 Jahren Firmengeschichte nunmehr den richtigen Kontext.
2001-2010: Von Archivista zur ArchivistaBox
Die Archivista-Lösungen wurden ursprünglich für Windows entwickelt. Mit den Jahren musste leider die Erfahrung gemacht werden, dass Windows für unsere Produkte je länger je mehr schwieriger zu warten und pflegen war. Ebenso zeichnete sich am Horizont ab, dass das Internet seinen Siegeszug früher oder später antreten würde.
Aus diesem Grunde positionierten wir zunächst 2001 die Datenbank und in den Jahren 2004 bis 2007 die gesamte Lösung plattformunabhängig(er). Dies führte dazu, dass wir heute faktisch ausschliesslich von und mit Open Source Produkten arbeiten.
Als wir 2004 Linux als Plattform für die ArchivistaBox auserkoren, war das ein mutiger Entscheid. Niemand ging damals davon aus, dass dereinst einmal die Mehrheit aller Computer-Devices mit Linux laufen würden. Und ebenfalls ging niemand davon aus, dass sämtliche Tech-Konzerne bzw. deren Geschäftsmodelle ohne Linux nicht funktionieren würden.
Unsere Lösungen dienen aber im Unterschied zu diesen Riesen nicht dazu, möglichst viele Daten unserer Kunden zu sammeln, um diese kommerziell “auszuschlachten”. Unsere Produkte dienen dazu, dass unsere Kunden ihre Daten eigenständig verwalten können und darüber jederzeit die Hoheit haben. Kurzfristig mag das wenig(er) Gewinn abwerfen. Mittel- bis langfristig wird sich zeigen, welche Unternehmen über mehr Substanz verfügen. Jene, welche über eine hohe Autonomie ihrer Daten verfügen, oder jene, die entweder davon leben, über die Daten anderer Unternehmen zu verfügen oder davon abhängig zu sein.
2011-2018: Die ArchivistaBox wird erwachsen
Waren die Archivista-Produkte ursprünglich reine Softwarelösungen, so änderte sich dies mit dem flächendeckenden Einsatz der ArchivistaBoxen. Plötzlich galt es, nicht nur dafür besorgt zu sein, dass Archivista als Dokumenten-Management-Software einwandfrei lief, sondern auch der Unterbau, kurz und gut, die gesamte ArchivistaBox musste gepflegt und “gehegt” werden.
Dies führte in den Jahren ab 2010 dazu, dass eine vertiefte Auseinandersetzung im Zusammenspiel zwischen Betriebssystem und darauf aufbauender Software erfolgte. Daraus ist eine eigene komplett im Hauptspeicher laufende Linux-Distribution entstanden. Erst damit wurde es uns möglich, die ArchivistaBox mit minimalem Aufwand zu pflegen. Dadurch, dass das Betriebssystem bei jedem Start komplett automatisiert aufgebaut wird, erübrigt sich die Installation. USB-Stick oder ISO-Datei ab Festplatte starten, binnen einigen wenigen Sekunden steht eine jede ArchivistaBox zum Arbeiten bereit. Updates gibt es dadurch keine mehr. Einfach neuen USB-Stick oder ISO-Datei zum Starten verwenden, und das ist es dann auch schon.
Diese Automatisierung ist bis heute auf dem Markt einmalig, und sie wird bis heute auch kaum wahrgenommen. Die Anwender/innen merken die “Magie” nicht, weil sie ja gar nicht erst erkennen, was beim Starten der ArchivistaBox anders läuft und die Fachwelt scheint bis heute lieber tagtäglich Tausende von Paketen hin- und herzuschaufeln. Sei es, weil es Gewohnheit ist, sei es, weil durch diese Komplexität niemand mehr lokale Server betreiben will und sich damit umso einfacher Cloud-Lösungen propagieren lassen.
Diese Auslagerung der Daten und Dienste führt aber dazu, dass letztlich gerade kein autonomes Arbeiten mehr möglich ist. Die Zukunft wird zeigen, ob mit Cloud-Lösungen Datenbestände über mehrere Jahrzehnte sicher “beherrschbar” bleiben werden. Eine gewisse Skeptik wäre hier durchaus (sehr pragmatisch betrachtet) angebracht. So ist z.B. relativ einfach, die täglichen Datenvolumen an jeden Punkt der Welt zu transferieren. Schwieriger bis unmöglich ist es, z.B. nur schon einige Dutzend GByte geschweige denn TByte innert nützlicher Zeit (z.B. einige Stunden) wieder zurück auf die lokale Instanz zu kopieren.
Aktuell lassen sich ca. 1 TByte pro Stunde von Festplatte zu Festplatte konventioneller Bauart kopieren, bei SSD-Platten sind es pro Stunde ca. 2 TByte und bei NVME können (freilich nur über die richtigen Schnittstellen) bis über 10 TByte pro Stunde sowohl gesichert (Backup) als auch wiederhergestellt (Restore) werden. Ein solcher Datendurchsatz ist im Netz nach wie vor unvorstellbar. Natürlich darf hier angeführt werden, dass nur wenige KMU Datenbestände mit mehreren TByte haben. Dies aber auch nur solange als nur “normale” Daten (Dokumente, Bilder) vorliegen, bei multimedialen Daten hingegen sind einige TByte schnell erreicht.
2019-2023: Multimediale Archive und mehr
Damit sind die letzten 5 Jahre der Firmengeschichte erreicht. Im Jahre 2018 veröffentlichten wir zum 20-jährigen Bestehen der Firma die multimediale Linux-Distribution AVMultimedia. Damals war nicht geplant, dass die ArchivistaBox je multimedial werden würde. Jedoch, in den letzten Jahren zeigte sich eindrücklich, wie stark multimediale Inhalte herkömmliche Informationen auf die Seite schieben, wenn nicht gar verdrängen.
So wurden früher beispielsweise allenthalben Presseerklärungen veröffentlicht. Heute gibt es fast nur noch Live-Streams. Aktuelles Beispiel: Das Ende der CreditSuisse wird am Sonntagabend zur besten Sendezeit direkt aus dem Bundeshaus in die gesamte Welt hinaus gestreamt. Wer dazu eine dazu passende Presserklärung sucht, findet lauter Links auf die Streams.
Diese Wandlung vom herkömmlichen Dokumenten Management (DMS) hin zu einem Multimedia Managment System (MMS) ist anspruchsvoll, fallen mit multimedialen Daten um mehrere Faktoren grössere Datenbestände an. Für unsere ArchivistaBoxen bedeutet dies, dass die aktuellen Box-Systeme über deutlich mehr Kapazität verfügen als dies noch vor wenigen Jahren der Fall war.
Neben den multimedialen Fähigkeiten unserer Lösungen bildet die Automatisierung einen weiteren Schwerpunkt der letzten fünf Jahre. Vor dreissig Jahren war es oft so, dass die Mehrheit der Belege gescannt und beschlagwortet werden musste. Heute werden bereits zwischen 60 und 95 Prozent der Dokumente digital angeliefert und automatisiert verarbeitet. Nebem dem klassischen 1D-Barcode enthalten viele Dateien heute 2D-Barcodes (QR-Codes).
Die Herausforderung besteht hier darin, dass digital angelieferte Dokumente schubweise anfallen, d.h. wurden früher pro Tag zu Spitzenzeiten vielleicht einmal einige Zehntausend Belege ins DMS “verfrachtet”, so kann heute ein Vielfaches der Dateien pro Tag anfallen. Ebenso treten Dateien auf, die weit grösser sind. Die Maximalgrösse einer Datei lag bis zum Jahre 2019 bei 512 MByte, aktuell sind es 64 GByte pro Datei.
Was bringt die Zukunft?
Zunächst sei gesagt, wer rastet, der rostet. In diesem Sinne wird die ArchivistaBox stetig weiterentwickelt. Was die Zukunft bringt, wird sich zeigen. Absehbar ist, dass die Komplexität der Systeme zunehmend eine noch grössere Herausforderung darstellen wird. Dazu ein Beispiel: Das Internet wäre ohne standardisierte Protokolle nicht entstanden. Neben dem HTML-Standard spiel(t)en die Mail-Nachrichten bis heute eine zentrale Rolle. An sich werden Mail-Nachrichten über relativ einfache Protokolle verschickt, verwendet wird auch 2023 noch immer 7-Bit-Kodierung (normale Zeichen, ohne Umlaute). Neben SMTP für den Versand der Nachrichten hat sich IMAP für das Abholen (ursprünglich gab es noch POP) etabliert. Jedoch, nachdem die Mail-Server zunehmend in der Cloud laufen, ging der grösste Anbieter dazu über, sowohl das Versenden über SMTP wie das Abholen über IMAP einzustampfen.
Das angeführte Argument, neue Protokolle führten zu mehr Sicherheit, darf angezweifelt werden. Primär werden Standards vernichtet, die zuvor von den gleichen Unternehmen nie zu 100% standardkonform umgesetzt wurden. Gut möglich leider, dass wir in wenigen Jahren ein Web vorfinden werden, dass noch mehr bzw. allumfassend von den Tech-Giganten diktiert wird.
Ebenfalls erwähnt werden darf/muss hier, dass aktuell der grösste Suchriese versucht, dass die HTTPS-Zertifikate nicht mehr ca. 400 Tage gültig sein dürfen, sondern dass die Zeitspanne auf 90 Tage verkürzt wird. Einmal abgesehen davon, dass der überwiegende Teil der Informationen nicht verschlüsselt übermittelt werden müsste (zumal besagter Hersteller sattbekannt dafür ist, alle Informationen im hauseigenen Browser abzukupfern), führt dies dazu, dass die Dienste nicht primär sicherer werden, sondern dass deutlich mehr Technik notwendig ist, um eine Vertrauenswürdigkeit vorzugaukeln, die es so nicht gibt.
Digital aufbereitete Informationen, die einzig auf Bildschirmen dargestellt werden, sind im Grundsatz nicht sicher. Einmal lassen sich alle Daten in Bruchteilen von Sekunden und sehr nutzerspezifisch beliebig verändern und weiter kann bei digital erstellten Inhalten ohnehin nie mit Sicherheit gesagt werden, was wahr und falsch ist. So sehr das durchgängige Erfassen der Informationen direkt am Computer kosteneffizient(er) ist, als wenn dazu Papier und Stift verwendet würden, so sehr lässt sich nicht feststellen, ob die Daten von Menschen oder Maschinen erfasst wurden.
Aktuell wir dabei die Künstliche Intelligenz (KI) in einen Himmel gelobt, als ginge es fast darum, eine neue Weltreligion zu etablieren. Diese reisserische Wortwahl sei verziehen, aber letztlich muss einfach angefügt wurden, dass diese KI nichts anderes macht als aus einem mehr oder minder grossen Datenhaufen über Algorithmen zu Ergebnissen zu kommen, die unserem Gedächtnis nicht gänzlich unbekannt sind. Jedoch, die Algorithmen sind intransparent, sodass es in Zukunft umso schwerer sein wird, die korrekten von den falschen Informationen zu unterscheiden.
Hier zu dokumentieren, eigene Daten mittel- und langfristig lokal auf dem eigenen Rechner verfügbar zu haben, dies mag ein paar Rappen oder Franken Kosten am eigenen Geldbeutel verursachen. Jedoch, wer über diese Informationen verfügt, erhält jene Autonomie, die auch in einer globalisierten Welt ganz lokal ganz zentral sein werden. In diesem Sinne bietet sich die ArchivistaBox auch für die nächsten Jahrzehnte bestens an. Gut “eingemottete” Daten halten länger und bieten die bestmögliche Sicherheit, um heute wie in Zukunft eigenständig und agil agieren zu können.
Gratis-Backupcheck als Geburtstagsgeschenk für unsere Kunden
Zum Abschluss noch dies, was wäre eine Firmenjubiläum ohne ein Geschenk an unsere Kundschaft? Die Firma Archivista GmbH dürfte bekannt dafür sein, anstelle von rauschenden Parties und Präsenten eher dafür einzustehen, Ressourcen in die Produkte zu investieren.
Dennoch gibt es nach 25 Jahren ein Geschenk für unsere Kunden mit sehr praktischem Nutzen. Die besten Daten auf der besten ArchivistaBox bringen nur solange etwas, wie davon Sicherungen erstellt werden. Und natürlich gehört es zur Pflicht unserer Produkte, über gute Backup-Konzepte zu verfügen. Letztlich ist die beste Sicherung nur so gut, wie diese regelmässig ausgeführt und kontrolliert wird.
Kunden können die Sicherungen jederzeit überprüfen. Jedoch, nur weil eine Log-Datei besagt, die Daten seien gesichert, heisst dies nicht zwingend, dass die Daten korrekt sind. Hier sei angemerkt, dass die gesamten 25 Jahre keine unserer Log-Datei unsere Kundschaft fälschlicherweise im Glauben liess, dass die gesicherten Daten nicht auch entsprechend der Log-Datei vorlagen. Jedoch gab und gibt es immer wieder Fälle, wo die Kontrolle der Sicherungen vernachlässigt wurde.
Um hier mehr Bewusstsein, kurz und gut mehr Sicherheit zu etablieren, bieten wir allen Kunden zum 25jährigen Jubiläum einen kostenlosen Backup-Check an. Einfach unter +41 44 350 05 60 anrufen und wir sehen uns gemeinsam an, ob/wie das Sicherungskonzept implementiert ist, ob es Probleme gab bzw. gibt und was allfällig in Zukunft besser gemacht werden könnte. Das Angebot gilt für alle Kunden mit gültigem Wartungsvertrag bis zum 31. Mai 2023.