{"id":169,"date":"2014-10-24T20:46:49","date_gmt":"2014-10-24T18:46:49","guid":{"rendered":"http:\/\/schulenwegg.ch\/cms\/?page_id=169"},"modified":"2016-11-04T00:50:56","modified_gmt":"2016-11-03T23:50:56","slug":"von-wegen-standards","status":"publish","type":"page","link":"https:\/\/archivista.ch\/cms\/de\/aktuell-blog\/jahre-2008-2019\/blogs-2008\/von-wegen-standards\/","title":{"rendered":"Von wegen Standards"},"content":{"rendered":"<h1>\n\tDokumentenformate bei der Archivierung<br \/>\n<\/h1>\n<p>\n\t<span style=\"font-weight: bold;\">Pfaffhausen 10.1.2008:<\/span> Als wir vor mehr als 15 Jahren mit der Entwicklung unserer Archivista-Produkte begonnen haben, war ein digitales Archiv mit hohen H&uuml;rden verbunden. Die ersten Flachbettscanner kosteten mehrere tausend Franken und das Scannen einer Seite dauerte doch eher eine Ewigkeit (Minuten!), von einem erschwinglichen Einzug ganz zu schweigen. Zwar gab es damals schon Disketten im 3.5&quot;-Format, doch <span style=\"font-style: italic;\">der Daten-Austausch scheitert(e) &#8212; damals wie heute &#8212; daran, dass Textverarbeitungssoftware XYZ nicht mit der Software ABC kompatibel war bzw. ist.<\/span><br style=\"font-weight: bold;\" \/><br \/>\n\t<br \/>\n\tVor zehn Jahren haben wir begonnen, Archivista zu vertreiben. Zwischen dem Entschluss, ein Produkt haben zu wollen und der &quot;Geburt&quot; von Archivista vergingen satte f&uuml;nf Jahre. In dieser Zeit haben wir viel gelernt. Darunter so banale Dinge, dass es sich nicht lohnt, Dokumente zu verwenden, die mit Patenten behaftet sind, weil damit zu einem sp&auml;teren Zeitpunkt unter Umst&auml;nden bereits archivierte Dokumente pl&ouml;tzlich nicht mehr gelesen werden k&ouml;nnen, weil der Patentinhaber die Nutzungsbedingungen massiv ver&auml;ndert (Beispiel GIF-Dateien).\n<\/p>\n<h3>\n\tStandardisierte Archivista-Formate seit 1993<br \/>\n<\/h3>\n<p>\n\tWeiter haben wir (insbesondere als Anbieter) gelernt, nur Formate zu verwenden, die wir in- und auswendig kennen. Das hatte schon fr&uuml;h Konsequenzen. So verzichteten wir von Anfang an auf die Microsoft Office-Dokumente als Archivformat. Nat&uuml;rlich w&auml;re es lukrativ gewesen, diese Dokumente einfach ins Archiv zu stellen. Nur, wie lesen wir Office-Dokumente zehn Jahre sp&auml;ter ohne Microsoft Office wieder?\n<\/p>\n<h3>\n\tDie PDF-Falle kann jederzeit zuschlagen<br \/>\n<\/h3>\n<p>\n\tDas gleiche gilt im &uuml;brigen auch f&uuml;r die um die Jahrtausendwende aufkommenden PDF-Dokumente. Wie &ouml;ffnen wir diese ohne den Acrobat-Reader von Adobe? Wer nun einwendet, der Acrobat Reader laufe unter allen Betriebssystemen, dem sei entgegnet, dass die Lesbarkeit von archivierten Daten nicht von einem bestimmten Betriebssystem abh&auml;ngig sein sollte, mal abgesehen davon, dass die aktuellen Acrobat-Versionen unz&auml;hlige Abh&auml;ngigkeiten haben, die zu erf&uuml;llen nicht immer so einfach sein d&uuml;rfte.\n<\/p>\n<p>\n\tBleiben wir noch etwas beim PDF-Format. <span style=\"font-style: italic;\">Die derzeit g&uuml;ltige <\/span><a href=\"http:\/\/www.adobe.com\/devnet\/pdf\/pdf_reference.html\" style=\"font-style: italic; font-weight: bold;\" target=\"_blank\">PDF-Spezifikation<\/a><span style=\"font-style: italic;\"> l&auml;sst sich mit einer &auml;lteren Version des Acrobat-Readers nicht mehr &ouml;ffnen. Es erscheint einzig noch die erste Seite, den Rest (die &uuml;brigen 1400 Seiten) kriegen wir nur zu Gesicht, wenn wir updaten. <\/span>Ehrlich gesagt habe ich (nicht nur als Anbieter einer DMS-L&ouml;sung), sondern insbesondere auch als Anweder ein Problem, wenn ich bei standardisierten Formaten updaten soll. War das nicht etwa so, dass ein Standard ja geradezu darum geschaffen wurde, damit es immer gleich l&auml;uft, und ich folglich nicht upzudaten brauche?\n<\/p>\n<h3>\n\t&quot;Formatkrieg&quot; zwischen Office- und PDF-Dateien<br \/>\n<\/h3>\n<p>\n\tIch habe mich lange Zeit gewundert, warum nur die Microsoft Office Produkte keinen PDF-Export anbieten. Ich glaubte auch, dass es wohl mehr daran liegen muss, dass Microsoft partout nicht will, dass ich Office-Dokumente ins PDF-Format &uuml;bertragen kann; letztlich braucht mein Gegen&uuml;ber ja dann keine Office-Suite mehr, um das Dokument betrachten zu k&ouml;nnen.\n<\/p>\n<p>\n\tDann, im letzten Jahr (2007), sollte es pl&ouml;tzlich einen <a href=\"http:\/\/www.golem.de\/0606\/45950.html\" style=\"font-weight: bold;\" target=\"_blank\">PDF-Export von Microsoft (Quelle: golem.de)<\/a> geben. <span style=\"font-style: italic;\">Pech gehabt, dass passte nun Adobe nicht in dem Kram, weil die um ihren lukrativen Markt mit den Acrobat-Produkten f&uuml;rchteten.<\/span> Nat&uuml;rlich wird dies zuweilen auch wieder dementiert, aber in den Kram passt es Adobe dennoch nicht. Mit der Konsequenz freilich, dass Microsoft nun versucht mit XPS ein Konkurrenzprodukt anzubieten. Und dabei bem&uuml;hen sich beide Anbieter in letzter Zeit in einer Weise um Standards, ich traue meinen Ohren kaum. Und soll ich nun meinen Ohren oder doch lieber meinem Ged&auml;chtnis trauen?\n<\/p>\n<p>\n\t<span style=\"font-style: italic;\">Ein Anbieter, der mit jeder Office-Version automatisch ein neues Dokumentenformat einf&uuml;hrte, will nun pl&ouml;tzlich verantwortlich zeichnen, dass es DAS standartisierte Format f&uuml;r Textdokumente gibt. <\/span>Ich w&uuml;rde ihm entgegnen wollen, er soll doch bitte erst mal 10 Jahre das gleiche Dokumentenformat verwenden, und danach k&ouml;nnen wir die Sache in aller Ruhe nochmals &uuml;berdenken.\n<\/p>\n<p>\n\t<span style=\"font-style: italic;\">Der andere Anbieter betont immer die ganze Zeit wie sehr doch PDF ein standardisiertes Format sei. So, und warum muss ich denn alle Wochen wieder eine neue Version des Acrobat-Readers herunterladen?<\/span> Davon, dass die aktuelle PDF-Spezifikation mit einer &auml;lteren Version des Acrobat Readers nicht mehr gelesen werden kann, davon war schon die Rede. Dass dazu aber die ca. 16 MByte grosse Datei auch noch erst extrahiert und in 32 MByte umgewandelt werden muss, ehe ich sie ansehen kann, dass hab ich erst feststellen d&uuml;rfen, nachdem ich die neuste Version des Acrobat Readers installiert habe; soviel zur Effizienz von PDF-Dateien.\n<\/p>\n<h3>\n\tOpenDokument-Format und XML<br \/>\n<\/h3>\n<p>\n\tWas heisst das f&uuml;r die Archivierung, f&uuml;r ein langfristig ausgerichtetes DMS? <span style=\"font-style: italic;\">Ehrlich gesagt kann die offene Antwort nur lauten, wir verzichten auf beide Formate, denn weder Office- noch die PDF-Dokumente eignen sich f&uuml;r die Archivierung. <\/span>Gibt es Alternativen? Im Prinzip schon, mit dem OpenDocument-Format st&uuml;nde ein Format zur Verf&uuml;gung, dass wenigstens offen dokumentiert ist.\n<\/p>\n<p>\n\tDoch auch hier gilt, genauer hinsehen lohnt sich. Eine OpenDokument-Datei ist <a href=\"http:\/\/de.wikipedia.org\/wiki\/OpenDocument\" style=\"font-weight: bold;\" target=\"_blank\">(gem&auml;ss wikipedia)<\/a><span style=\"font-style: italic;\"> entweder eine XML-Datei oder eine Sammlung verschiedener XML-Dateien und anderer Objekte (z.B. eingebundene Bilder), die zu einer komprimierten Datei (z.B. Zip-Datei) zusammengefasst werden.<\/span> Ehrlich gesagt habe ich etwas M&uuml;he mit der Definition. Warum entweder oder und weshalb oder anderer Objekte.\n<\/p>\n<p>\n\tEin Standard sollte doch irgendwo ein Anfang und Ende haben, sonst n&uuml;tzt der Standard wenig bzw. ist kein Standard mehr. Und wie ist das noch mit XML-Dateien? Kurz zur Erinnerung, <span style=\"font-style: italic;\">XML steht f&uuml;r Extensible Markup Language (erweiterbare Auszeichnungssprache).<\/span> Damit ist meines Erachtens bereits auch gesagt, dass XML f&uuml;r die Archivierung nicht wirklich was taugt, denn XML bedeutet ja eben gerade, dass das Format beliebig erweitert werden kann. Und <span style=\"font-style: italic;\">beliebige Erweiterbarkeit wird fr&uuml;her oder sp&auml;ter zu Problemen f&uuml;hren m&uuml;ssen.<\/span><br style=\"font-weight: bold;\" \/><br \/>\n\t<br \/>\n\tIch w&uuml;rde es so formulieren wollen: Mit XML-Formaten ist es den Programmen zwar grunds&auml;tzlich m&ouml;glich zu erkennen, das ist ein Satz und das ist ein Wort und wenn es gut geht, wissen beide Programme auch, wir sollten uns in der Sprache XY unterhalten, aber ob sie den gleichen Wortschatz haben (mitunter das Gleiche so aufbereiten k&ouml;nnen, dass der Mensch die gleiche Information kriegt), diese Aufgabe vermag XML nicht zu erf&uuml;llen. Und schon gar nicht, wenn die &quot;grossen&quot; Anbieter XML als Dokumentenstandard in je einer anderen Ausrichtung proklamieren. Und wer das nicht glaubt, soll einmal eine XML-Datei auf nicht lesbare Zeichen durchforsten; es ist die reinste Schande, hat aber auch damit zu tun, dass XML als Textdatei nicht wirklich f&uuml;r gr&ouml;ssere Daten (z.B. Bilder) geeignet ist. <span style=\"font-style: italic;\">Folglich ist das OpenDokument-Format zwar ein guter Ansatz, aber kein f&uuml;r die Archivierung wirklich tauglicher.<\/span>\n<\/p>\n<h3>\n\tUnd was sagen die Spzeialist\/Innen auf dem Gebiet?<br \/>\n<\/h3>\n<p>\n\tDer <a href=\"http:\/\/www.vsa-aas.org\" style=\"font-weight: bold;\" target=\"_blank\">Verein Schweizerischer Archivarinnen und Archivare<\/a> besch&auml;ftigt sich auf der Hauptseite mit der <a href=\"http:\/\/web.archive.org\/web\/20090114104940\/http:\/\/www.vsa-aas.org:80\/Konservierung.353.0.html\" style=\"font-weight: bold;\" target=\"_blank\">Konservierung der Mikrofilme.<\/a> Richtig, den Mikrofilmen hat man eine Lebensdauer von 500 Jahren vorausgesagt. Nach einigen Jahrzehnten sind sie allesamt Sanierungsf&auml;lle. Und was sagt der Verein heute zur Langzeitarchivierung. Die <a href=\"http:\/\/web.archive.org\/web\/20090114032536\/http:\/\/www.vsa-aas.org:80\/Empfehlungen.121.0.html\" style=\"font-weight: bold;\" target=\"_blank\">Archivierungsempfehlungen<\/a> werden als Word-Dokument ver&ouml;ffentlicht (immerhin ist das Inhaltsverzeichnis als HTML-Datei abrufbar). Dann viel Spass beim Lesen in 10 Jahren. Damit sei explizit gesagt, dass der Verein sehr wohl einen wichtigen Beitrag zur Sicherstellung von wichtigen Daten leistet (viele Informationen sind nach wie vor nur auf Mikrofilm verf&uuml;gbar), dass er aber nicht unbedingt einen Beitrag zur gegenw&auml;rtigen Problematik leistet, wenn er selber Word-Dateien zum Download anbietet.\n<\/p>\n<h3>\n\tDie wichtigsten zehn Eckpunkte f&uuml;r langfristige Datenbest&auml;nde<br \/>\n<\/h3>\n<p>\n\tErwarten Sie nun bitte nicht, dass ich sage, mit der ArchivistaBox w&auml;re das alles nicht passiert. So einfach ist es leider nicht. Und doch k&uuml;mmern wir uns bei Archivista seit ca. 15 Jahren um die Archivierung digitaler Daten mit den folgenden zehn Eckpunkten:\n<\/p>\n<ol>\n<li>\n\t\tJede Archivista-L&ouml;sung besteht aus einem oder mehreren Archiven.\n\t<\/li>\n<li>\n\t\tEin Archiv besteht aus Akten und Seiten, wobei eine Akte eine oder mehrere Seiten hat.\n\t<\/li>\n<li>\n\t\tDie Archive werden mit Datenbanken verwaltet, welche SQL-Abfragen verstehen.\n\t<\/li>\n<li>\n\t\tJede Akte hat eine eindeutige Identifikationsnummer (ID).\n\t<\/li>\n<li>\n\t\tJede Akte kann mehrere Beschlagwortungsfelder (z.B. Datum, Titel) haben.\n\t<\/li>\n<li>\n\t\tDer Inhalt der Akten und Seiten kann &uuml;ber Volltextrecherchen abgerufen werden.\n\t<\/li>\n<li>\n\t\tDie Recherche ist beliebig kombinierbar (virtuelle Archivmappen anstatt starre Ordner).\n\t<\/li>\n<li>\n\t\tDie Anzeige erfolgt mit quelloffenen Bitmat-Dateien und herstellerunabh&auml;ngig.\n\t<\/li>\n<li>\n\t\tArchive sind nicht an einen bestimmten Datentr&auml;ger bzw. Technologie gebunden.\n\t<\/li>\n<li>\n\t\tErstellte Datentr&auml;ger (ISO 9660) k&ouml;nnen mit jedem Betriebssystem gelesen werden.\n\t<\/li>\n<\/ol>\n<p>\n\tIn den letzten Jahren haben wir diese Grunds&auml;tze verfeinert:\n<\/p>\n<ol>\n<li>\n\t\tWir verwenden nur noch Software, die quelloffen vorliegt (OpenSource).\n\t<\/li>\n<li>\n\t\tDie gesamte L&ouml;sung wird IP-basierend betrieben (ArchivistaBox-Konzept).\n\t<\/li>\n<li>\n\t\tVertrauliche Dokumente k&ouml;nnen verschl&uuml;sselt &uuml;bermittelt werden.\n\t<\/li>\n<li>\n\t\tDas Erstellen der Datentr&auml;ger bzw. des Backups erfolgt automatisiert.\n\t<\/li>\n<li>\n\t\tJedes Archiv ist beliebig duplizierbar (Klonen von Archiven im laufenden Betrieb).\n\t<\/li>\n<\/ol>\n<h3>\n\tSeit mehr als 12 Jahren keinen Datentr&auml;ger konvertiert<br \/>\n<\/h3>\n<p>\n\tDie Bilanz dieser Eckpunkte ist erstaunlich: Seit mehr als 12 Jahren haben wir keinen Datentr&auml;ger mehr konvertiert. Die einzige Konvertierung wurde notwendig, weil wir 1994 das Gif-Format einf&uuml;hrten, um 1996 feststellen zu m&uuml;ssen, dass die Firma Unisys pl&ouml;tzlich hohe Patentgeb&uuml;hren einfordert. Nebenbei erw&auml;hnt, dass war zwei Jahre, bevor wir das Produkt Archivista &uuml;berhaupt verkauft haben.\n<\/p>\n<h3>\n\tIm Maximum 10 Milliarden Seiten und 0,4 Cents Kosten pro Seite\/Jahr.<br \/>\n<\/h3>\n<p>\n\tWir haben mit kleineren Archiven (einige tausend Belege begonnen). Technisch ist es uns m&ouml;glich, ca. 150 Millionen Akten pro Archiv bzw. ca. 10 Milliarden Seiten pro Archiv zu verwalten. Derzeit haben unsere Kunden Archive mit einem h&ouml;heren Millionenbestand an Seiten am Laufen. Auf den derzeitigen <span style=\"font-style: italic;\">ArchivistaBoxen (Typ Eiger) k&ouml;nnen redundant f&uuml;r weniger als 5000 Euro ca. 5 Mio Seiten verwaltet werden.<\/span> Die j&auml;hrliche Wartungsgeb&uuml;hr betr&auml;gt (inkl. Ersatz der Hardware) 15 Prozent, dies ergibt &uuml;ber 10 Jahre weitere 7500 Euro an Kosten. Dies ergibt einen Seitenpreis von gerademal 4 Cents f&uuml;r die Wartung einer Seite &uuml;ber 10 Jahre bzw. 0,4 Cents pro Jahr. Nicht eingerechnet sind hier Betriebskosten (insbesondere Stromkosten), diese d&uuml;rften aber beim Betrieb der stromsparenden ArchivistaBoxen (Embedded-Produkte) bei einem zweistelligen Euro-Betrag pro Jahr liegen und d&uuml;rften den Seitenpreis nur im Promillebereich beeinflussen.\n<\/p>\n<h3>\n\tMindestens 30 Jahre Garantie auf Lesbarkeit der Daten<br \/>\n<\/h3>\n<p>\n\tWir garantieren f&uuml;r s&auml;mtliche mit der ArchivistaBox <span style=\"font-style: italic;\">archivierten Informationen 30 Jahre Investitionsschutz auf die Bildinformationen (Seiten) und Datenstrukturen (Akten), <\/span>d.h. wenn Sie heute eine ArchivistaBox erwerben, k&ouml;nnen diese Daten auch in 30 Jahren noch mit jedem handels&uuml;blichen Rechner gelesen werden. Wir garantieren weiter, dass ihre Daten keine ausf&uuml;hrbaren Datenprogramme enthalten, d.h. dass die Datenstrukturen zu 100 Prozent von den Programmen der ArchivistaBox getrennt verwaltet werden. Mit all diesen Punkten und viel Engagement tragen wir dazu bei, Informationen langfristig verf&uuml;gbar zu halten.\n<\/p>\n<h3>\n\tFazit: Ja, es geht&#8230;<br \/>\n<\/h3>\n<p>\n\tSeit nunmehr 15 Jahren besch&auml;ftigen wir uns mit der Archivierung digitaler Daten. Seit 10 Jahren profitieren unsere Kunden von unseren L&ouml;sungen. Seit mehr als zwei Jahren kann die ArchivistaBox komplett als OpenSource betrieben werden. Die Kosten f&uuml;r den Betrieb eines digitalen Archivs sind &#8212; so denn die L&ouml;sung richtig implementiert wird &#8212; minim. Und noch etwas, wer glaubt, alles extern in Auftrag vergeben zu k&ouml;nnen und vom Wissen der externen Fachkr&auml;fte profitieren zu k&ouml;nnen, der l&auml;uft immer Gefahr, dass diese externe Fachkraft auch falsch liegt. In diesem Sinne laden wir herzlich zum <span style=\"font-weight: bold;\">Download der ArchivistaBox<\/span> ein.\n<\/p>\n<p>\n\tArchivista GmbH, Urs Pfister\n<\/p>\n<p>\n\t&nbsp;<\/p>\n\n\n\n\t<div class=\"dkpdf-button-container\" style=\"            text-align:right \">\n\n\t\t<a class=\"dkpdf-button\" href=\"\/cms\/wp-json\/wp\/v2\/pages\/169?pdf=169\" target=\"_blank\"><span class=\"dkpdf-button-icon\"><i class=\"fa fa-file-pdf-o\"><\/i><\/span> PDF Button<\/a>\n\n\t<\/div>\n\n\n\n\n\n","protected":false},"excerpt":{"rendered":"<p>Dokumentenformate bei der Archivierung Pfaffhausen 10.1.2008: Als wir vor mehr als 15 Jahren mit der Entwicklung unserer Archivista-Produkte begonnen haben, war ein digitales Archiv mit hohen H&uuml;rden verbunden. Die ersten Flachbettscanner kosteten mehrere tausend Franken und das Scannen einer Seite dauerte doch eher eine Ewigkeit (Minuten!), von einem erschwinglichen Einzug ganz zu schweigen. Zwar gab [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":56,"menu_order":339,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"footnotes":""},"class_list":["post-169","page","type-page","status-publish","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/169","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/comments?post=169"}],"version-history":[{"count":3,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/169\/revisions"}],"predecessor-version":[{"id":2052,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/169\/revisions\/2052"}],"up":[{"embeddable":true,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/56"}],"wp:attachment":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/media?parent=169"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}