{"id":231,"date":"2014-04-07T08:05:04","date_gmt":"2014-04-07T06:05:04","guid":{"rendered":"http:\/\/schulenwegg.ch\/cms\/?page_id=231"},"modified":"2015-06-10T20:39:51","modified_gmt":"2015-06-10T18:39:51","slug":"10000-seiten","status":"publish","type":"page","link":"https:\/\/archivista.ch\/cms\/de\/aktuell-blog\/jahre-2008-2019\/blogs-2014\/10000-seiten\/","title":{"rendered":"10000 Seiten"},"content":{"rendered":"<h1>\n\tArchivistaBox Dolder: 10&#39;000 Seiten&#8230;<br \/>\n<\/h1>\n<p>\n\t<em><strong>Egg, 5. April 2014:<\/strong> Nachdem vor einigen Wochen an dieser Stelle die <strong>ArchivistaBox Dolder vorgestellt werden konnte,<\/strong> geht es in diesem Blog darum, wieviele Seiten mit der ArchivistaBox Dolder in einer Stunde gescannt werden k&ouml;nnen. An sich ist die kleinste ArchivisaBox Dolder pro Tag bis zu maximal 2000 Seiten freigegeben, diese Angabe ist bewusst konservativ gehalten. Der Titel d&uuml;rfte nahelegen, dass die 2000 Seiten erreicht werden konnten, und doch geht es in diesem Blog um mehr als die ArchiistaBox Dolder, vielmehr wird aufgezeigt, welches Potential bei Optimierungen erreicht werden kann.<\/em>\n<\/p>\n<h2>\n\t<img loading=\"lazy\" decoding=\"async\" align=\"bottom\" alt=\"\" height=\"451\" src=\"\/de\/media\/ascona.jpg\" width=\"600\" \/><br \/>\n<\/h2>\n<h2>\n\tDolder mit Scanner iX500: Full House nach 300 Seiten?<br \/>\n<\/h2>\n<p>\n\tDie ersten Scans waren eher ern&uuml;chternd. Nach ca. 300 Seiten meldete die ArchivistaBox Dolder Full House. Bereits der <a href=\"http:\/\/shop.archivista.ch\/oscommunity\/catalog\/advanced_search_result.php?keywords=iX500&amp;x=0&amp;y=0\"><strong>Fujitsu-Scanner iX500<\/strong><\/a> (30 Seiten\/60 Bilder die Minute) brachte die ArchivistaBox Dolder an den Anschlag. Nach eingehender Analyse konnte festgestellt werden, dass das <strong>automatische Entfernen von leeren Seiten bei jeder Seite ca. 2 Sekunden Rechenzeit verschlingt.<\/strong> Weil die &uuml;brigen ArchivistaBoxen &uuml;ber mehr Rechenleistung verf&uuml;gen, f&auml;llt dies auf den schnelleren ArchivistaBox-System nicht auf, bei der ArchivistaBox Dolder dagegen tritt es gnadenlos hervor.\n<\/p>\n<p>\n\tFolglich galt es zu &uuml;berlegen, wie das Erkennen der leeren Seiten optimiert werden kann. Mit den verschiedensten Bibliotheken wurden ausgiebige Messungen durchgef&uuml;hrt. Die nun <strong>implementierte L&ouml;sung arbeitet um den Faktor 4 schneller, indem die Seiten vor dem Test verkleinert werden<\/strong> (leere Seiten bleiben auch dann leer), sodass noch ca. 0.5 Sekunde pro Seite ben&ouml;tigt werden. So gelang es in einer Stunde ca. 3500 Seiten zu scannen; dies sind immerhin 7 Bundesordner.\n<\/p>\n<h2>\n\tEin schnellerer Scanner muss her&#8230;<br \/>\n<\/h2>\n<p>\n\t3500 Seiten pro Stunde sind grunds&auml;tzlich nicht schlecht, doch konnte beim Testen (nach der Optimierung) festgestellt werden, dass die beiden Prozessoren (CPUs) beim Scannen nur m&auml;ssig ausgelastet waren. Aus diesem Grunde musste ein schnellerer Scanner her. Die Wahl fiel dabei auf den <a href=\"http:\/\/shop.archivista.ch\/oscommunity\/catalog\/advanced_search_result.php?keywords=fi-7160&amp;sort=2a&amp;language=de\"><strong>neuen Fujitsu fi-7160,<\/strong><\/a> der zu einem <strong>Preis deutlich unter 1000 Euro immerhin 120 Bilder (60 Seiten) die Minute anliefert. Damit erbringt der fi-7160 eine Leistung, die bislang in dieser Preisklasse unerreicht sind.<\/strong>\n<\/p>\n<p>\n\t<img decoding=\"async\" alt=\"\" src=\"\/de\/media\/ascona2.jpg\" style=\"margin: 5px 10px; float: right; width: 240px; height: 319px;\" \/>Beim ersten Scannen mit dem fi-7160 vermochte die ArchivistaBox nicht mitzuhalten, mehr als 4500 Seiten die Stunde sollten es nicht werden. Eine weitere vertiefte Analyse brachte zu Tage, dass unsere Bibliothek f&uuml;r das Verarbeiten der Bilder beim Setzen der DPI-Werte (Aufl&ouml;sung im Bild) sich viel Zeit l&auml;sst, deutlich &uuml;ber eine halbe Sekunde ben&ouml;tigt sie, um zweimal zwei Bytes zu erfassen. Dies deshalb, weil das gesamte Bild nochmals durchgerechnet wird. Dies ist sinnlos, und wurde daher deaktiviert. Nun konnten 7200 Seiten in einer Stunde realisiert werden.\n<\/p>\n<h2>\n\tSchnellste Scanner und weitere Optimierungen<br \/>\n<\/h2>\n<p>\n\tBeim Versuch, mit dem <a href=\"http:\/\/shop.archivista.ch\/oscommunity\/catalog\/advanced_search_result.php?keywords=fi-6670&amp;x=0&amp;y=0\"><strong>fi-6670 (80 Seiten bzw. 160 Bilder) <\/strong><\/a>eine noch h&ouml;here Leistung zu erzielen, zeigte sich die Problematik, dass die beim A3-Scanner querformatig einzulegenden Seiten gedreht werden m&uuml;ssen, ehe sie in der Datebank abgelegt werden k&ouml;nnen. W&uuml;rden die Seiten hochformatig eingelegt, sinkt die Geschwindikeit um ca. 20 Prozent, womit der fi-6670 kaum mehr schneller als der fi-7160 arbeitet.\n<\/p>\n<p>\n\tDie Bibliothek libjpeg (Linux-Standard) arbeitet zwar recht flink. Auf den <strong>schnelleren ArchivistaBoxen ben&ouml;tigt das Rotieren einer JPEG-Seite plus\/minus ca. 0,3 Sekunden, bei der ArchivistaBox Dolder wird etwas mehr als 1 Sekunde<\/strong> ben&ouml;tigt. Dies bedeutet nicht, dass die ArchivistaBox Dolder generell langsamer arbeitet, sondern einzig, dass CPU-intensive Dinge aufgrund der tiefen Leistungsaufnahme (6 Watt pro CPU unter Last) mehr Zeit erfordern, weil ansonsten die CPU stromfressend hochgefahren werden m&uuml;sste, womit am Ende ein surrender L&uuml;fter weitere Watt verwinden w&uuml;rde&#8230;\n<\/p>\n<p>\n\tAn dieser Stellte gerne die Messung von jpegtran. Mit diesem Programm k&ouml;nnen verlustfrei Bilder im JPEG-Format gedreht werden:\n<\/p>\n<p>\n\t<strong><span style=\"font-family: Courier New;\">time jpegtran -rotate 90 job0085.img &gt; job0085.jpg<br \/>\n\treal 0m1.035s<br \/>\n\tuser 0m0.900s<br \/>\n\tsys 0m0.132s<\/span><\/strong>\n<\/p>\n<p>\n\tNach erheblichen Recherchen konnte die Bibliothek <a href=\"http:\/\/libjpeg-turbo.virtualgl.org\/\" target=\"_blank\"><strong>libjpeg-turbo<\/strong><\/a> gefunden werden. Hier die Messung einer A4-Seite mit 300dpi, um sie um 90 Grad zu drehen:\n<\/p>\n<p>\n\t<strong><span style=\"font-family: Courier New;\">time \/opt\/libjpeg-turbo\/bin\/jpegtran -rotate 90 job0085.img &gt; job0085.jpg<br \/>\n\treal 0m0.507s<br \/>\n\tuser 0m0.372s<br \/>\n\tsys 0m0.128s<\/span><\/strong>\n<\/p>\n<p>\n\t1.035\/0.507 ergibt 2.04, <strong>um etwas mehr als den Faktor 2 ist der &quot;Turbo&quot; schneller<\/strong> &#8212; und hat sich damit die Aufnahme in alle ArchivistaBoxen reichlich verdient. Allerdings ergeben 160*0.5 Sekunden auf der ArchivistaBox Dolder in der Minute noch immer 80 Sekunden, womit der Scanvorgang (selbst unter libjpeg-turbo) nicht mit vollem Speed erfolgen kann. Kurz und gut, die Kombination ArchivistaBox Dolder und fi-6670 ergibt kaum einen Sinn, f&uuml;r viel weniger &quot;Moneten&quot; erbringt der fi-7160 fast die gleiche Leistung.\n<\/p>\n<h2>\n\tArchivistaBox Dolder scannt 10&#39;000 Seiten die Stunde<br \/>\n<\/h2>\n<p>\n\tDer neue <a href=\"http:\/\/shop.archivista.ch\/oscommunity\/catalog\/advanced_search_result.php?keywords=fi-7180&amp;x=0&amp;y=0\"><strong>Fujitsu fi-7180 passt da gut,<\/strong><\/a> weil die Seiten hochformatig eingelegt werden, das Ger&auml;t 80 Seiten bzw. 160 Bilder pro Minute scannt und es deutlich kosteng&uuml;nstiger als der A3-Scanner fi-6670 ist. Alle ArchivistaBox-Systeme enthalten s&auml;mtliche Scanner-Treiber bereits auf der Box. Scanner einfach an die Box anh&auml;ngen und danach den Scanvorgang &uuml;ber das Keypad ausl&ouml;sen, und schon scannt und <strong>verarbeitet die ArchivistaBox Dolder &uuml;ber 160 Seiten die Minute. Dies ergibt plus\/minus 10&#39;000 Seiten pro Stunde.<\/strong>\n<\/p>\n<p>\n\tZur Feier der Stunde gibt es in diesen Blogs eine Premiere, ein Video, welches das Scannen mit der ArchivistaBox Dolder und dem fi-7180 veranschaulicht:\n<\/p>\n<p>\n\t<iframe loading=\"lazy\" allowfullscreen=\"\" frameborder=\"0\" height=\"315\" src=\"\/\/www.youtube.com\/embed\/UyawmE3DNXA\" width=\"560\"><\/iframe>\n<\/p>\n<p>\n\tDas Video hat eine Dauer von 1:30, wobei 30 Sekunden f&uuml;r das Vorstellen der Komponenten und 60 Sekunden gescannt werden. Aufgrund nicht optimaler Lichtver&auml;hltnisse und einer sehr m&auml;ssigen Handy-Kamera resultierte leider keine bessere Qualit&auml;t, doch zeigt das Video sehr sch&ouml;n auf, mit welchem Speed die ArchivistaBox Dolder doppelseitig gescannte Farbblder (mit 300dpi) ohne jegliche Verz&ouml;gerung verarbeiten kann.\n<\/p>\n<h2>\n\tOptimierungen sind immer sinnvoll &#8212; auf allen ArchivistaBoxen<br \/>\n<\/h2>\n<p>\n\tDie hohe Scan-Leistung der ArchivistaBox-Dolder bedeutet im Prinzip, dass nach 10 Stunden (d.h. nach einem Tag, ob der fi-7180 dies am St&uuml;ck &uuml;berstehen w&uuml;rde, bleibe dahingestellt) das derzeitige Gesamtvolumen von 100&#39;000 Seiten ersch&ouml;pft w&auml;re. Ergibt dies einen Sinn? Um es klar zu sagen, <strong>wer t&auml;glich 100&#39;000 Seiten verarbeiten m&ouml;chte, sollte nicht unbedingt zur ArchivistaBox Dolder greifen.<\/strong> Die Frage kann aber andersherum gestellt werden. Wenn t&auml;glich einige Dutzend bis einige Hundert Seiten deutlich schneller verarbeitet werden k&ouml;nnen, dann<br \/>\n\tergibt dies immer einen Sinn.\n<\/p>\n<p>\n\tDabei bedeutet <strong>Optimierung zun&auml;chst einen Mehraufwand.<\/strong> Richtig umgesetzt resultieren daraus sp&auml;ter aber (wie vorliegend) <strong>enorme &quot;Sparpotentiale&quot;,<\/strong> die selbstverst&auml;ndlich nicht nur der ArchivistaBox Dolder zur Verf&uuml;gung gestellt werden, sondern <strong>all unseren ArchivistaBox-Systemen.<\/strong> Dank der Optimierung arbeitet die ArchivistaBox Dolder nun beinahe so rank und schnell, wie die &uuml;brigen ArchivistaBox-Systeme vor der Optimierung. In diesem Sinne viel Spass beim Arbeiten mit unseren ArchivistaBox-Systemen.\n<\/p>\n<p>\n\t<em>P.S: Dieser Blog k&ouml;nnte den Eindruck erwecken, dass wir die Fujitsu-Scanner &quot;gnadenlos&quot; gut finden. Dieser Eindruck t&auml;uscht nicht, weil wir <\/em><em>mit diesen Scannern <\/em><em>sehr gute Erfahrungen gemacht haben. Neben den Fujitsu-Scannern gibt es mittlerweile <\/em><em>(im Bereich um 25 Seiten) <\/em><em>viele preisg&uuml;nstige Duplex-Scanner, die mit der ArchivistaBox laufen (Stichwort SANE). Aber, uneingeschr&auml;nkt empfehlen k&ouml;nnen wir nur Ger&auml;te, welche wir ausgiebig getestet haben. <strong>Ohne Vorbehalte und Tests empfehlen k&ouml;nnen wir dagegen Ger&auml;te, welche die Daten per Netzwerk anliefern. Solche Scanner (meist sind es multifunktionale Ger&auml;te) sind bereits in der Preisklasse ab 100 Euro erh&auml;ltlich<\/strong>. Achten Sie einfach darauf, dass die Daten per SMB (Windows-Ordner) oder FTP und im Format PDF angeliefert werden.<\/em>\n<\/p>\n<p>\n\t<em>P.S II: Die ArchivistaBox-Systeme erstellen von s&auml;mtlichen Dokumenten <strong>automatisch einen Volltext-Suchindex und durchsuchbare PDF-Dateien.<\/strong> Bei der ArchivistaBox <strong>Dolder k&ouml;nnen pro Tag 10&#39;000 Seiten in Farbe (300dpi) bzw. ca. 20&#39;000 Seiten in Schwarz\/Weiss<\/strong> verarbeitet werden. Bei der ArchivistaBox Matterhon k&ouml;nnen um den Faktor 10 mehr Dokumente texterkannt werden, wobei mit <strong>weiteren Scan-Stationen das Tagesvolumen auf &uuml;ber 1 Mio. Dokumente f&uuml;r die Texterkennung <\/strong>erweitert werden kann.<\/em><\/p>\n\n\n\n\t<div class=\"dkpdf-button-container\" style=\"            text-align:right \">\n\n\t\t<a class=\"dkpdf-button\" href=\"\/cms\/wp-json\/wp\/v2\/pages\/231?pdf=231\" target=\"_blank\"><span class=\"dkpdf-button-icon\"><i class=\"fa fa-file-pdf-o\"><\/i><\/span> PDF Button<\/a>\n\n\t<\/div>\n\n\n\n\n\n","protected":false},"excerpt":{"rendered":"<p>ArchivistaBox Dolder: 10&#39;000 Seiten&#8230; Egg, 5. April 2014: Nachdem vor einigen Wochen an dieser Stelle die ArchivistaBox Dolder vorgestellt werden konnte, geht es in diesem Blog darum, wieviele Seiten mit der ArchivistaBox Dolder in einer Stunde gescannt werden k&ouml;nnen. An sich ist die kleinste ArchivisaBox Dolder pro Tag bis zu maximal 2000 Seiten freigegeben, diese [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":236,"menu_order":361,"comment_status":"closed","ping_status":"closed","template":"","meta":{"_acf_changed":false,"footnotes":""},"class_list":["post-231","page","type-page","status-publish","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/231","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/comments?post=231"}],"version-history":[{"count":1,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/231\/revisions"}],"predecessor-version":[{"id":1527,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/231\/revisions\/1527"}],"up":[{"embeddable":true,"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/pages\/236"}],"wp:attachment":[{"href":"https:\/\/archivista.ch\/cms\/wp-json\/wp\/v2\/media?parent=231"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}