13.2.2 OCR-Cluster (Rechner1, Rechner2, ...)

Die Texterkennung (OCR) läuft direkt auf der ArchivistaBox. Pro Seite dauert die Texterkennung plus/minus einige Sekunden. Werden nun sehr viele Dokumente bzw. Seiten erfasst, so kann es bei der Texterkennung erhebliche Verzögerungen geben. Um dies zu umgehen, kann die Texterkennung über mehrere ArchivistaBoxen aufgeteilt werden. Die Texterkennung kann dabei auf bis zu mehrere Hundert oder Tausend Prozesse aufgteilt werden, um die Resultate quasi in Echtzeit zu erhalten.

Image tip Diese Option muss lizenztechnisch freigeschaltet werden. Ebenso ist die entsprechende Hardware notwendig.