Diese Option verwenden Sie, um den erkannten Text zu verarbeiten (veredeln). Durch Angabe eines Skriptnamens erreichen Sie, dass während der Formularerkennung das entsprechende Skript aufgerufen wird. Das Skript muss als ersten und einzigen Parameter den Dateinamen des erkannten Textes entgegennehmen. Das Skript muss diese Datei öffnen, den Text verarbeiten und auf der Konsole ausgeben. Die Formularerkennung übernimmt die Ausgabe des Skripts und legt den Wert im entsprechenden Feld des Archivs ab.
Dazu ein Beispiel: Aus einem erkannten Datum soll einzig das Jahr extrahiert werden. Das untenstehende Perl-Skript erledigt genau diesen Job:
#!/usr/bin/perl use strict; my $file = shift; # get the file name open(FIN,$file); # read the file binmode(FIN); my @lines = <FIN>; close(FIN); my $txt = join("",@lines); # get the whole text in one variable $txt =~ s/\r/ /g; # replace all return with space $txt =~ s/\n/ /g; # " all newlines $txt =~ s/\t/ /g; # " all tabs $txt =~ s/\s\././g; # " space and point goes to point $txt =~ s/\.\s/./g; # " point and space goes to point $txt =~ s/\s{2,2}/ /g; # replace two 2 spaces with 1 $txt =~ /^(.*)([0-9]{2,2})(\.)([0-9]{2,2})(\.)([0-9]{4,4})(.*)$/; if ($2 ne "" && $4 ne "" && $6 ne "") { $txt="$6"; # if we got a day,month and year, give back the year } else { $txt=""; # don't give back anything } print $txt; # print it out (give it back to the form recognition)
Damit das Skript aufgerufen werden kann, muss es im untenstehenden Pfad gespeichert werden.
/home/data/archivista/cust/formrec
Um ein Skript in diesen Ordner zu kopieren, können Sie genau gleich verfahren, wie wenn Sie ein Logo für die Formularerkennung aufbereiten möchten. Mehr Informationen dazu finden Sie unter 18.4.2.