Um in einer Datenbank einen bestimmten Bereich mit der Spracherkennung abzuarbeiten, gibt es das Hilfsprogramm voskmulti.pl dbname start end audio cpus
. Mit diesem Programm kann in einer Datenbank der Bereich start
bis end
zur Spracherkennung herangezogen werden. Entfallen Start- und Endwerte, so wird die gesamte Datenbank verwendet. Wird bei audio
eine '0' angegeben, werden alle Video-Dateien verarbeitet, bei einer '1' alle Audio- und bei '2' alle Audio und Video-Dateien. Mit der Option cpus
kann festgelegt werden, wieviele Prozessorkerne (CPUs) für die Spracherkennung heranzuziehen sind. Wird der Parameter cpus
nicht angeführt, so werden entweder 4 CPUs oder die mit der Installation festgelegte Anzahl der Kerne verwendet. Mit dem Skript voskcheck.pl
(gleiche Parameter) kann eine Erkennung auf alle noch nicht abgearbeiteten Dateien gestartet werden.
Die Sprache der Erkennung hängt von der OCR-Definition bzw. der ersten darin festgelegten Sprache ab, siehe dazu 16. Aktuell möglich sind Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch und Niederländisch. Dabei gilt es zu beachten, dass bei der OCR-Definition die gewünschte Sprache an erster Stelle angeführt sein muss.