Freeware-Texterkennung für den Unternehmenseinsatz
20. Juni 2016In vielen Unternehmen werden kaum noch Faxe versandt oder empfangen. Auch wurde in der Vergangenheit viel „Papierkrieg“ auf elektronische Datenübermittlung umgestellt. Trotzdem werden von Zeit zu Zeit Scans von Formularen angefertigt, oder Faxe als Bilddatei auf den Systemen der Mitarbeiter abgespeichert. Der Nachteil dieser Bilddateien liegt auf der Hand: Der eigentliche (Text-) Inhalt kann als Bilddatei nicht vom System indiziert werden. Suchbegriffe innerhalb dieser Scans können auf diese Weise nicht ohne weiteres gefunden werden.
Daher gehen viele Unternehmen dazu über, bestehende Formular- oder Fax-Scans mit einer entsprechenden Software in ein entsprechendes Textformat zu bringen. Meist wird dazu eine (relativ) teure Softwarelösung benötigt. Denn vor allem der Business-Bereich wird von vielen Freeware-Programmen lizenzrechtlich nicht abgedeckt.
Eine Ausnahme bildet das Tool „FreeOCR“, das Programm wandelt zuverlässig (die meisten) PDF-Dateien sowie Faxe oder ähnliche Dateien in das Microsoft-Word-Format (Doc oder Docx) um. Unterstützt werden laut Herstellerseite die Betriebssysteme Windows XP und aufwärts, wobei Windows 8.1 oder Windows 10 nicht explizit aufgezählt werden. Zumindest unter Windows 10 funktionierte die Software im NT4ADMINS-Testlabor einwandfrei, somit dürfte das Tool auch unter Windows 8.1 lauffähig sein (zumal Windows 8 als unterstütztes Betriebssystemen aufgeführt ist).
Florian Huttenloher