In Abhängigkeit von der Qualität der Vorlagen können bei OCR-Verfahren in kurzer Zeit große Mengen von Daten entweder in weiterverarbeitbare Ausgabeformate oder in Volltextrechere-fähige PDF Dateien konvertiert werden. Bei guten und strukturierten Vorlagen erreichen wir eine Erkennungsgenauigkeit von 95%.
Verarbeitbare Dateien können in unterschiedlichen Formaten geliefert werden: TXT, DOC, XLS, u. v. a. Die Formatierung der Inhalte ist ebenso in Abstufungen wählbar: unter Beibehaltung der Absatzstruktur, Berücksichtigung unterschiedlicher Schriftarten, Einbettung von Grafiken und Bildern, Ausgabe als Fließtext unter Auflösung der vorh. Struktur.
OCR - mit Ausgabeformat
Dokumente, Lieferscheine, Rechnungen, Tabellenstrukturen, Belegaufkommen mit variabler Datenanordnung werden halbautomatisch vorerfaßt, d.h. Erfassung fester Felder automatisch, variabler Inhalt wird manuell ergänzt.
OCR - auf PDF (Volltextrecherche)
Einseitige PDF-Dateien oder Multipage-PDF werden mittels OCR-Verfahren als volltextfähige PDF-Dateien geliefert. Voraussetzung ist ein modernes Schriftbild ohne Verwendung von Frakturschriften.
Auch bei diesem Verfahren ist die Qualität der gescannten Vorlage von ausschlaggebender Bedeutung. Wir verwenden als Grundlage für Volltext-PDF-Dateien ausschließlich Scans oberhalb 300 dpi bis 600 dpi optischer Auflösung, in Abhängigkeit von der Qualität der zu scannenden Vorlagen.