Optimale OCR-Qualität beim Scannen von Text
Beim Scannen von Texten erzielen Sie mit folgenden Auflösungen die besten Ergebnisse:
Objekttyp |
Auflösung |
Dokumente |
300 DPI Schwarzweiß |
Dokumente mit schlechter Qualität |
400 DPI Schwarzweiß |
Mithilfe der integrierten OCR-Software von PaperPort können Sie Text aus gescannten Textdokumenten kopieren. Anschließend kann der Text in einem beliebigen Editor, Textverarbeitungs- oder Tabellenkalkulationsprogramm verwendet und bearbeitet werden.
Dieser Vorgang wird häufig als Konvertierung bezeichnet, da OCR-Software gescannte Zeichen liest und in Text konvertiert.
Wenn PaperPort und OmniPage gemeinsam auf einem Computer vorhanden sind, werden die OCR-Funktionen auch in PaperPort verfügbar und erhöhen das Leistungsspektrum dieser Anwendung. Siehe OmniPage mit PaperPort verwenden. Eine detaillierte Übersicht der OCR-Funktionen in OmniPage finden Sie auf www.nuance.de.
Hinweise
Für den OCR-Prozess eignen sich nur Texte, die mit 150 bis 600 DPI gescannt wurden.
Das Übersetzen von gescanntem Text durch OCR ist nicht immer fehlerfrei. Bei den meisten Dokumenten erzielt die OCR-Software von PaperPort je nach Qualität des Originals eine Genauigkeit von bis zu 98 %. Manche Dokumente lassen sich jedoch schwer durch OCR verarbeiten. Bei Dokumenten mit kleiner Schrift erzielen Sie möglicherweise mit 400 DPI bessere Ergebnisse. Sehr hohe Auflösungen beim Scannen, z. B. 600 DPI, führen in der Regel nicht zu einer Verbesserung der OCR-Qualität, vielmehr können sie die Qualität sogar beeinträchtigen.
OCR funktioniert am besten, wenn die Datei in einem verlustfreien Format, z. B. als PaperPort-Bilddatei (.max) mit der Einstellung Maximale Qualität oder als Windows Bitmap-Datei (.bmp) oder TIFF-Datei, gespeichert wurde. Welche OCR-Qualität Sie mit JPEG-Dateien und PaperPort-Bilddateien mit einer niedrigeren Qualität erzielen, hängt vom Komprimierungsgrad ab.
Tipps
Optimale Ergebnisse erzielen Sie mit einem sauberen Original in guter Qualität.
Enthält ein Bild von Hand eingefügte Notizen oder Linien, versucht die OCR-Software, diese Daten zu analysieren, und konvertiert sie möglicherweise nicht richtig. Daher sollten Sie den konvertierten Text nach dem OCR-Prozess immer überprüfen.
Mit Landkarten, handgeschriebenen Texten, Bildern, Logos und ähnlichen Objekten lassen sich keine guten OCR-Ergebnisse erzielen.
Enthält gescannter Text Linien, Zeichnungen oder handgeschriebene Abschnitte, rufen Sie den Text im Bildansichtsfenster auf, entfernen Sie die Linien und Formen und lassen Sie dann den Text durch den OCR-Prozess extrahieren.
//