Das I.R.I.S. OCR-Plugin lässt sich komplett in Nitro PDF Professional integrieren, d. h. Sie können damit Text in gescannten Seiten oder von Bildern in geöffneten PDF-Dokumenten erkennen. Das OCR-Dienstprogramm lässt sich komplett anpassen. Sie können darin verschiedene Optionen konfigurieren, wie z. B. die Korrektur verzogener Bilder oder Einstellungen zur Bildkomprimierung. Sie können auch die Texterkennung für Scanner direkt beim Dialogfeld PDF-Erstellung vom Scanner aktivieren, damit von gescannten Seiten automatisch PDF-Dokumente erstellt werden, deren Text bearbeitet werden kann und durchsuchbar ist.

So konfigurieren Sie die OCR-Einstellungen:

  1. Klicken Sie auf die orange Nitro PDF Professional-Schaltfläche oben links in der Anwendung.
  2. Klicken Sie unten im Hauptmenü auf die Schaltfläche Einstellungen.
  3. Klicken Sie im Dialogfeld Einstellungen in der Kategorienspalte auf OCR.

OCR – allgemeine Einstellungen

Die allgemeinen Einstellungen zur Konfiguration der OCR-Funktionalität sind in drei Kategorien mit den folgenden Optionen eingeteilt:

  • Bildneigung korrigieren. Hiermit können Sie verzogenen Text im gescannten Dokument gerade rücken.
  • Fester Schwellenwert. Mithilfe des Schwellenwerts wird das Histogramm eines Bildes analysiert, um den Text vom Hintergrund zu unterscheiden. Bei einem festen Schwellenwert wird der gleiche Abhebungspunkt auf das gesamte Bild angewendet im Gegensatz zur dynamischen Suche von Text. Die Prozentwerte bestimmen den Punkt, ab dem der Kontrast zwischen Schwarz- und Weißwerten ideal zum Erkennen von Text ist. Der Wert 0% bedeutet hierbei komplett dunkel und 100% komplett weiß. Diese Einstellung wird empfohlen, wenn ein Bild unterschiedliche Hintergrundfarben enthält oder einen Hintergrund mit variierenden Schattierungen oder Verläufen. Bei herkömmlichen OCR-Operationen wird empfohlen, die feste Schwellenwerteinstellung zu deaktivieren.
  • Textausrichtung erkennen. Seiten werden automatisch gedreht, wenn sie im Winkel von 90, 180 oder 270 Grad gescannt wurden.
  • Farbbild glätten. Glätten Sie die Farben aus dem Bild heraus, um Artefakte von der JPEG-Komprimierung zu entfernen und die Texterkennung zu erleichtern.
  • Sprache. Wählen Sie die Sprache des gescannten Textes aus.
  • Qualität.
    • Niedrig (schnell). Diese Einstellung ist ideal, wenn der Text im gescannten Dokument sehr scharf und leicht zu erkennen ist. Sie erlaubt eine schnelle Durchführung von Scans.
    • Mittel (mittel). Hier ist die Erkennung genauer als bei der Einstellung ‘Niedrig’, und die Scandauer kann etwas länger sein.
    • Hoch (langsam). Empfohlen zum Scannen von Text, der schwieriger zu erkennen ist. Das Scannen mit dieser Einstellung dauert länger, da die Erkennungsmethoden komplexer sind.
  • Typ.
    • Bearbeitbarer Text. Strukturiert das gesamte Dokument neu, um eine PDF-Datei zu erstellen, die Text enthält, der durchsuchbar ist und bearbeitet werden kann. Da diese Methode nicht das ursprünglich gescannte Bild beibehält, können die Ergebnisse variieren. Aus diesem Grund ist sie nur empfehlenswert, wen Sie Änderungen an der PDF-Datei durchführen müssen.
    • Durchsuchbares Textbild. Fügt eine verborgene Textebene hinzu, um die Textsuche und -markierung (z. B. Hervorheben) zu ermöglichen. Es besteht jedoch keine Möglichkeit, den Text selbst zu verändern.
  • Downsampling bei Bildern. Nach Abschluss des Scanvorgangs können Sie die Auflösung der gescannten Bilder reduzieren.
  • Bildkomprimierungsfaktor. Je stärker ein Bild komprimiert ist, um so kleiner ist die Dateigröße des ausgegebenen PDF-Dokuments. Wenn Ihr PDF-Dokument jedoch gedruckt werden soll, ist eine geringe Komprimierung zu empfehlen, um die Qualität beizubehalten.
  • Schriftarten einbetten. Wenn nach dem Scanvorgang die erforderlichen Schriftarten im System gefunden wurden, speichert die Ausgabe-PDF-Datei die Schriften, die zur Erkennung des Ausgabetextes verwendet wurden.

Einstellungen