De invoegtoepassing I.R.I.S. OCR laat zich volledig met Nitro PDF Professional integreren, zodat niet alleen tekst van gescande pagina’s, maar ook in beelden van geopende PDF-documenten, kan worden herkend. Het OCR-hulpprogramma is volledig instelbaar en bevat functies waarmee alle opties kunnen worden geconfigureerd, van het corrigeren van schuine beelden tot de instellingen voor beeldcomprimering. Tekstherkenning voor scanners kan ook worden ingeschakeld in het dialoogvenster PDF maken van scan, zodat gescande pagina’s automatisch in PDF worden omgezet, met tekst die doorzoekbaar en bewerkbaar is.

OCR-voorkeuren configureren:

  1. Klik op de oranje knop Nitro PDF Professional, linksboven in het venster van de toepassing.
  2. Klik op de knop Voorkeuren onder aan het hoofdmenu.
  3. Klik in het dialoogvenster Voorkeuren op OCR in de kolom met categorieën.

Algemene voorkeuren OCR

De algemene voorkeuren die voor de OCR-functies kunnen worden ingesteld, zijn in 3 groepen verdeeld, met de volgende opties:

  • Schuine beelden corrigeren. Hiermee wordt alle tekst, die op het gescande document schuin of scheef staat, rechtgezet.
  • Vaste drempelwaarde. Om tekst van een achtergrond te kunnen onderscheiden, wordt het histogram van een beeld geanalyseerd. Met een vaste drempelwaarde wordt dezelfde eindwaarde op het gehele beeld toegepast, in plaats dat de tekst dynamisch wordt gezocht. De percentages geven het punt aan waarop het contrast tussen zwart en wit ideaal is om tekst te herkennen, waarbij 0% volledig zwart is en 100% volledig wit. Deze instelling wordt aanbevolen voor beelden met variërende achtergronden, of met achtergronden waarvan de tint of kleurschakering verandert. Voor algemenere OCR-handeling wordt u aanbevolen de vaste drempelwaarde uit te schakelen.
  • Tekstrichting detecteren. Hiermee worden pagina’s automatisch gedraaid als deze gescand zijn onder een hoek van 90, 180 of 270 graden.
  • Kleurenbeeld afvlakken. Gebruik deze optie om de kleuren van het beeld af te vlakken, om artefacts van de JPEG-comprimering te verwijderen en de herkenning te verbeteren.
  • Taal. Selecteer de taal van de gescande tekst.
  • Kwaliteit.
    • Laag (snel). Dit is de ideale optie als de tekst op het gescande document helder en duidelijk te herkennen is. Met deze instelling worden scan snel uitgevoerd.
    • Middelmatig (medium). Met deze optie wordt de herkenning nauwkeuriger uitgevoerd dan met Laag en duurt het scannen enigszins langer.
    • Hoog (langzaam). Deze instelling is geschikt voor het scannen van tekst die moeilijk te herkennen is. Met deze instelling worden complexere methoden voor tekstherkenning toegepast en duurt het scannen langer.
  • Type.
    • Bewerkbare tekst. Hiermee wordt het gehele document opnieuw opgebouwd en ontstaat er een PDF-bestand met tekst die doorzoekbaar en bewerkbaar is. Met deze methode blijft het oorspronkelijke gescande beeld niet behouden, waardoor de resultaten kunnen afwijken; gebruik deze instelling daarom uitsluitend als het PDF-bestand nog moet worden bewerkt.
    • Doorzoekbaar beeld. Hiermee wordt een verborgen laag met tekst toegevoegd, om zoekbewerkingen en tekstmarkeringen mogelijk te maken. De tekst zelf kan echter op geen enkele wijze worden bewerkt.
  • Beelden verkleinen. Hiermee kunt u de resolutie van de gescande beelden verlagen nadat de scan is uitgevoerd.
  • Beeldcompressiefactor. Hoe hoger de comprimering van een beeld, des te kleiner het resulterende PDF-bestand is. Als uw PDF-bestand echter moet worden afgedrukt, wordt een lage comprimering aanbevolen, zodat de kwaliteit optimaal blijft.
  • Lettertype insluiten. Hiermee worden de benodigde lettertypen voor herkenning van de uitvoertekst, indien deze op het systeem aanwezig zijn, na het scanproces in de uitgevoerde PDF opgeslagen.

Voorkeuren