Le plug-in de reconnaissance optique de caractères I.R.I.S. s’intègre parfaitement avec Nitro PDF Professional et permet ainsi de convertir les pages ou les images numérisées en texte dans les documents PDF ouverts. Cet utilitaire peut être personnalisé et comporte des options permettant de configurer des fonctionnalités qui vont de la correction des images inclinées aux paramètres de compression des images. Vous pouvez également activer directement la reconnaissance de texte à partir des scanners dans la boîte de dialogue Créer PDF à partir d’un scanner pour créer ainsi automatiquement des documents PDF dont le texte peut être modifié ou recherché.

Pour configurer les préférences de reconnaissance optique :

  1. Cliquez sur le bouton orange Nitro PDF Professional dans le coin supérieur gauche de l’application.
  2. Cliquez sur le bouton Préférences en bas du menu principal.
  3. Dans la boîte de dialogue Préférences, cliquez sur OCR dans la colonne des catégories.

Préférences générales de reconnaissance optique

Les préférences générales de configuration de la fonctionnalité de reconnaissance optique sont réparties dans 3 catégories, avec les options suivantes :

  • Corriger l’inclinaison de l’image. Permet de redresser tout texte qui paraît incliné dans le document numérisé.
  • Utiliser le seuil fixe. La fonctionnalité « seuil » consiste à analyser l’histogramme d’une image pour séparer le texte de son arrière-plan. Un seuil fixe applique le même point de limite à l’ensemble de l’image, par opposition à la recherche dynamique de texte. Les pourcentages indiquent le point auquel le contraste entre les noirs et les blancs est idéal pour identifier le texte. 0 % correspond à complètement noir et 100 % à complètement blanc. Ce paramètre est recommandé si une image contient des arrière-plans de couleurs différentes ou si l’arrière-plan comporte différentes zones d’ombre ou de dégradés. Pour les opérations de reconnaissance optique les plus courantes, il est recommandé de désactiver le paramètre de seuil fixe.
  • Détecter l’orientation du texte. Cette opposition permet de faire pivoter les pages de façon automatique lorsqu’elles sont numérisées à des angles de 90, 180 ou 270 degrés.
  • Couleur d’image lisse. Uniformise les couleurs de l’image pour supprimer les artéfacts de compression JPEG et faciliter la reconnaissance.
  • Langue. Sélectionnez la langue dans laquelle le texte numérisé est écrit.
  • Qualité.
    • Faible (rapide). Cette option s’applique lorsque le texte du document est particulièrement net et facile à reconnaître. Ce paramètre permet de numériser les documents très rapidement.
    • Moyen (moyen). La reconnaissance est plus précise qu’avec le paramètre Faible, mais le temps de numérisation peut être plus long.
    • Élevé (lent). Ce paramètre s’applique aux documents pour lesquels la reconnaissance optique est plus difficile. Cette méthode prend plus de temps, car les méthodes de reconnaissance employées sont plus complexes.
  • Type.
    • Texte modifiable. Cette option reconstitue l’ensemble du document, ce qui produit un fichier PDF qui contient à la fois du texte modifiable et du texte accessible par les fonctions de recherche. Dans la mesure où cette méthode ne conserve par l’image numérisée d’origine, les résultats peuvent varier. N’utilisez ce paramètre que si vous devez apporter des modifications au fichier PDF.
    • Image avec texte identifiable. Cette option ajoute une couche de texte masquée pour permettre les recherches et le marquage de texte (au moyen du surlignement, par exemple). Cependant, le texte ne peut pas être modifié du tout.
  • Sous-échantillonner les images. Une fois la numérisation terminée, vous pouvez réduire la résolution de vos images numérisées.
  • Taux de compression de l’image. Plus une image est compressée, plus la taille du fichier PDF de sortie est réduite. Cependant, si votre document PDF est destiné à l’impression, il est conseillé de choisir un facteur de compression réduit pour assurer la qualité.
  • Incorporer les polices. Une fois la numérisation terminée et si les polices requises figurent sur le système, le PDF créé enregistre et stocke les polices utilisées lors de la reconnaissance du texte.

Préférences