Il plugin OCR I.R.I.S. si integra alla perfezione in Nitro PDF Professional e consente di riconoscere il testo presente nelle pagine sottoposte a scansione o nelle immagini dei documenti PDF aperti. L’utilità OCR è pienamente personalizzabile e permette ad esempio di configurare opzioni come la correzione delle immagini inclinate e la compressione delle immagini. È anche possibile abilitare il riconoscimento del testo per gli scanner direttamente nella finestra di dialogo Crea PDF da scanner, in modo da creare automaticamente dalle pagine digitalizzate documenti PDF modificabili o ricercabili.
Per configurare le preferenze OCR:
- Fare clic sul pulsante arancione Nitro PDF Professional nell’angolo superiore sinistro dell’applicazione.
- Fare clic sul pulsante Preferenze in fondo al menu principale.
- Nella finestra di dialogo Preferenze, fare clic su OCR nella colonna delle categorie.
Preferenze generali OCR
Le preferenze generali configurabili per la funzione OCR sono divise in 3 categorie, con le seguenti opzioni:
- Correggi inclinazione immagine. Consente di raddrizzare i testi che appaiono inclinati nel documento digitalizzato.
- Usa soglia fissa. Il thresholding è il processo che analizza l’istogramma di un’immagine per distinguere il testo dallo sfondo. Una soglia (threshold) fissa applica lo stesso punto di divisione all’intera immagine, anziché individuare il testo in modo dinamico. I valori percentuali indicano il punto in cui il contrasto tra neri e bianchi è ideale per il riconoscimento del testo, considerando che lo 0% corrisponde a un nero totale e il 100% a un bianco totale. Questa impostazione è consigliata se un’immagine contiene vari colori di sfondo oppure uno sfondo con variazioni di ombreggiatura o gradiente. Per le operazioni OCR più comuni, si consiglia di disattivare l’impostazione della soglia fissa.
- Rileva orientamento testo. Le pagine vengono ruotate automaticamente se sono state digitalizzate con un’angolazione di 90, 180 o 270 gradi.
- Uniforma immagine a colori. Appiattisce i colori dell’immagine per rimuovere i difetti della compressione JPEG e facilitare il riconoscimento.
- Lingua. Selezionare la lingua in cui è scritto il testo digitalizzato.
- Qualità.
-
- Bassa (veloce). Indicata quando il testo nel documento digitalizzato è nitido e facile da riconoscere. Questa impostazione consente di effettuare scansioni più rapide.
- Media (media). Il riconoscimento è più preciso rispetto all’impostazione Bassa e i tempi di scansione possono risultare leggermente più lunghi.
- Alta (lenta). Consigliata per la scansione di testi più difficili da riconoscere. La scansione dura più a lungo perché i metodi di riconoscimento sono più complessi.
- Tipo.
-
- Testo modificabile. Ricostruisce l’intero documento, producendo un file PDF che contiene testo sia modificabile che ricercabile. Poiché questo metodo non conserva l’immagine digitalizzata originale, i risultati possono variare e si consiglia di utilizzare questa impostazione solo se il file PDF deve essere successivamente modificato.
- Immagine ricercabile. Aggiunge uno strato nascosto di testo per consentire le ricerche e la marcatura del testo (ad esempio tramite evidenziazione). Il testo, tuttavia, non può essere modificato in alcun modo.
- Downsampling immagini. Quando la scansione è completa, è possibile ridurre la risoluzione delle immagini digitalizzate.
- Fattore di compressione immagine. Più un’immagine viene compressa, minori saranno le dimensioni del file PDF risultante. Tuttavia, se il documento PDF dovrà essere stampato, si consiglia un fattore di compressione basso per assicurare una buona qualità di stampa.
- Incorpora font. Dopo il processo di scansione, se i font richiesti vengono trovati nel sistema, nel file PDF di output vengono salvati i font utilizzati per il riconoscimento del testo di output.