El plug-in de OCR I.R.I.S. se integra completamente con Nitro PDF Professional para permitirle reconocer texto de las páginas escaneadas o de imágenes de documentos PDF abiertos. La utilidad OCR es plenamente personalizable y permite configurar opciones como la corrección de imágenes torcidas o la configuración de compresión de imagen. También puede activar el reconocimiento de texto de escáneres directamente en el cuadro de diálogo Crear PDF De Escáner con el fin de crear documentos PDF automáticamente a partir de las páginas escaneadas con texto, un texto que podrá modificar y en el que podrá realizar búsquedas.

Para configurar las preferencias de OCR:

  1. Haga clic en el botón Nitro PDF Professional de color naranja situado en la esquina superior izquierda de la aplicación.
  2. Haga clic en el botón Preferencias, situado en la parte inferior del menú principal.
  3. En el cuadro de diálogo Preferencias, haga clic en OCR en la columna de categorías.

Preferencias generales de OCR

Las preferencias generales para configurar la funcionalidad OCR se dividen en 3 categorías que incluyen las siguientes opciones:

  • Corregir sesgo de imagen. Endereza un texto que está torcido en el documento escaneado.
  • Usar umbral fijo. El establecimiento de umbral es el proceso de análisis del histograma de una imagen con el objetivo de distinguir el texto del fondo. Un umbral fijo aplica el mismo punto de corte a toda la imagen, en lugar de localizar el texto dinámicamente. Los valores porcentuales indican al punto de contraste idóneo entre negros y blancos para reconocer texto, siendo el 0% totalmente oscuro y el 100% totalmente blanco. Esta configuración se recomienda si una imagen contiene diferentes colores de fondo, o bien un fondo con variaciones de sombreado o gradiente. Para la realización de operaciones OCR comunes, se recomienda desactivar el valor de umbral fijo.
  • Detectar orientación del texto. Gira la página automáticamente cuando ésta se escanea con un ángulo de 90, 180 o 270 grados.
  • Suavizar imagen en color. Suaviza los colores de la imagen para eliminar los defectos de la compresión JPEG y contribuir al reconocimiento.
  • Idioma. Seleccione el idioma en el que está escrito el texto escaneado.
  • Calidad.
    • Baja (rápido). Se utiliza sobre todo cuando el texto del documento escaneado es muy nítido y fácil de reconocer. Esta configuración permite realizar el escaneado rápidamente.
    • Intermedia (intermedio). El reconocimiento es más preciso que con la configuración Baja y puede que el tiempo de escaneado sea ligeramente superior.
    • Alta (lento). Se recomienda para escaneado de texto que resulta difícil de reconocer. El escaneado con esta configuración tarda más, ya que los métodos de reconocimiento son más complejos.
  • Tipo.
    • Texto editable. Regenera todo el documento y da como resultado un archivo PDF que contiene texto editable y apto para búsquedas. Dado que este método no conserva la imagen escaneada original, los resultados pueden variar, por lo que sólo se recomienda si es necesario realizar cambios en el archivo PDF.
    • Imagen texto apta para búsquedas. Añade una capa de texto oculta para permitir la realización de búsquedas y que pueda marcarse el texto (por ejemplo, resaltarlo). No obstante, el texto no puede modificarse en modo alguno.
  • Reducir muestreo de imágenes. Una vez finalizado el escaneado, podrá reducir la resolución de las imágenes escaneadas.
  • Factor de compresión de imagen. Cuanto mayor es la compresión de imagen, menor es el tamaño del archivo PDF resultante. No obstante, si el documento PDF se va a imprimir, se recomienda utilizar una compresión baja para mantener la calidad.
  • Incrustar fuentes. Tras el proceso de escaneado, si las fuentes necesarias se encuentran en el sistema, el archivo PDF de salida almacenará las fuentes utilizadas para reconocer el texto.

Preferencias