"Después del juego es antes del juego"
Sepp Herberger

domingo, 19 de julio de 2020

Mejora de calidad en documentos escaneados

Con el asunto de la pandemia de Covid-19 muchos procesos de admisión de documentación se están realizando por medios telemáticos. La gente manda por correo o una aplicación web fotos de sus documentos realizadas con escasa pericia, usando la cámara del móvil con encuadres poco afortunados, que hacen que el documento sea ilegible y al imprimirlo gastemos tinta o tóner en cantidades vergonzosas.

La solución ideal sería escanear los documentos con un escáner auténtico o bien usar una aplicación de Android que mejore las fotos de los mismos, tipo CamScanner o JotNot, pero no es normal que los usuarios lo hagan así.

Para mejorar un poco esta situación sin tener que hacer un curso de retoque fotográfico hay varias herramientas y servicios que nos hacen un apaño, siempre que los que manejan las fotos estén interesados en guardarlas o imprimirlas con mejor calidad.

Para probar he cogido esta foto de una factura eléctrica (he quitado datos personales):


Como se puede apreciar, esta bastante mal encuadrada e iluminada.

La solución mas rápida es buscar servicios online que lo hagan. He estado usando dos:

  • IMGonline.com.ua:es una web ucraniana (eso da un poco de yuyu, pero no he visto nada raro) donde subimos la foto y se hace un procesado para limpiar la misma. Hay varios controles para ajustar el proceso, pero la verdad es que no los he usado. El resultado no está nada mal:

  • ScanWritr: es una herramienta mas completa, ya que permite además escribir encima o destacar con "rotulador fosforito virtual" el documento escaneado.


    Permite seleccionar el fragmento de imagen a procesar para quitar los bordes (incluso si está en perspectiva permite seleccionar un area con forma trapezoidal con la opción "Crop") y luego mejora el documento con la opción "Contrast". La imagen resultante podemos descargarla directamente o como PDF (le añade una marca de agua a no ser que nos suscribamos al servicio).


La otra opción es usar una aplicación de escritorio más o menos sencilla que lo haga. He encontrado dos: ScanTailor y ScanTailor-Advanced, que se supone es una mejora de la primera.

ScanTailor se puede instalar como paquete en cualquier Debian/Ubuntu, viene en los repositorios.

ScanTailor Advanced en cambio no está en los repositorios oficiales. En Manjaro si se puede instalar por AUR, pero en Ubuntu tenemos que instalar mediante un paquete snap con

# sudo snap install scantailor-advanced

El problema de los paquetes snap es que falla la ejecución si nuestros homes de usuario están en un servidor NFS (que es la forma habitual de trabajo en nuestros centros). Es un contratiempo que no acaban de arreglar los programadores del sistema de empaquetado snap.

La otra opción es descargar el paquete .deb realizado por un voluntario desde su PPA: https://notesalexp.org/. Enlace directo por si no queremos añadir el PPA.

Ambos programas tienen un entorno y manejo muy parecido, solo que el Advanced es mas atractivo visualmente y tiene mas opciones de ajuste fino. En mis pruebas rápidas no he notado diferencia apreciable entre uno y otro.

Al abrir la aplicación debemos elegir Nuevo Proyecto y luego indicar el directorio donde están las imágenes a procesar, seleccionando a continuación las que nos queramos tratar.


Despúes se van siguiendo los pasos de la izquierda (Corregir Orientación, Dividir, etc) hasta llegar a Salida, donde se procesa y muestra la imagen final:


La salida se guarda en el directorio "out" del directorio de trabajo:


Como se ve, el resultado final es más o menos el mismo para todas las herramientas probadas. Si nuestro objetivo es limpiar los documentos, que ocupen poco y que sean mas legibles e imprimibles cualquier solución nos valdrá. Para mejoras y ajustes mas finos habrá que mirar más a fondo cada solución hasta encontrar la más adecuada.

Otra opción que barajé es usar la aplicación noteshrink, que es muy potente. Tras varias pruebas me dí cuenta de que no sirve para este caso: la aplicación noteshrink tiene de entrada un documento escaneado de buena calidad y lo convierte en uno de calidad excelente, es decir: mejora lo bueno. Sobre un documento de baja calidad no hace nada destacable. Una pena.

Una vez resuelto todo, el verdadero reto es convencer a la persona que tiene que manejar los documentos para que haga el postproceso y no las guarde en formato fotocutre. Eso es otra guerra.


No hay comentarios:

Publicar un comentario