viernes, 7 de diciembre de 2007

ESCANEAR TEXTO, CON POSIBILIDADES DE EDICIÓN.



Actualmente la posibilidad de escanear un texto directamente de una imagen, documento, libro, revista o cualquier otro gráfico que contenga caracteres alfa numéricos en un idioma de amplio uso, es una realidad.
¿Nunca le ha pasado a usted que tarda horas enteras en redactar y teclear en su computadora un documento, luego lo imprime para revisión y cuando va a hacer las correcciones se da cuenta que el original electrónico ha desparecido de su computadora por arte de magia?; O ¿el caso de aquel viejo relato que en sus años mozos escribió en una máquina de escribir y ahora pretende recuperara y darle una “manita de gato”, pero tiene que volver a teclearlo todo en su actual computadora? Esto ya no es necesario con el OCR
Muchas personas tienen a la mano esta herramienta sin saber siquiera que existe y como usarla.

La mayoría de los software de escaneo proveídos al adquirir un escáner nuevo, integran un software de reconocimiento de caracteres óptico llamado OCR (Optical character recognition).
Para utilizarlo, ha nuestro escáner necesitamos indicarle en el botón Tipo de Salida que debe ser a modo de texto, configurar los parámetros del Botón Tipo de Imagen en blanco y negro (muy recomendable aún cuando el texto sea a color) y darle clik en escanear o guardar ahora, el resultado será un archivo tipo Notepad o Bloc de notas que se situará en el lugar donde usualmente se almacenan las imágenes que usted adquiere desde su escáner, este archivo generado en RTF o Texto sin Formato (según su software OCR) podrá abrirlo en cualquier editor de textos (Word, Works, Word Perfect, Open Ofice, etc) y tendrá que revisarlo línea por línea ya que suele tener algunos errores de interpretación, especialmente con caracteres especiales cómo acentos, paréntesis, corcheas, símbolos de pesos, diéresis, etc., dependiendo de la calidad del software OCR que se tenga el nivel de acierto del programa en un texto escrito en computadora, máquina de escribir o impreso con buena calidad oscilara entre un 95 y 100 por ciento.
No obstante si usted se da cuenta de que el software de manejo de su escáner no integra OCR, no se preocupe existen muchos programas de este tipo gratuitos y otros comerciales que le darán un estupendo servicio y le harán la vida más amable.

GOCR
Un OCR de distribución libre sólo para Linux, en sus distribuciones Redhat Fedora, SUSE, Debian decárguelo aquí.


Tesseract-OCR
De distribución gratuita que funciona en Windows, Linux, Ubuntu y Mac. Soporta Inglés, Español, Francés, Italiano y Alemán. Descárguelo aquí.

Abby fine reader:
La mamá de los OCR es Abby Fine Reader, un software compatible con Windows XP y Vista, (requiere cómo mínimo 1gb de memoria ram), con infinitas prestaciones, le permite autocorrección, cambiar de idioma de escaneo, guardar el resultado en el formato de texto que prefiera, discrimina o incluye imágenes, diseño y gráficos; puede funcionar fotografiando los documentos con cámara digital, o con cualquier imagen digitalizada que tenga en su ordenador. Una maravilla de software. Su costo es más bien difícil de digerir, pero vale la pena. Descargue un demo funcional para escanear hasta 50 páginas y guardar todas (de una por una) por 15 días aquí.

Readiris:
Otro magnifico software OCR con calidad un poco menor que Abby Fine Reader, pero con un costo también menor. Soporta más de 160 idiomas, funciona a través de escáner o cámara digital y cuenta con una interface renovada en un 100%, en español. Descarga la demo funcional durante treinta días aquí:


Sea cual sea su elección TUBA LIBRE le recomienda que se olvide de volver a transcribir montones de documentos impresos con el OCR, ¿ya checo en su escáner? A la mejor ya lo tiene…

Éste artículo se publicó el viernes 7 de diciembre de 2007 en el periódico Ecos de la Costa de Colima, México.

Ahí'la