lunes, 7 de febrero de 2011

Cómo extraer texto de una imagen




Utilizaremos el método conocido como OCR que sus siglas corresponden a Optical Charater Recognition, o en su traducción, reconocimiento óptico de caracteres. 
142fc496eac1104b24ae30fdcb1cffa1 
Para lograr esto utilizaremos el software FreeOCR V3 el cual puedes descargar desde el siguiente enlace. 

Si bien, el programa es gratis, este no es tan bueno ni exacto como los programas de pagados como el ABBYY FineReader (el cual trae una versión trial por 15 días o 20 impresiones). 

Una vez descargado, procederemos a instalar la aplicación, lo cual no nos traerá ningún inconveniente. 

Ahora ejecutaremos nuestra aplicación y tendremos una interfaz como la siguiente. 
 
Luego de abrir el programa instalaremos el idioma ESPAÑOL, ya que por defecto viene en Ingles. Para esto descargaremos el siguiente archivo, luego descomprimiremos el archivo y pegaremos su contenido en la carpeta C:WINDOWStessdata y reiniciamos nuestro programa. 
uego de abrir el programa instalaremos el idioma ESPAÑOL, ya que por defecto viene en Ingles. Para esto descargaremos el siguiente archivo, luego descomprimiremos el archivo y pegaremos su contenido en la carpeta C:WINDOWStessdata y reiniciamos nuestro programa. 


 

Seguido a esto haremos click en OPEN y elegimos la imagen a la cual deseemos extraer el texto. 

Ahora solo nos resta marcar la opción OCR y esperaremos a ver los resultados. 

En lo personal el programa no es de mi total agrado, ya que este falla bastante al no detectar 100% un tipo de fuente predefinida, es por eso que a continuación les traemos otra opción, más simple y rápida. 

Nuestra segunda opción es un servicio Web, al cual podemos ingresar por la dirección: http://www.free-ocr.com/ en donde nos encontraremos con la siguiente página. 



 

En donde marcaremos examinar, donde elegiremos la imagen a transformar en texto, luego escogemos el idioma, rellenamos el sistema de seguridad (re-captcha) y haremos click en “Send File”. 
 
Esperamos unos segundos y se desplegara una nueva pantalla con el texto extraído de la imagen que seleccionamos anteriormente. 
 
Por último les traemos una tercera y cuarta opción, las cuales también son servicios Web. Se trata de http://www.ocrterminal.com/, un sitio en el cual debemos registrarnos y se nos permitirá “scannear” hasta 20 páginas gratis, para luego cobrarnos por volumen mensual “scanneado”. Por último el sitio http://www.newocr.com/ el cual es muy similar al Free-Ocr y es completamente gratis.

0 comentarios:

Publicar un comentario en la entrada