Reconocimiento óptico de caracteres (OCR)

Método común de digitalización de textos impresos para poder editarlos electrónicamente, buscarlos, almacenarlos de forma más compacta, mostrarlos en línea y usarlos en procesos automáticos.

Escribiendo en el teclado

¿Qué es el OCR?

El reconocimiento óptico de caracteres o lector óptico de caracteres (OCR) es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en texto codificado por máquina, ya sea de un documento escaneado, una fotografía de un documento, una fotografía de una escena (por ejemplo, el texto de letreros y vallas publicitarias en una foto de paisaje) o del texto de los subtítulos superpuesto a una imagen (por ejemplo, de una emisión de televisión).

1
Entrada de datos a partir de registros de datos en papel impresos
Ejemplos: documentos de pasaporte, facturas, extractos bancarios, recibos computarizados, tarjetas de presentación, correo, impresiones de datos estáticos o cualquier documentación adecuada
2
Digitalización de textos impresos
Para que puedan editarse electrónicamente, buscarse, almacenarse de forma más compacta, mostrarse en línea, etc.
3
Uso en procesos de máquinas
Como la computación cognitiva, la traducción automática, la conversión de texto a voz (extraída), los datos clave y la minería de textos.