Método común de digitalización de textos impresos para poder editarlos electrónicamente, buscarlos, almacenarlos de forma más compacta, mostrarlos en línea y usarlos en procesos automáticos.
El reconocimiento óptico de caracteres o lector óptico de caracteres (OCR) es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en texto codificado por máquina, ya sea de un documento escaneado, una fotografía de un documento, una fotografía de una escena (por ejemplo, el texto de letreros y vallas publicitarias en una foto de paisaje) o del texto de los subtítulos superpuesto a una imagen (por ejemplo, de una emisión de televisión).