OCR es el tipo de software encargado del reconocimiento óptico de caracteres, generalmente para texto de algún documento escaneado, otras imágenes de tu ordenador, etc. donde aparezcan textos.
En internet existen algunos servicios web para convertir online los documentos escaneados, PDF y otros formatos de imagen que ya tengas almacenados.
Aquí alguno de ellos: …