OCR é a abreviação de reconhecimento óptico de caracteres. É uma tecnologia para extrair texto de arquivos PDF digitalizados ou PDF de imagem. Ele permite ao usuário editar, copiar e pesquisar o texto do documento PDF/imagem PDF digitalizado.
Você pode obter mais informações neste link: http://en.wikipedia.org/wiki/Optical_character_recognition