O OCR (Optical Character Recognition; reconhecimento óptico de caracteres) é uma funcionalidade que permite fazer o reconhecimento automático de texto em imagens, o que facilita a extração de dados para otimizar a descoberta de dados. A tecnologia OCR é otimizada para imagens de alta qualidade e está disponível em vários idiomas, embora tenha algumas limitações com relação a conteúdo escrito à mão.
Configurações recomendadas
Para obter melhores resultados, as imagens devem estar nítidas, ter a resolução recomendada e com as configurações mínimas de DPI.
- Resolução: 1024 x 768 pixels ou mais para obter os melhores resultados.
- DPI: 300 DPI no mínimo.
- Tipos de arquivo: JPG, JPEG, PNG.
Qualidade da imagem
- Resolução: o processamento de OCR requer uma resolução mínima de imagem de 640 x 480 pixels (aproximadamente 300 mil pixels). No entanto, para otimizar a precisão do reconhecimento de texto, recomenda-se usar imagens com resolução de pelo menos 1024 x 768 pixels.
- DPI (pontos por polegada): recomenda-se no mínimo 300 DPI.
- Nitidez da imagem: o texto deve ser nítido e legível. O OCR pode encontrar dificuldades ao processar imagens desfocadas ou de baixa qualidade.
Tipos de arquivo compatíveis
O OCR é compatível com formatos de arquivos de imagem mais comuns, como JPG, JPEG e PNG.
Idiomas compatíveis
O OCR é compatível com vários idiomas, o que torna a descoberta de dados mais abrangente em fontes de dados multilíngues.
Compatibilidade com texto escrito à mão
Os textos escritos à mão são processados sempre que possível. O reconhecimento pode variar conforme a clareza e o estilo da escrita.