L’OCR est une fonctionnalité de reconnaissance automatique de texte dans des images, facilitant l’extraction de données pour optimiser la découverte des données. Le service OCR est optimisé pour les images de haute qualité et est disponible dans différentes langues, avec certaines dispositions pour le contenu manuscrit.
Paramètres recommandés
Pour de meilleurs résultats, assurez-vous que les images sont claires, offrent la résolution recommandée et respectent les paramètres de DPI minimum.
- Résolution : 1024 × 768 pixels ou plus pour des résultats optimaux
- DPI : 300 DPI minimum
- Types de fichiers : JPG, JPEG, PNG
Qualité de l’image
- Résolution : le traitement OCR nécessite une résolution d’image minimale de 640 × 480 pixels (environ 300 000 pixels). Cependant, pour optimiser la précision de la reconnaissance de texte, une résolution d’image de 1024 × 768 pixels minimum est recommandée.
- DPI (points par pouce) : un minimum de 300 DPI est recommandé.
- Clarté de l’image : le texte doit être clair et lisible. L’OCR peut rencontrer des difficultés avec les images floues ou de faible qualité.
Types de fichiers pris en charge
L’OCR prend en charge les formats de fichiers d’image courants, comme JPG, JPEG et PNG.
Langues prises en charge
L’OCR est compatible avec plusieurs langues, ce qui permet de l’appliquer à la découverte de données issues de sources multilingues.
Prise en charge des textes manuscrits
Les textes manuscrits sont traités dans la mesure du possible. Le niveau de reconnaissance peut varier en fonction de la clarté et du style de l’écriture.