OCR は、画像内のテキストの自動認識を実現させる機能です。データの抽出を容易にしてデータ検出を強化します。OCR 機能は高画質の画像に最適化されており、さまざまな言語で利用可能です。手書きコンテンツについては、いくつかの考慮事項があります。
推奨設定
最良の結果を得るには、画像が鮮明で推奨される解像度となっており、最低限の DPI 設定を満たすようにします。
- 解像度:少なくとも 1024 x 768 ピクセル以上で、最適な結果を得られます
- DPI:最低 300 DPI
- ファイルの種類:JPG、JPEG、PNG
画像の品質
- 解像度:OCR 処理には、最低 640 x 480 ピクセル(約 300,000 ピクセル)の画像解像度が必要です。ただし、テキスト認識の精度を最適化するには、1024 x 768 ピクセル以上の画像解像度が推奨されます。
- DPI(ドット毎インチ):最低 300 DPI が推奨されます。
- 画像の鮮明さ:テキストは鮮明で読み取り可能なものでなければなりません。ぼやけた画像や品質の低い画像では OCR が困難になる可能性があります。
対応しているファイルの種類
OCR は、JPG、JPEG、PNG など、一般的な画像ファイル形式に対応しています。
対応している言語
OCR は複数の言語に対応しているため、多言語のデータソースの間で幅広くデータ検出を適用できるようになります。
手書きへの対応
手書きのテキストは、最善の努力の原則の基に処理されます。手書きの明瞭さやスタイルによって、どれほど認識されるかが異なる可能性があります。