本ページでは、OCRの認識精度を向上させるヒントをご案内します。
- PDFまたは画像ファイルの解像度は、300 ~ 600 dpi を推奨します。
600 dpi 以上にしても、認識精度が大幅に改善されることはなく、OCR処理速度が遅くなるデメリットが発生します。
解像度が非常過ぎる(150 dpi以下)と、OCR結果に悪影響を及ぼします。 - フォントサイズは 10pt 以上を推奨します。
フォントサイズが 9pt 以下の場合、認識精度が下がっていきます。 - 紙文書をスキャンされる場合、グレースケール以上を推奨します。
白黒(モノクロ)データにすることで、OCR処理の速度が大幅に向上しますが、コントラストが低い画像の場合、OCR品質が低下する可能性があります。
また、写真や雑誌、中国語、日本語、韓国語のテキストでは、白黒は推奨されません。 - 文字にかすれが多い場合(下図参照)、[ツール] > [オプション] > [OCR] を開き、ドキュメントタイプで「タイプライター」を選択します。
ノイズや歪みが多い場合(下図参照)は、「FAX」を選択します。
多くの文書では、プログラムが自動で印刷タイプを検出します。基本的には 「自動」 を選択した状態で問題ありません。