認識精度を向上させるヒント1

本ページでは、OCRの認識精度を向上させるヒントをご案内します。

  1. PDFまたは画像ファイルの解像度は、300 ~ 600 dpi を推奨します。
    600 dpi 以上にしても、認識精度が大幅に改善されることはなく、OCR処理速度が遅くなるデメリットが発生します。
    解像度が非常過ぎる(150 dpi以下)と、OCR結果に悪影響を及ぼします。
  2. フォントサイズは 10pt 以上を推奨します。
    フォントサイズが 9pt 以下の場合、認識精度が下がっていきます。
  3. 紙文書をスキャンされる場合、グレースケール以上を推奨します。
    白黒(モノクロ)データにすることで、OCR処理の速度が大幅に向上しますが、コントラストが低い画像の場合、OCR品質が低下する可能性があります。
    また、写真や雑誌、中国語、日本語、韓国語のテキストでは、白黒は推奨されません。
  4. 文字にかすれが多い場合(下図参照)、[ツール][オプション][OCR] を開き、ドキュメントタイプで「タイプライター」を選択します。
    タイプライター
    ノイズや歪みが多い場合(下図参照)は、「FAX」を選択します。
    fax
    多くの文書では、プログラムが自動で印刷タイプを検出します。基本的には 「自動」 を選択した状態で問題ありません。