認識結果の修正方法

本ページでは、OCR処理後の文書から、信頼性が低い文字を含む単語を自動検出して、修正提案を行う検証機能をご案内します。

【操作手順】

  1. OCR エディタで PDF または 画像ファイルの OCR 処理を実行します。
    OCR エディタの操作方法については、OCR エディタについて をご参照ください。
  2. メイン ツールバー右にある検証ボタンをクリックして、検証ダイアログボックスを開きます。
    または、[認識] > [テキストの検証] をクリックします。
  3. 信頼性の低い文字が強調表示された、検証ダイアログボックス(下図)が開きます。
    ダイアログの上部のボックスには、信頼性の低い単語を含む文章が表示され、下部のボックスには、認識されているテキストが表示されます。
    右側のボックスには、認識された文字や単語の修正候補が表示されます。
    中国語、日本語、韓国語で書かれた文字の場合、「信頼性が低い文字」として認識された文字と外観が類似した文字を、認識候補として提案します。
  4. 候補の文字に修正する場合、[置換] をクリックします。
    候補内に適切な文字がない場合、テキストボックス内でのテキストの直接編集も可能です。
    候補に該当文字が見つからない場合、「信頼性の低い文字です。文字が正しく認識されているかどうか確認してください。」と表示されますので、直接編集します。
    必要に応じて、フォントの種類、サイズ、装飾(太字、斜体、下線)などを変更できます。
  5. 修正後 または 表示されている文字が正しければ [スキップ] をクリックして、次の文字の検証に移動します。
  6. 手順4と5の作業を繰り返し、すべてを修正するか [閉じる] をクリックして、検証ダイアログを終了します。
  7. 修正後の文書に問題がなければ、任意の形式でファイルを保存します。
カテゴリー: OCR, 高度な編集   タグ: , , ,   この投稿のパーマリンク