表内のテキストの認識精度を改善 | OCRソフトの ABBYY FineReader PDF

本ページでは、ABBYY FineReader PDF で認識した、表内のテキストの認識精度を向上させる方法をご案内します。
セル内のテキストが文字化けしている場合などにご活用いただけます。
以下では、A3 セルと J3 セルの文字化けを改善させます。

【操作手順】

ABBYY FineReader PDF の OCR エディタで、対象となる表が含まれる画像または PDF を開きます。
自動で認識を無効化されている場合、認識領域を手動で指定します。
またはをクリックして、文書全体を認識させます。
表として認識された領域をクリックして、表示されたツールバー (フローティングバー) の、をクリックします。
OCRエディタ右側の認識結果を確認し、罫線の追加と削除、セルの結合と分割を参考に、罫線やセルを編集して表の状態を整えます。
本ページでは、3行目と4行目の間に挿入されている罫線を削除しました。
任意のファイル形式で保存します。
下図は Excel (XLSX) 形式での出力結果です。「受入金額」や「残高」の認識結果が、操作前(上図) から改善されています。