検索可能なPDFファイルのテキスト | OCRソフトの ABBYY FineReader PDF

検索可能なPDFファイルの作成時には、テキスト情報が保存される、テキストレイヤーという層が生成されます。

OCR ソフトの ABBYY FineReader PDF では、検索可能なPDFファイルとして出力する際に、テキストレイヤーの位置を選択できます。
本ページでは、テキストレイヤー位置を選択する操作手順と、各設定の特長をご案内します。

【操作手順】

[詳細オプション] ＞ [形式設定] に移動します。
OCRエディタをご利用の場合は、[ツール] ＞ [オプション] ＞ [形式設定]
画面中段の検索可能なPDF設定で目的の配置方法を選択します。
[OK] をクリックして、オプション画面を閉じます。
をクリックします。
OCRエディタをご利用の場合は、をクリックします。
PDFファイルの保存先を指定して、ファイル名を入力後、[保存] ボタンをクリックします。

以下では、検索可能なPDF設定の各設定の特長についてご案内します。

テキストと画像のみ

認識結果のテキストと、関連付けられた写真のみが同じレイヤーに配置されます。
ページ画像は作成されないため、元の文書とは違う外観になる可能性がありますが、出力されたPDFファイルは文書内の文字検索に対応しています。
背景が含まれないためPDFファイルのサイズが小さくなります。
レイヤーが分かれていないため、編集を繰り返す文書に適しています。
ページ画像の上にテキスト

元の文書の背景と写真を、ページ画像として保存し、認識結果のテキストをページ画像の上に配置します。
テキストレイヤーが前面になるため、OCR処理後にテキストを編集した場合、編集結果が前面に表示されます。
そのため、元の文書とは違う外観になる可能性がありますが、編集結果を表示させたい場合に適しています。
出力されたPDFファイルは、文字検索に対応しています。
「テキストと画像のみ」と比べて元の文書に近くなりますが、ファイルサイズは大きくなります。
ページ画像の下にテキスト

ページ全体をページ画像として保存し、認識結果のテキストをページ画像の下に配置します。
ページ画像が前面に表示されるため、元の文書とほとんど同じ状態を維持できます。
文字検索にも対応しており、テキストのコピーなども可能ですが、テキストレイヤーが背面に配置されるため、認識したテキストを編集しても、外観上は確認できません。
外観を維持した検索可能なPDFファイルの作成方法として、最も推奨するタイプです。

テキストと画像のみ

ページ画像の上にテキスト

ページ画像の下にテキスト