検索可能なPDFファイルの作成時には、テキスト情報が保存される、テキストレイヤーという層が生成されます。
OCR ソフトの ABBYY FineReader では、検索可能なPDFファイルとして出力する際に、テキストレイヤーの位置を選択できます。
本ページでは、テキストレイヤー位置を選択する操作手順と、各設定の特長をご案内します。
【操作手順】
以下では、検索可能なPDF設定の各設定の特長についてご案内します。
-
テキストと画像のみ
認識結果のテキストと、関連付けられた写真のみが同じレイヤーに配置されます。
ページ画像は作成されないため、元の文書とは違う外観になる可能性がありますが、出力されたPDFファイルは文書内の文字検索に対応しています。
背景が含まれないためPDFファイルのサイズが小さくなります。
レイヤーが分かれていないため、編集を繰り返す文書に適しています。 -
ページ画像の上にテキスト
元の文書の背景と写真を、ページ画像として保存し、認識結果のテキストをページ画像の上に配置します。
テキストレイヤーが前面になるため、OCR処理後にテキストを編集した場合、編集結果が前面に表示されます。
そのため、元の文書とは違う外観になる可能性がありますが、編集結果を表示させたい場合に適しています。
出力されたPDFファイルは、文字検索に対応しています。
「テキストと画像のみ」と比べて元の文書に近くなりますが、ファイルサイズは大きくなります。 -
ページ画像の下にテキスト
ページ全体をページ画像として保存し、認識結果のテキストをページ画像の下に配置します。
ページ画像が前面に表示されるため、元の文書とほとんど同じ状態を維持できます。
文字検索にも対応しており、テキストのコピーなども可能ですが、テキストレイヤーが背面に配置されるため、認識したテキストを編集しても、外観上は確認できません。
外観を維持した検索可能なPDFファイルの作成方法として、最も推奨するタイプです。