検索可能なPDFファイルのテキストについて

検索可能なPDFファイルの作成時には、テキスト情報が保存される、テキストレイヤーという層が生成されます。

OCR ソフトの ABBYY FineReader では、検索可能なPDFファイルとして出力する際に、テキストレイヤーの位置を選択できます。
本ページでは、テキストレイヤー位置を選択する操作手順と、各設定の特長をご案内します。

【操作手順】

  1. [詳細オプション][形式設定] に移動します。
    OCRエディタをご利用の場合は、[ツール][オプション][形式設定]
  2. 画面中段の検索可能なPDF設定で目的の配置方法を選択します。
    検索可能PDF設定
  3. [OK] をクリックして、オプション画面を閉じます。
  4. PDFに変換するボタン をクリックします。
    OCRエディタをご利用の場合は、PDFとして保存 をクリックします。
  5. PDFファイルの保存先を指定して、ファイル名を入力後、[保存] ボタンをクリックします。

以下では、検索可能なPDF設定の各設定の特長についてご案内します。

  • テキストと画像のみ

    認識結果のテキストと、関連付けられた写真のみが同じレイヤーに配置されます。
    ページ画像は作成されないため、元の文書とは違う外観になる可能性がありますが、出力されたPDFファイルは文書内の文字検索に対応しています。
    背景が含まれないためPDFファイルのサイズが小さくなります。
    レイヤーが分かれていないため、編集を繰り返す文書に適しています。
    テキストと画像のみ

  • ページ画像の上にテキスト

    元の文書の背景と写真を、ページ画像として保存し、認識結果のテキストをページ画像の上に配置します。
    テキストレイヤーが前面になるため、OCR処理後にテキストを編集した場合、編集結果が前面に表示されます。
    そのため、元の文書とは違う外観になる可能性がありますが、編集結果を表示させたい場合に適しています。
    出力されたPDFファイルは、文字検索に対応しています。
    「テキストと画像のみ」と比べて元の文書に近くなりますが、ファイルサイズは大きくなります。

  • ページ画像の下にテキスト

    ページ全体をページ画像として保存し、認識結果のテキストをページ画像の下に配置します。
    ページ画像が前面に表示されるため、元の文書とほとんど同じ状態を維持できます。
    文字検索にも対応しており、テキストのコピーなども可能ですが、テキストレイヤーが背面に配置されるため、認識したテキストを編集しても、外観上は確認できません。
    外観を維持した検索可能なPDFファイルの作成方法として、最も推奨するタイプです。
    ページ画像の下にテキスト