OCR とは

OCR(光学文字認識)とは、コンピューターが画像から文字情報を読み取り、テキストデータ(コンピューター上の文字)として検出できるようにする技術です。
OCR ソフトウェアは、画像ファイルや PDF ファイルから、テキストデータ(文字情報)、画像データ、表データ、記号データなどを認識して、他のアプリケーションで使用できるようにするソフトウェアの総称です。

例えば、複合機やスキャナで文献などをスキャンして画像ファイルにします。
このままでは、このファイルは画像データとしてしか使用できません。
しかし、OCR 処理を実行すれば、画像データをテキストデータに変換することができます。

このように、画像や、文字検索ができない PDF ファイルに OCR 処理を実行することで、
画像内や PDF ファイル内の文字を読み取り、Word や Excel ファイルなどへのファイル変換や、
テキストデータや表データのみを貼り付けることができます。

この技術を使用すれば、画像 PDF と呼ばれる、文字検索に対応していない PDF ファイルを、検索可能な PDF ファイルに変換することや、PDF ファイルを Word や Excel などファイル形式に変換することができます。

OCR処理前後

ABBYY FineReader では、ページ画像の上または下に、認識したテキストデータを置くことで、同じ外観を保ちながら、文字検索ができる PDF ファイルなどが作成することができます。

テキストレイヤー

この認識されたテキストデータは、テキストレイヤー や、透明テキスト と呼ばれています。
このテキストレイヤーを含む PDF ファイルを、検索 PDF、テキストレイヤーを含まない PDF を、画像 PDF と呼びます。

カテゴリー: その他   タグ: , , ,   この投稿のパーマリンク