Adobe Export PDF では、PDF ファイルを Word(.doc、.docx)、Excel(.xlsx)または RTF(リッチテキスト形式)に変換する際に、光学文字認識(OCR)をサポートしています。OCR は、テキスト(スキャンされたテキスト)の画像を編集可能な文字に変換して、テキストを検索、修正およびコピーできるようにする機能です。 

OCR を有効にすると、Adobe Export PDF では、画像、ベクトルアート、非表示テキストまたはこれらの要素の組み合わせが含まれる PDF ファイルに対して OCR が実行されます(例えば、Adobe Export PDF では、スキャンされた文書から作成された PDF ファイルに対して OCR が実行されます)。また、ソースアプリケーションで不正にエンコードされた解釈不可能なテキストに対しても OCR が実行されます。

サポートされている言語

Adobe Export PDF の OCR では、次の言語がサポートされています。

「PDF を書き出し」 のサポートされている言語

デフォルトでは、ユーザー情報ダイアログボックスで選択されている言語が OCR で使用されます。OCR エンジンは、選択された言語を使用して、スキャンされたテキストを解釈します。正しい言語を選択することにより、変換の精度が向上します。OCR エンジンでその言語固有の辞書が変換に使用されるからです。日本語などの非ラテン言語の場合、ユーザーが適切な言語を選択しなければ、OCR エンジンがテキストを解釈して変換することはできません。

「PDF を書き出し」のWeb インターフェイスの使用

Adobe ExportPDF での PDF ファイルの変換時に OCR を実行するには、次の操作を行います。

  1. Adobe ExportPDF にログインし、「書き出す PDF ファイルを選択」をクリックします。

  2. マイコンピューターからファイルを選択」をクリックし、PDF を探します。または、ファイルをパネルにドラッグすることもできます。Document Cloud からファイルを選択するには、左側のパネルで「Document Cloud」をクリックし、ファイルを選択します。

    注意:書き出すファイルは複数選択することができます。

    「PDF を書き出し」のWeb インターフェイス
    「PDF を書き出し」のWeb インターフェイス

  3. 変換」ドロップダウンリストで、PDF を書き出す形式を選択します。

  4. 文書の言語」ドロップダウンリストで、テキスト認識用の適切な文書の言語を選択します。

  5. <format> に書き出し」ボタンをクリックして、内容を書き出します。

  6. ファイルが変換されると、確認メッセージが表示され、変換されたファイルを開くまたはダウンロードするためのリンクが提供されます。

    確認

Acrobat Reader DC の使用

  1. 変換する PDF を開き、右側のペインで「Adobe Export PDF」をクリックします。

  2. 変換」ボタンの上の「文書の言語:<language selected>」で、認識された文書の言語を確認します。選択された言語が正しい場合は、次のステップに進みます。

    正しくない場合は、選択された言語を変更します。

      i.) 「変更」をクリックします。

    Acrobat Reader DC からの PDF の書き出し

      ii.) OCR 設定ダイアログボックスの「次の言語でテキストを認識」リストで適切な言語を選択し、「OK」をクリックします。

  3. 変換」をクリックし、変換プロセスを開始します。

  4. ファイルが変換されると、確認メッセージが表示され、変換されたファイルを開くまたは保存するためのリンクが提供されます。

    確認

 

本作品は Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License によってライセンス許可を受けています。  Twitter™ および Facebook の投稿には、Creative Commons の規約内容は適用されません。

法律上の注意   |   プライバシーポリシー