はじめる前に
アドビは、より直感的で新しい製品エクスペリエンスの提供を開始します。表示された画面が製品インターフェイスと一致していない場合は、現在の機能のヘルプを選択してください。
紙の文書をスキャンし、Acrobat を使用して、選択可能なテキストを含むスマートで検索可能な PDF に変換します。
はじめる前に
アドビは、より直感的で新しい製品エクスペリエンスの提供を開始します。表示された画面が製品インターフェイスと一致していない場合は、現在の機能のヘルプを選択してください。
スキャナーと Acrobat を使用して、紙の文書から直接 PDF ファイルを作成できます。Windows では、Acrobat は TWAIN スキャナードライバーおよび Windows Image Acquisition(WIA)ドライバーをサポートしています。Mac OS では、Acrobat は TWAIN および Image Capture(ICA)をサポートしています。
Windows では、「カラーモードを自動検出」を使用して、Acrobat で紙の文書のコンテンツタイプを判断するか、またはその他のプリセット(白黒文書、グレースケール文書、カラー画像およびカラー文書)を使用できます。スキャンプリセットを設定するか、または、「カスタムスキャン」オプションを使用して選択した設定でスキャンできます。
スキャンプリセットは、「スキャナーのネイティブインターフェイスを非表示」モードをサポートするスキャナードライバーでのみ使用できます。スキャンプリセットは、Mac OS 上では使用できません。
Windows で、スキャナーの WIA ドライバーがインストールされている場合は、スキャンボタンを使用して PDF を作成できます。スキャンボタンを押し、Windows の登録されたアプリケーションの一覧から Adobe Acrobat を選択します。次に、Acrobat のスキャンインターフェイスで、スキャナーと文書プリセットを選択するか、「カスタムスキャン」を選択します。
Acrobat で紙の文書をスキャンして PDF にするには、すべてのツール/PDF を作成を選択します。「任意の形式から PDF を作成」インターフェイスが表示されます。利用可能なオプションを表示するには、「スキャナー」を選択します。
Windows の場合:
Mac の場合:
すべてのツール/PDF を作成/スキャナー/カラーモードを自動検出を選択します。
これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。
複数のファイルをスキャンして PDF に変換するには、設定 アイコンを選択します。「カスタムスキャン」インターフェイスが表示されます。「追加のページをスキャンするように指示」を選択します。
「スキャン」を選択します。
他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」を選択します。
ツール/PDF を作成/スキャナー/「ドキュメントプリセット」を選択します。
これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。
複数のファイルをスキャンして PDF に変換するには、設定 アイコンを選択します。「カスタムスキャン」インターフェイスが表示されます。「追加のページをスキャンするように指示」を選択します。
「スキャン」を選択します。
他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」を選択します。
すべてのツールを表示/PDF を作成/スキャナー/デフォルト設定またはカスタム設定 を選択します。
これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。
設定を変更したい場合は、設定 アイコンを選択します。「カスタムスキャン」インターフェイスが表示されます。必要に応じてスキャンオプションを選択します。
複数のファイルをスキャンして PDF に変換するには、「追加のページをスキャンするように指示」を選択します。
Acrobat ユーザーインターフェイスでなくスキャナーのユーザーインターフェイス表示を使用すると指定した場合は、他のウィンドウやダイアログボックスが表示されます。利用可能なオプションについて詳しくは、スキャナーのマニュアルを参照してください。Mac OS では、スキャナーのユーザーインターフェイスが常に表示されます。
「スキャン」を選択します。
他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」を選択します。
すべてのツール/スキャンと OCR/スキャンされたファイルを補正を選択します。
第 2 ツールバーでオプションを選択します。設定 アイコンを選択し、スキャンされた PDF を補正ダイアログボックスで適切なオプションを選択し、「OK」を選択します。
このダイアログボックスに表示されるオプションについて詳しくは、スキャンされた PDF を補正ダイアログボックスを参照してください。
すべてのツール/PDF を作成/スキャナーを選択します。
事前定義されたスキャン設定(カラーモード自動検出、白黒文書、カラー文書、グレースケール文書またはカラー写真)を選択します。
プリセットの横にある設定 アイコンを選択します。選択に基づいて、「カスタムスキャン」または「事前定義された設定を構成」インターフェイスが表示されます。
複数のファイルをスキャンして PDF に変換するには、「追加のページをスキャンするように指示」を選択します。
設定を保存を選択してプリセットを保存します。
スキャナーを選択したら、要件に合わせて様々なスキャンオプションの選択や調整をおこなえます。
スキャンされた PDF を補正ダイアログボックスでは、スキャンされた画像を PDF 用にフィルタリングおよび圧縮する画像設定を制御します。通常はデフォルト設定で十分ですが、設定をカスタマイズして、画像の品質を向上させたり、ファイルサイズを小さくしたり、スキャンの問題を解決したりできます。
文書の言語
デフォルトでは、OCR の言語は、デフォルトのロケールから選択されます。言語を変更するには、「編集」をクリックし、別の言語を選択します。
出力
「検索可能な画像」または「編集可能なテキストと画像」のどちらかです。
Acrobat では、10 ~ 3000 dpi のスキャン画像を使用できます。「PDF の出力形式」で「検索可能な画像」または「ClearScan」を選択した場合、72 dpi 以上の解像度を入力する必要があります。また、600 dpi より大きい解像度を入力すると、600 dpi 以下にダウンサンプリングされます。
劣化なし圧縮は白黒画像にのみ適用可能です。スキャン画像に劣化なし圧縮を適用するには、スキャンされた PDF を最適化ダイアログボックスの最適化オプションで、白黒画像の CCITT グループ 4 または JBIG2(劣化なし)のいずれかのオプションを選択します。この画像を PDF 文書に追加して、ファイルを「保存」オプションで保存すると、画像は非圧縮のまま保持されます。「名前を付けて保存」を使用して PDF を保存すると、スキャンした画像は圧縮されることがあります。
ほとんどのページでは、300 dpi の白黒スキャンで変換に最適なテキストが生成されます。150 dpi では、OCR の精度が少し低下し、フォント認識エラーが増えます。400 dpi 以上の解像度では、処理が遅くなり、圧縮ページのサイズが大きくなります。ページに判読不可能なテキストや 9 ポイント以下の小さい文字が多数含まれている場合は、解像度を上げてスキャンします。可能であれば、白黒でスキャンします。
「OCR を使用してテキストを認識」を無効にした場合は、10~3000 dpi の解像度でスキャンできますが、推奨される解像度は 72 dpi 以上です。アダプティブ圧縮の場合、推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。
24-bit カラー、300 dpi、8-1/2 x 11 インチ(21.59 x 27.94 センチ)でスキャンしたページは、圧縮前で 25MB という大きなサイズになります。画像のスキャンには、50 MB 以上の仮想メモリが必要になります。600 dpi では、300 dpi の場合と比べてスキャンおよび処理に約 4 倍の時間がかかります。
スキャナーのディザやハーフトーンの設定は使用しません。これらの設定によって写真の画質は向上しますが、テキストは判読が難しくなります。
色付きの紙に印刷されているテキストの場合は、明るさとコントラストを 10% 程度上げてみます。スキャナーがカラーフィルター機能を備えている場合は、フィルターまたはランプを使用して背景色をドロップアウトすることを検討します。テキストが鮮明でないかドロップアウトしたときに不鮮明になる場合は、スキャナーのコントラストと明るさを調整して鮮明にします。
スキャナーの明るさを手動で調整できる場合は、文字がはっきり正しく読み取られるように調整します。文字と文字がつながっている場合は、明るさの設定を高くします。文字がばらばらになってしまう場合は、明るさの設定を低くします。
スキャナーのエラーや問題を解決するには、トラブルシューティングに関する以下の文書を参照してください。
Acrobat を使用して、以前スキャンして PDF に変換した文書のテキストを認識できます。OCR ソフトウェアを使用して、スキャンした PDF に含まれるテキストの検索、修正、コピーを行うことができます。OCR を PDF に適用するには、元のスキャナー解像度が 72 dpi 以上に設定されている必要があります。
300 dpi でスキャンすると、変換に最適なテキストが生成されます。150 dpi では OCR の精度がわずかに低くなります。
すべてのツール/スキャンと OCR/このファイル内を選択します。
第 2 ツールバーに「テキスト認識」オプションが表示されます。
第 2 ツールバーで、テキスト認識のページ範囲と言語を選択します。
必要に応じて、「設定」をクリックしてテキスト認識ダイアログボックスを開き、オプションを指定します。
テキスト認識を選択します。Acrobat によって、検索可能な(新しい文書にコピー&ペースト可能な)PDF にテキストレイヤーが作成されます。
すべてのツール/スキャンと OCR/複数のファイル内を選択します。
テキスト認識ダイアログボックスで「ファイルを追加」を選択してから、「ファイルを追加」、「フォルダーを追加」、「開いているファイルを追加」のいずれかを選択します。次に、ファイルまたはフォルダーを選択します。出力オプションダイアログボックスが表示されます。
出力オプションダイアログボックスで、出力ファイルのターゲットフォルダーとファイル名の設定を指定します。「OK」を選択します。
テキスト認識 - 一般設定ダイアログボックスで、オプションを指定し、「OK」を選択します。
Acrobat によって、検索可能な(新しい文書にコピー&ペースト可能な)PDF にテキストレイヤーが作成されます。
文書の言語
文字を認識するために使用する OCR エンジンの言語を指定します。
出力(PDF 出力形式)
作成する PDF の種類を指定します。どのオプションも、72 ppi 以上(推奨)の入力解像度が必要です。どの形式でも、テキスト画像に対して OCR およびフォントとページ認識が適用され、通常のテキストに変換されます。
検索可能な画像
テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、必要に応じてゆがみが補正され、その上に非表示のテキストレイヤーが配置されます。同じダイアログボックスの「画像のダウンサンプリング」の選択項目では、画像をダウンサンプルするかどうかや、ダウンサンプリングのレベルを指定します。
検索可能な画像(非圧縮)
テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、その上に非表示のテキストレイヤーが配置されます。元の画像を忠実に再現する必要がある場合は、このオプションを選択することをお勧めします。
編集可能なテキストと画像
元のフォントに似た新しいカスタムフォントを合成し、低解像度のコピーを使用してページの背景を保持します。
ダウンサンプル
OCR が完了した後に、カラー、グレースケール、白黒の各画像のピクセル数を減らします。適用するダウンサンプリングのレベルを選択します。オプションの数値を高くすると、ダウンサンプリングがあまり適用されず、高い解像度の PDF が作成されます。
スキャンした出力上で OCR を実行する場合、Acrobat ではテキストのビットマップを分析し、これらのビットマップ領域を単語および文字に置き換えます。最適な置き換え語句が不明の場合、Acrobat はその単語を不明テキストとしてマークします。不明テキストは、ビップマップ上は元のテキストとして PDF に表示され、テキストのビットマップの背後の非表示のレイヤーにも含まれています。この方法により、ビットマップとして表示されている単語も検索可能になります。
注意:OCR を適用せずにスキャンした PDF でテキストを選択しようとした場合、または画像ファイルに対して読み上げ操作を実行しようとした場合、Acrobat は、OCR を実行するかどうかを確認するメッセージを表示します。「OK」を選択すると、テキスト認識ダイアログボックスが表示され、オプションを選択できるようになります。これらのオプションについては、前のトピックで詳しく説明しています。
すべてのツール/スキャンと OCR/認識されたテキストを修正を選択します。
Acrobat は、エラーの可能性のあるテキストを識別し、画像とテキストを第 2 ツールバーに横に並べて表示しますページ上のすべての不明テキストの周囲にボックスが表示されます。
文書内のハイライト表示されたオブジェクトまたはボックスを選択して、次に第 2 ツールバーの「次として認識」ボックスで修正します。「同意する」を選択します。
次の不明テキストが強調表示されます。必要に応じて、ミスを修正します。修正ごとに、「同意する」を選択します。
作業が完了したら、第 2 ツールバーの「閉じる」を選択します。