紙の文書をスキャンし、Acrobat を使用して、選択可能なテキストを含むスマートで検索可能な PDF に変換します。

紙の文書をスキャンして PDF に変換

スキャナーと Acrobat を使用して紙の文書から直接 PDF ファイルを作成することができます。Windows では、Acrobat は TWAIN スキャナードライバーおよび Windows Image Acquisition(WIA)ドライバーをサポートしています。Mac OS では、Acrobat は TWAIN および Image Capture(ICA)をサポートしています。

Windows では、「カラーモードを自動検出」を使用して、Acrobat で紙の文書のコンテンツタイプを判断するか、またはその他のプリセット(白黒文書グレースケール文書カラー画像およびカラー文書)を使用できます。スキャンプリセットを設定するか、または、「カスタムスキャン」オプションを使用して選択した設定でスキャンできます。

注意:

スキャンプリセットは、「スキャナーのネイティブインターフェイスを非表示」モードをサポートするスキャナードライバーでのみ使用できます。スキャンプリセットは、Mac OS 上では使用できません。

Windows で、スキャナーの WIA ドライバーがインストールされている場合は、スキャナーにあるスキャンボタンを使用して PDF を作成できます。スキャンボタンを押し、Windows で、登録されたアプリケーションの一覧から Adobe Acrobat を選択します。次に、Acrobat のスキャンインターフェイスで、スキャナーと文書プリセットを選択するか、「カスタムスキャン」を選択します。

Acrobat で紙の文書をスキャンして PDF にするには、ツール/PDF を作成を選択します。「任意の形式から PDF を作成」インターフェイスが表示されます。利用可能なオプションを表示するには、「スキャナー」を選択します。

Windows の場合:

紙の文書を PDF にスキャンするためのオプション
スキャナーインターフェイスから PDF を作成するには、設定または歯車アイコンをクリックして、選択したオプションのすべての設定を表示します。

Mac の場合:

Mac で紙の文書を PDF にスキャンするためのオプション
スキャナーインターフェイスから PDF を作成するには、スキャナーを選択し、「次へ」をクリックして、選択したスキャナーの設定を表示します。

「カラーモードを自動検出」を使用して紙の文書をスキャンし、PDF に変換(Windows)

  1. ツールPDF を作成スキャナーカラーモードを自動検出を選択します。

    注意:

    これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。

    1. 既存のファイルに追加」チェックボックスを選択します。
    2. Acrobat で開いているファイルがある場合は、ドロップダウンリストから適切なファイルを選択するか、または「参照」をクリックして適切なファイルを選択します。

    複数のファイルをスキャンして PDF に変換するには、設定 アイコンをクリックします。「カスタムスキャン」インターフェイスが表示されます。「追加のページをスキャンするように指示されます」チェックボックスをオンにします。

  2. スキャン」をクリックします。

  3. 他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」をクリックします。

プリセットを使用して紙の文書をスキャンし、PDF に変換(Windows)

  1. ツールPDF を作成スキャナー/「ドキュメントプリセット」を選択します。

    注意:

    これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。

    1. 既存のファイルに追加」チェックボックスを選択します。
    2. Acrobat で開いているファイルがある場合は、ドロップダウンリストから適切なファイルを選択するか、または「参照」をクリックして適切なファイルを選択します。

    複数のファイルをスキャンして PDF に変換するには、設定 アイコンをクリックします。「カスタムスキャン」インターフェイスが表示されます。「追加のページをスキャンするように指示されます」チェックボックスをオンにします。

  2. スキャン」をクリックします。

  3. 他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」をクリックします。

プリセットを使用せずに紙の文書をスキャンし、PDF に変換

  1. ツールPDF を作成スキャナーデフォルト設定またはカスタム設定を選択します。

    注意:

    これからスキャンする文書を既存のファイルに追加したい場合、以下の操作を行ってください。

    1. 既存のファイルに追加」チェックボックスを選択します。
    2. Acrobat で開いているファイルがある場合は、ドロップダウンリストから適切なファイルを選択するか、または「参照」をクリックして適切なファイルを選択します。

  2. 設定を変更する場合は、設定 アイコンをクリックします。「カスタムスキャン」インターフェイスが表示されます。必要に応じてスキャンオプションを選択します。

    複数のファイルをスキャンして PDF に変換するには、「追加のページをスキャンするように指示されます」チェックボックスをオンにします。

    注意:

    Acrobat ユーザーインターフェイスでなくスキャナーのユーザーインターフェイス表示を使用すると指定した場合は、他のウィンドウやダイアログボックスが表示されます。利用可能なオプションについて詳しくは、スキャナーのマニュアルを参照してください。Mac OS では、スキャナーのユーザーインターフェイスが常に表示されます。

  3. スキャン」をクリックします。

  4. 他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」または「スキャンの完了」を選択し、「OK」をクリックします。

スキャンした PDF の補正または最適化

  1. スキャンした文書から作成した PDF を開きます。
  2. ツールスキャン補正/補正スキャンした文書を選択します。

  3. 第 2 ツールバーでオプションを選択します。設定 アイコンをクリックして、スキャンされた PDF ダイアログボックスで適切なオプションを選択し、「OK」をクリックします。

    このダイアログボックスに表示されるオプションについて詳しくは、スキャンされた PDF を補正ダイアログボックスを参照してください。

スキャンプリセットの設定(Windows)

  1. ツールPDF を作成スキャナーを選択します。

  2. プリセットを選択します。カラーモード自動検出白黒文書カラー文書グレースケール文書またはカラー写真を選択します。

  3. プリセットの横にある「設定 アイコンをクリックします。選択に基づいて、「カスタムスキャン」または「事前定義された設定を構成」インターフェイスが表示されます。

  4. 必要に応じて設定を調整します。

    複数のファイルをスキャンして PDF に変換するには、「追加のページをスキャンするように指示されます」チェックボックスをオンにします。

  5. 設定を保存」をクックしてプリセットを保存し、次に「クロスボタン(X)」をクリックして閉じます。

スキャンオプション

スキャナーを選択したら、要件に合わせて様々なスキャンオプションの選択や調整をおこなえます。

すべてのスキャンオプションを参照するには、ここをクリックしてください。

スキャナー

インストールされたスキャナーを選択します。コンピューターにスキャナーの製造元のスキャンソフトウェアをインストールしておく必要があります。Windows でのみ、「オプション」ボタンをクリックしてスキャナーオプションを指定します。

スキャナーのユーザーインターフェイスを表示

スキャナーの製造元のウィンドウやダイアログボックスを使用して設定を表示したい場合のみ、このオプションを選択してください。オプションが選択されていない場合は、「カスタムスキャン」または「事前定義された設定を構成」インターフェイスで指定された設定でスキャンがすぐに始まります。

ページ

スキャン方法を片面または両面に指定します。Acrobat で「両面」を選択し、スキャナーの設定を片面のみにした場合、スキャナーの設定の方が Acrobat よりも優先されます。

注意:

両面スキャンをサポートしていないスキャナーでも、ページの両面をスキャンできます。「両面」を選択している場合、最初の面をスキャンした後、ダイアログボックスが表示されます。次に、元の紙の文書を裏返しにしてトレイにセットし、そのダイアログボックスの「裏面をスキャン(ページの裏)」を選択します。この方法により、全ページ正しい順序で PDF が作成されます。

カラーモード(Windows のみ)

スキャナーでサポートされている基本的なカラーモード(自動検出カラー白黒グレースケール)を選択します。このオプションは、スキャナーアプリケーションではなく Acrobat スキャンダイアログボックスを使用するように「スキャナー」のオプションが設定されている場合に有効になります。

解像度(Windows のみ)

スキャナーでサポートされている解像度を選択します。このオプションは、スキャナーアプリケーションではなく Acrobat スキャンダイアログボックスを使用するように「スキャナー」のオプションが設定されている場合に有効になります。

注意:

スキャナーでサポートされていないカラーモード解像度を選択すると、メッセージが表示され、スキャナーアプリケーションのウィンドウが開きます。スキャナーアプリケーションのウィンドウで別のオプションを選択します。

用紙サイズ(Windows のみ)

用紙サイズを選択するか、カスタムの高さを指定します。

追加のページをスキャンするように指示されます

このオプションを選択すると、すべてのスキャンセッション後に他のページをスキャンするかどうかを確認するダイアログボックスが表示されます。

品質/画像を最適化

PDF に最適化プロセスを実行するには、このオプションを選択します。このオプションは、スキャンされた PDF 内の画像を圧縮して、フィルタリングするために使用されます。「設定 アイコンをクリックすると、ファイルの圧縮とフィルターに関する特定の設定をカスタマイズして最適化できます。

品質/画像を最適化/高圧縮/高品質

スライダーをドラッグして、ファイルサイズの圧縮率と画質のバランスを設定します。

出力/既存のファイルに追加

既存の PDF に変換したスキャンを追加します。ドロップダウンリストから開いているファイルを選択するか、または PDF ファイルを参照して選択します。

出力/新規 PDF を作成

PDF を作成します。

出力/複数のファイルを保存

複数の紙の文書から複数のファイルを作成します。「設定 アイコンをクリックし、ファイルの PDF ポートフォリオを作成するかどうかと、各ファイルのページ数、ファイル名の接頭辞を指定します。

テキスト認識 (OCR)

PDF のテキスト画像を検索および選択可能なテキストに変換する場合は、このオプションを選択します。テキスト画像に対して OCR(光学式文字認識)およびフォントとページ認識が適用されます。「設定 アイコンをクリックし、[テキスト認識 - 設定]ダイアログボックスの設定を指定します。詳しくは、スキャンした文書内のテキストの認識を参照してください。

メタデータを追加

選択すると、スキャン後に文書のプロパティダイアログボックスが表示されます。文書のプロパティダイアログボックスで、スキャンした文書に関する情報(メタデータ)を PDF ファイルに追加できます。複数のファイルを作成する場合は、すべてのファイルに共通のメタデータを入力できます。

PDF/A 準拠にする

このオプションを選択すると、PDF を PDF/A-1b 用の ISO 標準に準拠させることができます。

スキャンされた PDF を最適化ダイアログボックス

スキャンされた PDF を補正ダイアログボックスでは、スキャンされた画像を PDF 用にフィルタリングおよび圧縮する画像設定を制御します。通常はデフォルト設定で十分ですが、設定をカスタマイズして、画像の品質を向上させたり、ファイルサイズを小さくしたり、スキャンの問題を解決したりできます。

すべての画像最適化オプションを参照するには、ここをクリックしてください。

アダプティブ圧縮を適用

各ページを白黒、グレースケール、カラーの領域に分割し、種類別に高い圧縮率で圧縮する一方で、見た目をほとんど変えずに表示します。推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。

カラー/グレースケールスキャン

カラーまたはグレースケールのページをスキャンするときは、次のいずれかを選択します。

JPEG2000

JPEG2000 圧縮をカラー画像コンテンツに適用します(この設定は、PDF/A ファイルを作成する場合はお勧めしません。代わりに JPEG を使用してください)。

ZIP

ZIP 圧縮をカラー画像コンテンツに適用します。

JPEG

JPEG 圧縮をカラー画像コンテンツに適用します。

注意:

選択した「カラー / グレースケール」オプションまたは選択した「白黒」オプションがスキャナーで使用されます。使用されるオプションは、Acrobat スキャンダイアログボックスまたはスキャナーの TWAIN インターフェイスで選択した設定によって変わります。スキャナーの TWAIN インターフェイスは、Acrobat スキャンダイアログボックスで「スキャン」をクリックした後に表示されます(デフォルトでは、スキャナーアプリケーションのダイアログボックスは表示されません)。

白黒スキャン

白黒(モノトーン)の画像をスキャンするときは、次のいずれかを選択します。

JBIG2 (劣化なし) と JBIG2 (劣化あり)

白黒ページに JBIG2 圧縮方式を適用します。最高品質レベルでは、劣化しない方法が使用され、より低い設定にするとテキストが高圧縮されます。通常、テキストページは CCITT Group 4 で圧縮したページよりサイズが 60% 小さくなりますが、処理も遅くなります。Acrobat 5.0(PDF 1.4)以降と互換性があります。

注意:

Acrobat 4.0 に対応させるには、JBIG2 以外の圧縮方法を使用してください。

CCITT Group 4

白黒ページの画像に CCITT Group 4 圧縮を適用します。この高速で、データ損失を伴わない圧縮方式は Acrobat 3.0(PDF 1.2)以降に対応しています。

高圧縮/高品質

ファイルサイズの圧縮率と画質のバランスを設定します。

ゆがみ補正

スキャナーのガラス面の両端に対してページが平行に置かれていない場合、スキャンで生成される PDF ページがまっすぐになるように傾きを補正します。「オン」または「オフ」を選択します。

背景を除去

グレースケール画像やカラー画像を取り込むときに、白に近い色を白くします(白黒の画像には影響しません)。

注意:

最適な結果を得るには、通常の白黒ページのテキストが濃い灰色または黒で、背景が白になるように、スキャナーのコントラストと明るさの設定をキャリブレーションします。次に、オプションを「オフ」または「」にすると、適切な結果が得られます。オフホワイトの用紙または新聞用紙の場合は、「」または「」を選択します。

モアレフィルター

JPEG 圧縮率を低下させ、モアレパターンを生じ、テキストを読みづらくする原因となるハーフトーンのドットを除去します。200 ~ 400 dpi のグレースケール画像か RGB 画像に適しています。また、アダプティブ圧縮の場合、400 ~ 600 dpi の白黒画像に適しています。「オン」の設定(推奨)は 300 dpi 以上のグレースケール画像と RGB 画像のフィルターに適用します。画像や塗りつぶされた領域がないページをスキャンするとき、または有効な範囲より高い解像度でスキャンするときは、「オフ」を選択します。

テキストシャープニング

スキャンされた PDF ファイルのテキストを鮮明にします。デフォルト値は「低」で、多くの文書に適してします。印刷された文書の品質が低く、テキストが不明瞭な場合は「中」または「高」にあげます。

テキスト認識 - 設定ダイアログボックス

文書の言語

デフォルトでは、OCR の言語は、デフォルトのロケールから選択されます。言語を変更するには、「編集」をクリックし、別の言語を選択します。

出力

「検索可能な画像」または「編集可能なテキストと画像」のどちらかです。

スキャンに関するヒント

  • Acrobat では、10 ~ 3000 dpi のスキャン画像を使用できます。「PDF の出力形式」で「検索可能な画像」または「ClearScan」を選択した場合、72 dpi 以上の解像度を入力する必要があります。また、600 dpi より大きい解像度を入力すると、600 dpi 以下にダウンサンプリングされます。

  • スキャン画像に劣化なし圧縮を適用するには、スキャンされた PDF を最適化ダイアログボックスの最適化オプションで、白黒画像の CCITT グループ 4、カラーの劣化なし、グレースケール画像のいずれかのオプションを選択します。この画像を PDF 文書に追加して、ファイルを「保存」オプションで保存すると、画像は非圧縮のまま保持されます。「名前を付けて保存」を使用して PDF 文書を保存すると、スキャンした画像は圧縮されることがあります。

  • ほとんどのページでは、300 dpi の白黒スキャンで変換に最適なテキストが生成されます。150 dpi では、OCR の精度が少し低下し、フォント認識エラーが増えます。400 dpi 以上の解像度では、処理が遅くなり、圧縮ページのサイズが大きくなります。ページに判読不可能なテキストや 9 ポイント以下の小さい文字が多数含まれている場合は、解像度を上げてスキャンします。可能であれば、白黒でスキャンします。

  • OCR を使用してテキストを認識」を無効にした場合は、10 ~ 3000 dpi の解像度でスキャンできますが、推奨される解像度は 72 dpi 以上です。アダプティブ圧縮の場合、推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。

  • 24-bit カラー、300 dpi、8-1/2 x 11 インチ(21.59 x 27.94 センチ)でスキャンしたページは、圧縮前で 25MB という大きなサイズになります。画像のスキャンには、50 MB 以上の仮想メモリが必要になります。600 dpi では、300 dpi の場合と比べてスキャンおよび処理の両方に約 4 倍の時間がかかります。

  • スキャナーのディザやハーフトーンの設定は使用しません。これらの設定によって写真の画質は向上しますが、テキストは判読が難しくなります。

  • 色付きの紙に印刷されているテキストの場合は、明るさとコントラストを 10% 程度上げてみます。スキャナーがカラーフィルター機能を備えている場合は、フィルターまたはランプを使用して背景色をドロップアウトすることを検討します。テキストが鮮明でないかドロップアウトしたときに不鮮明になる場合は、スキャナーのコントラストと明るさを調整して鮮明にします。

  • スキャナーの明るさを手動で調整できる場合は、文字がはっきり正しく読み取られるように調整します。文字と文字がつながっている場合は、明るさの設定を高くします。文字がばらばらになってしまう場合は、明るさの設定を低くします。

スキャナーの問題のトラブルシューティング

トラブルシューティングのヒントについては、Acrobat を使用してスキャンする際のスキャナーの問題のトラブルシューティングを参照してください。

スキャンした文書内のテキストの認識

Acrobat を使用して、以前スキャンして PDF に変換した文書のテキストを認識できます。OCR ソフトウェアを使用して、スキャンした PDF に含まれるテキストの検索、修正、コピーを行うことができます。OCR を PDF に適用するには、元のスキャナー解像度が 72 dpi 以上に設定されている必要があります。

注意:

300 dpi でスキャンすると、変換に最適なテキストが生成されます。150 dpi では OCR の精度がわずかに低くなります。

単一文書内のテキストの認識

  1. スキャンした PDF を開きます。
  2. ツールスキャン補正テキスト認識このファイル内を選択します。

    第 2 ツールバーに「テキスト認識」オプションが表示されます。

  3. 第 2 ツールバーで、テキスト認識のページ範囲と言語を選択します。

  4. 必要に応じて、「設定」をクリックしてテキスト認識ダイアログボックスを開き、オプションを指定します。

  5. テキスト認識をクリックします。Acrobat によって、検索可能な(新しい文書にコピー&ペースト可能な)PDF にテキストのレイヤーが作成されます。

複数文書内のテキストの認識

  1. ツールスキャン補正テキスト認識複数のファイル内を選択します。

  2. テキスト認識ダイアログボックスで「ファイルを追加」をクリックし、「ファイルを追加」、「フォルダーを追加」、「開いているファイルを追加」のいずれかを選択します。次に、ファイルまたはフォルダーを選択します。

  3. 出力オプションダイアログボックスで、出力ファイルのターゲットフォルダーとファイル名の設定を指定します。
  4. テキスト認識 - 一般設定ダイアログボックスで、オプションを指定し、「OK」をクリックします。

    Acrobat によって、検索可能な(新しい文書にコピー&ペースト可能な)PDF にテキストのレイヤーが作成されます。

テキスト認識 - 一般設定ダイアログボックス

文書の言語

文字を認識するために使用する OCR エンジンの言語を指定します。

出力(PDF 出力形式)

作成する PDF の種類を指定します。どのオプションも、72 ppi 以上(推奨)の入力解像度が必要です。どの形式でも、テキスト画像に対して OCR およびフォントとページ認識が適用され、通常のテキストに変換されます。

検索可能な画像

テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、必要に応じてゆがみが補正され、その上に非表示のテキストレイヤーが配置されます。同じダイアログボックスの「画像のダウンサンプリング」の選択項目では、画像をダウンサンプルするかどうかや、ダウンサンプリングのレベルを指定します。

検索可能な画像(非圧縮)

テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、その上に非表示のテキストレイヤーが配置されます。元の画像を忠実に再現する必要がある場合は、このオプションを選択することをお勧めします。

編集可能なテキストと画像

元のフォントに似た新しいカスタムフォントを合成し、低解像度のコピーを使用してページの背景を保持します。

ダウンサンプル

OCR が完了した後に、カラー、グレースケール、白黒の各画像のピクセル数を減らします。適用するダウンサンプリングのレベルを選択します。オプションの数値を高くすると、ダウンサンプリングがあまり適用されず、高い解像度の PDF が作成されます。

OCR を適用した PDF でのテキストの修正

スキャン結果に対して OCR を実行すると、Acrobat がテキストのビットマップを分析し、これらのビットマップ領域を単語および文字に置き換えます。最適な置き換え語句が不明な場合、Acrobat は、その単語を不明テキストとしてマークします。不明テキストは、PDF 内ではその単語のオリジナルのビットマップとして表示されますが対応するテキストが単語のビットマップの背後の非表示レイヤーに含まれています。この方法により、ビットマップとして表示されている単語も検索可能になります。

注意:OCR を適用せずにスキャンした PDF でテキストを選択しようとした場合、または画像ファイルに対して読み上げ操作を実行しようとした場合、Acrobat は、OCR を実行するかどうかを確認するメッセージを表示します。「OK」をクリックすると、テキスト認識ダイアログボックスが表示され、オプションを選択できるようになります。これらのオプションについては、前のトピックで詳しく説明しています。

  1. ツールスキャン補正テキスト認識認識されたテキストを修正を選択します。

    Acrobat は、エラーの可能性のあるテキストを識別し、画像とテキストを第 2 ツールバーに横に並べて表示します(ページ上のすべての不明テキストの周囲にボックスが表示されます)。

  2. 文書内のハイライト表示されたオブジェクトまたはボックスをクリックして、次に第 2 ツールバーの「次として認識」ボックスで修正します。「同意する」をクリックします。

    次の不明テキストが強調表示されます。必要に応じて、ミスを修正します。修正ごとに、「同意する」をクリックします。

  3. 作業が完了したら、第 2 ツールバーの「閉じる」をクリックします。

本作品は Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License によってライセンス許可を受けています。  Twitter™ および Facebook の投稿には、Creative Commons の規約内容は適用されません。

法律上の注意   |   プライバシーポリシー