文書をスキャンして PDF に変換

注意:

このドキュメントでは、Acrobat XI での手順について説明します。Acrobat を使用している場合は、Acrobat ヘルプを参照してください。

紙の文書をスキャンして PDF に変換

スキャナーと Acrobat を使用して紙の文書から直接 PDF ファイルを作成することができます。Windows では、Acrobat は TWAIN スキャナードライバーおよび Windows Image Acquisition(WIA)ドライバーをサポートしています。Mac OS では、Acrobat は TWAIN および Image Capture(ICA)をサポートしています。

Windows では、「カラーモードを自動検出」を使用して、Acrobat で紙の文書のコンテンツタイプを判断するか、またはその他のプリセット(白黒文書グレースケール文書カラー画像およびカラー文書)を使用できます。スキャンプリセットを設定するか、または、「カスタムスキャン」オプションを使用して選択した設定でスキャンできます。

注意:

スキャンプリセットは、「スキャナーのネイティブインターフェイスを非表示」モードをサポートするスキャナードライバーでのみ使用できます。スキャンプリセットは、Mac OS 上では使用できません。

Windows で、スキャナーの WIA ドライバーがインストールされている場合は、スキャナーにあるスキャンボタンを使用して PDF を作成できます。スキャンボタンを押し、Windows で、登録されたアプリケーションの一覧から Adobe Acrobat を選択します。次に、Acrobat スキャンダイアログボックスで、スキャナーと文書プリセットを選択するか、「カスタムスキャン」を選択します。

「カラーモードを自動検出」を使用して紙の文書をスキャンし、PDF に変換(Windows)

  1. ファイル作成スキャナーから PDFカラーモードを自動検出を選択します。

  2. 他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」をクリックします。

プリセットを使用して紙の文書をスキャンし、PDF に変換(Windows)

  1. ファイル作成スキャナーから PDF/[文書プリセット] を選択します。

  2. 他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」をクリックします。

プリセットを使用せずに紙の文書をスキャンし、PDF に変換

  1. Acrobat で、次のいずれかの操作をおこないます。
    • (Windows)ファイル作成スキャナーから PDFカスタムスキャンを選択します。
    • (Mac OS)ファイル作成スキャナーから PDF を選択します。
  2. スキャンダイアログボックスで必要に応じてスキャンオプションを選択し、「スキャン」をクリックします。

    注意:

    Acrobat ユーザーインターフェイスでなくスキャナーのネイティブユーザーインターフェイスを使用すると指定した場合は、他のウィンドウやダイアログボックスが表示されます。利用可能なオプションについて詳しくは、スキャナーのマニュアルを参照してください。Mac OS では、スキャナーのユーザーインターフェイスが常に表示されます。

  3. 他のページをスキャンするかどうかを確認するメッセージが表示されたら、「他のページをスキャン」、「裏面をスキャン」、または「スキャンの完了」を選択し、「OK」をクリックします。

スキャンされた PDF の最適化

  1. スキャンした文書から作成した PDF を開きます。
  2. ツール文書処理スキャンされた PDF を最適化を選択します。

  3. スキャンされた PDF を最適化ダイアログボックスでオプションを選択し、「OK」をクリックします。

スキャンプリセットの設定(Windows)

  1. ファイル作成スキャナーから PDFプリセットを設定を選択します。

  2. プリセットを設定ダイアログボックスで、プリセットとして「カラーモードを自動検出」、「白黒文書」、「グレースケール文書」、「カラー文書」または「カラー画像」を選択します。

  3. 必要に応じて設定を調整します。
  4. 保存」をクリックしてプリセットを保存し、「閉じる」をクリックします。

スキャンオプション

スキャナー

インストールされたスキャナーを選択します。コンピューターにスキャナーの製造元のスキャンソフトウェアをインストールしておく必要があります。Windows でのみ、「オプション」ボタンをクリックしてスキャナーオプションを指定します。

プリセット

変更するプリセットを選択します。

スキャン

スキャン方法を片面または両面に指定します。Acrobat で「両面」を選択し、スキャナーの設定を片面のみにした場合、スキャナーの設定の方が Acrobat よりも優先されます。

注意:

両面スキャンをサポートしていないスキャナーでも、ページの両面をスキャンできます。「両面」を選択している場合、最初の面をスキャンした後、ダイアログボックスが表示されます。次に、元の紙の文書を裏返しにしてトレイにセットし、そのダイアログボックスの「裏面をスキャン(ページの裏)」を選択します。この方法により、全ページ正しい順序で PDF が作成されます。

カラーモード(Windows のみ)

スキャナーでサポートされている基本的なカラーモード(自動検出カラー白黒グレースケール)を選択します。このオプションは、スキャナーアプリケーションではなく Acrobat スキャンダイアログボックスを使用するように「スキャナー」のオプションが設定されている場合に有効になります。

解像度(Windows のみ)

スキャナーでサポートされている解像度を選択します。このオプションは、スキャナーアプリケーションではなく Acrobat スキャンダイアログボックスを使用するように「スキャナー」のオプションが設定されている場合に有効になります。

注意:

スキャナーでサポートされていないカラーモード解像度を選択すると、メッセージが表示され、スキャナーアプリケーションのウィンドウが開きます。スキャナーアプリケーションのウィンドウで別のオプションを選択します。

用紙サイズ(Windows のみ)

用紙サイズを選択するか、カスタムの高さを指定します。

他のページをスキャンするかどうかを確認する

このオプションを選択すると、すべてのスキャンセッション後に他のページをスキャンするかどうかを確認するダイアログボックスが表示されます。

新規 PDF 文書

PDF を作成します。このオプションは、プリセットを設定ダイアログボックスでは使用できません。

複数ファイル

複数の紙の文書から複数のファイルを作成します。「オプション」をクリックし、ファイルの PDF ポートフォリオを作成するかどうかと、各ファイルのページ数、ファイル名の接頭辞を指定します。これらのオプションは、プリセットを設定ダイアログボックスでは使用できません。

既存のファイルまたはポートフォリオに追加

変換したスキャンを既存の PDF または PDF ポートフォリオに追加します。このオプションは、プリセットを設定ダイアログボックスでは使用できません。

スキャンされた PDF を最適化

PDF に最適化プロセスを実行するには、このオプションを選択します。このオプションは、スキャンされた PDF 内の画像を圧縮して、フィルタリングするために使用されます。

高圧縮/高品質

このスライダーをドラッグして、ファイルサイズの圧縮率と画質のバランスを設定します。「オプション」をクリックすると、ファイルの圧縮とフィルターに関する特定の設定をカスタマイズして最適化できます。

検索可能にする(OCR 実行)

PDF のテキスト画像を検索および選択可能なテキストに変換する場合は、このオプションを選択します。テキスト画像に対して OCR(光学式文字認識)およびフォントとページ認識が適用されます。「オプション」をクリックし、テキスト認識 - 設定ダイアログボックスの設定を指定します。詳しくは、スキャンした文書内のテキストの認識を参照してください。

PDF/A 準拠にする

このオプションを選択すると、PDF を PDF/A-1b 用の ISO 標準に準拠させることができます。このオプションを選択した場合、テキスト認識 - 設定ダイアログボックスの「PDF の出力形式」オプションで「検索可能な画像」のみ選択できます。

メタデータを追加

選択すると、スキャン後に文書のプロパティダイアログボックスが表示されます。文書のプロパティダイアログボックスで、スキャンした文書に関する情報(メタデータ)を PDF ファイルに追加できます。複数のファイルを作成する場合は、すべてのファイルに共通のメタデータを入力できます。

スキャナーオプションダイアログボックス(Windows)

データ転送方法

ネイティブモード」は、使用しているスキャナーのデフォルトモードで転送します。600 dpi を超える解像度をスキャンする場合は、自動的に「メモリモード」が選択されます。

ユーザーインターフェイス

スキャナーのネイティブインターフェイスを非表示」オプションを選択すると、スキャナー製造元のウィンドウやダイアログボックスが表示されません。スキャンは、「カスタムスキャン」設定で指定された設定を使用して直接開始されます。

白黒イメージを反転

このオプションでは、例えば白黒ネガからポジ画像を作成できます。

スキャンされた PDF を最適化ダイアログボックス

スキャンされた PDF を最適化ダイアログボックスでは、スキャンされた画像を PDF 用にフィルタリングおよび圧縮する画像設定を制御します。通常はデフォルト設定で十分ですが、設定をカスタマイズして、画像の品質を向上させたり、ファイルサイズを小さくしたり、スキャンの問題を解決したりできます。

アダプティブ圧縮を適用

各ページを白黒、グレースケール、カラーの領域に分割し、種類別に高い圧縮率で圧縮する一方で、見た目をほとんど変えずに表示します。推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。

カラー / グレースケール

カラーまたはグレースケールのページをスキャンするときは、次のいずれかを選択します。

JPEG2000

JPEG2000 圧縮をカラー画像コンテンツに適用します(この設定は、PDF/A ファイルを作成する場合はお勧めしません。代わりに JPEG を使用してください)。

ZIP

ZIP 圧縮をカラー画像コンテンツに適用します。

JPEG

JPEG 圧縮をカラー画像コンテンツに適用します。

注意:

選択した「カラー / グレースケール」オプションまたは選択した「白黒」オプションがスキャナーで使用されます。使用されるオプションは、Acrobat スキャンダイアログボックスまたはスキャナーの TWAIN インターフェイスで選択した設定によって変わります。スキャナーの TWAIN インターフェイスは、Acrobat スキャンダイアログボックスで「スキャン」をクリックした後に表示されます(デフォルトでは、スキャナーアプリケーションのダイアログボックスは表示されません)。

白黒

白黒(モノトーン)の画像をスキャンするときは、次のいずれかを選択します。

JBIG2 (劣化なし) と JBIG2 (劣化あり)

白黒ページに JBIG2 圧縮方式を適用します。最高品質レベルでは、劣化しない方法が使用され、より低い設定にするとテキストが高圧縮されます。通常、テキストページは CCITT Group 4 で圧縮したページよりサイズが 60% 小さくなりますが、処理も遅くなります。Acrobat 5.0(PDF 1.4)以降と互換性があります。

注意:

Acrobat 4.0 に対応させるには、JBIG2 以外の圧縮方法を使用してください。

CCITT Group 4

白黒ページの画像に CCITT Group 4 圧縮を適用します。この高速で、データ損失を伴わない圧縮方式は Acrobat 3.0(PDF 1.2)以降に対応しています。

高圧縮/高品質

ファイルサイズの圧縮率と画質のバランスを設定します。

ゆがみ補正

スキャナーのガラス面の両端に対してページが平行に置かれていない場合、スキャンで生成される PDF ページがまっすぐになるように傾きを補正します。「オン」または「オフ」を選択します。

背景を除去

グレースケール画像やカラー画像を取り込むときに、白に近い色を白くします(白黒の画像には影響しません)。

注意:

最適な結果を得るには、通常の白黒ページのテキストが濃い灰色または黒で、背景が白になるように、スキャナーのコントラストと明るさの設定をキャリブレーションします。次に、オプションを「オフ」または「」にすると、適切な結果が得られます。オフホワイトの用紙または新聞用紙の場合は、「」または「」を選択します。

モアレフィルター

JPEG 圧縮率を低下させ、モアレパターンを生じ、テキストを読みづらくする原因となるハーフトーンのドットを除去します。200 ~ 400 dpi のグレースケール画像か RGB 画像に適しています。また、アダプティブ圧縮の場合、400 ~ 600 dpi の白黒画像に適しています。「オン」の設定(推奨)は 300 dpi 以上のグレースケール画像と RGB 画像のフィルターに適用します。画像や塗りつぶされた領域がないページをスキャンするとき、または有効な範囲より高い解像度でスキャンするときは、「オフ」を選択します。

テキストシャープニング

スキャンされた PDF ファイルのテキストを鮮明にします。デフォルト値の「低」が多くの文書に適してします。印刷された文書の品質が低く、テキストが不明瞭な場合は「中」または「高」にあげます。

スキャンに関するヒント

  • Acrobat では、10 ~ 3000 dpi のスキャン画像を使用できます。「PDF の出力形式」で「検索可能な画像」または「ClearScan」を選択した場合、72 dpi 以上の解像度を入力する必要があります。また、600 dpi より大きい解像度を入力すると、600 dpi 以下にダウンサンプリングされます。

  • スキャン画像に劣化なし圧縮を適用するには、スキャンされた PDF を最適化ダイアログボックスの最適化オプションで、白黒画像の CCITT グループ 4、カラーの劣化なし、グレースケール画像のいずれかのオプションを選択します。この画像を PDF 文書に追加して、ファイルを「保存」オプションで保存すると、画像は非圧縮のまま保持されます。「名前を付けて保存」を使用して PDF 文書を保存すると、スキャンした画像は圧縮されることがあります。

  • ほとんどのページでは、300 dpi の白黒スキャンで変換に最適なテキストが生成されます。150 dpi では、OCR の精度が少し低下し、フォント認識エラーが増えます。400 dpi 以上の解像度では、処理が遅くなり、圧縮ページのサイズが大きくなります。ページに判読不可能なテキストや 9 ポイント以下の小さい文字が多数含まれている場合は、解像度を上げてスキャンします。可能であれば、白黒でスキャンします。

  • OCR を使用してテキストを認識」を無効にした場合は、10 ~ 3000 dpi の解像度でスキャンできますが、推奨される解像度は 72 dpi 以上です。アダプティブ圧縮の場合、推奨されるスキャン解像度はグレースケールと RGB の画像には 300 dpi、白黒の画像には 600 dpi です。

  • 24-bit カラー、300 dpi、8-1/2 x 11 インチ(21.59 x 27.94 センチ)でスキャンしたページは、圧縮前で 25MB という大きなサイズになります。画像のスキャンには、50 MB 以上の仮想メモリが必要になります。600 dpi では、300 dpi の場合と比べてスキャンおよび処理の両方に約 4 倍の時間がかかります。

  • スキャナーのディザやハーフトーンの設定は使用しません。これらの設定によって写真の画質は向上しますが、テキストは判読が難しくなります。

  • 色付きの紙に印刷されているテキストの場合は、明るさとコントラストを 10% 程度上げてみます。スキャナーがカラーフィルター機能を備えている場合は、フィルターまたはランプを使用して背景色をドロップアウトすることを検討します。テキストが鮮明でないかドロップアウトしたときに不鮮明になる場合は、スキャナーのコントラストと明るさを調整して鮮明にします。

  • スキャナーの明るさを手動で調整できる場合は、文字がはっきり正しく読み取られるように調整します。文字と文字がつながっている場合は、明るさの設定を高くします。文字がばらばらになってしまう場合は、明るさの設定を低くします。

スキャンした文書内のテキストの認識

Acrobat を使用して、以前スキャンして PDF に変換した文書のテキストを認識できます。OCR ソフトウェアを使用して、スキャンした PDF に含まれるテキストの検索、修正、コピーを行うことができます。OCR を PDF に適用するには、元のスキャナー解像度が 72 dpi 以上に設定されている必要があります。

注意:

300 dpi でスキャンすると、変換に最適なテキストが生成されます。150 dpi では OCR の精度がわずかに低くなります。

単一文書内のテキストの認識

  1. スキャンした PDF を開きます。
  2. ツールテキスト認識このファイル内を選択します。

  3. テキスト認識ダイアログボックスで、「ページ」のオプションを選択します。

  4. 必要に応じて「編集」をクリックし、テキスト認識 - 一般設定ダイアログボックスを開いてオプションを指定します。

複数文書内のテキストの認識

  1. Acrobat で、ツールテキスト認識複数のファイル内を選択します。

  2. テキスト認識ダイアログボックスで「ファイルを追加」をクリックし、「ファイルを追加」、「フォルダーを追加」、「開いているファイルを追加」のいずれかを選択します。次に、ファイルまたはフォルダーを選択します。
  3. 出力オプションダイアログボックスで、出力ファイルのターゲットフォルダーとファイル名の設定を指定します。
  4. テキスト認識 - 一般設定ダイアログボックスで、オプションを指定し、「OK」をクリックします。

テキスト認識 - 一般設定ダイアログボックス

OCR の言語

文字を認識するために使用する OCR エンジンの言語を指定します。

PDF の出力形式

作成する PDF の種類を指定します。どのオプションも、72 ppi 以上(推奨)の入力解像度が必要です。どの形式でも、テキスト画像に対して OCR およびフォントとページ認識が適用され、通常のテキストに変換されます。

検索可能な画像

テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、必要に応じてゆがみが補正され、その上に非表示のテキストレイヤーが配置されます。同じダイアログボックスの「画像のダウンサンプリング」の選択項目では、画像をダウンサンプルするかどうかや、ダウンサンプリングのレベルを指定します。

検索可能な画像(非圧縮)

テキストの検索と選択を可能にします。このオプションを選択すると、元の画像が保持され、その上に非表示のテキストレイヤーが配置されます。元の画像を忠実に再現する必要がある場合は、このオプションを選択することをお勧めします。

ClearScan

元のフォントに似た新しい Type 3 フォントを合成し、低解像度のコピーを使用してページの背景を保持します。

ダウンサンプル

OCR が完了した後に、カラー、グレースケール、白黒の各画像のピクセル数を減らします。適用するダウンサンプリングのレベルを選択します。オプションの数値を高くすると、ダウンサンプリングがあまり適用されず、高い解像度の PDF が作成されます。

OCR を適用した PDF でのテキストの修正

スキャン結果に対して OCR を実行すると、Acrobat がテキストのビットマップを分析し、これらのビットマップ領域を単語および文字に置き換えます。最適な置き換え語句が不明の場合、Acrobat はその単語を不明テキストとしてマークします。不明テキストは、ビップマップ上は元のテキストとして PDF に表示され、テキストのビットマップの背後の非表示のレイヤーにも含まれています。この方法により、ビットマップとして表示されている単語も検索可能になります。

注意:OCR を適用せずにスキャンした PDF でテキストを選択しようとした場合、または画像ファイルに対して読み上げ操作を実行しようとした場合、Acrobat は、OCR を実行するかどうかを確認するメッセージを表示します。「OK」をクリックすると、テキスト認識ダイアログボックスが表示され、オプションを選択できるようになります。これらのオプションについては、前のトピックで詳しく説明しています。

  1. 次のいずれかの操作をおこないます。

    • ツールテキスト認識すべての不明テキストを検索を選択します。ページ上のすべての不明テキストの周囲にボックスが表示されます。不明テキストをクリックすると、エレメントを検索ダイアログボックスに不明テキストが表示されます。
    • ツールテキスト認識最初の不明テキストを検索を選択します。

    注意:すべての不明テキストの修正を完了する前にエレメントを検索ウィンドウを閉じる場合、途中の処理に戻るには、ツールテキスト認識最初の不明テキストを検索を選択するか、または文書テキストを編集ツールを使用して不明なテキストをクリックします。

  2. 「検索」オプションで、「OCR 対象テキスト」を選択します。

  3. 「不明テキスト」テキストボックスのテキストと、スキャンした文書内の実際のテキストを比較します。OCR 不明テキストを修正するには、文書内のハイライト表示されたオブジェクトをクリックして、新しいテキストを入力します。不明テキストが誤ってテキストとして識別されている場合は、「テキストではありません」ボタンをクリックします。

  4. 残りの不明テキストを確認して修正し、エレメントを検索ダイアログボックスを閉じます。

その他の関連ヘルプ

ヘルプをすばやく簡単に入手

新規ユーザーの場合

Adobe MAX 2025

Adobe MAX Japan
クリエイターの祭典

2025 年 2 月 13 日
東京ビッグサイト