Conversion de PDF en formats texte

Dernière mise à jour le 5 nov. 2025

Découvrez comment convertir un fichier PDF en texte brut ou en fichier XML à l’aide d’Adobe Acrobat.

Conversion d’un PDF au format TXT  

Sélectionnez Convertir dans la barre d’outils globale.

Sélectionnez Autre format dans le volet de gauche, puis sélectionnez TXT dans le menu déroulant.

Sélectionnez Paramètres pour modifier les paramètres d’encodage.

Sélectionnez Convertir en TXT.

Dans la boîte de dialogue qui s’ouvre, sélectionnez l’emplacement où enregistrer le fichier.

Le cas échéant, attribuez un nouveau nom au fichier et sélectionnez Enregistrer.

Conversion d’un PDF au format XML

Sélectionnez Convertir dans la barre d’outils globale.

Dans le panneau de gauche, sélectionnez Autre format, puis XML 1.0 dans le menu déroulant.

Sélectionnez Paramètres pour modifier les paramètres suivants :

  • Codage : applique UTF-8 pour la plupart des utilisations.
  • Générer des signets : crée des balises XML pour la structure du document.
  • Générer des balises pour les fichiers non balisés : ajoute des balises de structure de base.
  • Exporter toutes les images : inclut toutes les images du PDF dans le fichier XML.
  • Utiliser le sous-dossier : spécifie le dossier dans lequel stocker les images exportées.
  • Utiliser le préfixe : ajoute un préfixe aux noms de fichier image.
  • Format de sortie : applique le format d’image.
  • Sous-échantillonner à : permet de régler la résolution des images.

Sélectionnez Convertir en XML.

Dans la boîte de dialogue qui s’ouvre, sélectionnez l’emplacement où enregistrer le fichier.

Le cas échéant, attribuez un nouveau nom au fichier et sélectionnez Enregistrer.