Extraire le texte d'un PDF en toute confidentialité — tout s'exécute dans votre navigateur
Sélectionnez un PDF : la couche de texte de chaque page est extraite localement dans votre navigateur et proposée sous forme de fichier texte téléchargeable — sans envoi.
How it works
- Sélectionnez un fichier PDF sur votre appareil à l'aide du sélecteur de fichiers.
- Le fichier est chargé en mémoire du navigateur — aucune donnée ne quitte votre navigateur.
- pdf.js charge le document dans un Web Worker et appelle getTextContent() pour chaque page afin de récupérer la couche de texte intégrée.
- Le texte extrait de toutes les pages est assemblé dans l'ordre et proposé sous forme de fichier .txt téléchargeable.
- Toutes les données temporaires sont libérées de la mémoire une fois le téléchargement terminé.
Frequently asked questions
- En quoi cet outil diffère-t-il des autres outils PDF en ligne ?
- La plupart des outils PDF en ligne envoient vos fichiers vers un serveur distant pour les traiter. Cet outil traite tout localement dans votre navigateur, en JavaScript côté client. Vos fichiers ne sont transmis à aucun serveur, ce qui veut dire que le contenu de vos documents reste sous votre contrôle.
- Mes fichiers PDF sont-ils envoyés sur un serveur ?
- Non. Vos fichiers sont lus directement par votre navigateur. Rien n'est transmis sur le réseau. L'outil fonctionne entièrement dans l'onglet de navigateur que vous avez ouvert.
- Puis-je vérifier que les fichiers ne sont pas envoyés ?
- Oui. Ouvrez les outils de développement de votre navigateur (F12), allez dans l'onglet Réseau, puis surveillez les requêtes sortantes pendant que vous utilisez l'outil. Vous verrez qu'aucune donnée de fichier ne quitte votre navigateur. Toutes les opérations s'effectuent sans activité réseau.
- Cet outil fonctionne-t-il hors ligne ?
- Oui. Une fois la page chargée, l'outil fonctionne entièrement dans votre navigateur, sans connexion réseau. Vous pouvez vous déconnecter d'Internet et continuer à l'utiliser.
- Que se passe-t-il si j'actualise la page ?
- Comme rien n'est stocké sur un serveur, actualiser la page réinitialise votre session en cours. Les fichiers que vous aviez sélectionnés devront l'être à nouveau.
- Cet outil conserve-t-il mes fichiers ?
- Non. Les fichiers ne restent en mémoire du navigateur que tant que la page est ouverte. Fermer ou actualiser la page les supprime. L'outil n'écrit rien sur le disque et n'envoie rien à un serveur.
- Cet outil peut-il déverrouiller les PDF protégés par mot de passe ?
- Non. Cet outil ne tente pas de retirer ni de contourner la protection par mot de passe d'un PDF. Si vous connaissez le mot de passe, l'outil Déverrouiller un PDF de ce site peut le retirer localement ; cet outil pourra ensuite traiter le fichier.
- Quelles technologies cet outil utilise-t-il ?
- Cet outil utilise pdf.js (le moteur PDF côté client de Mozilla) dans un Web Worker pour lire la couche de texte intégrée de chaque page du PDF, dans votre navigateur. Aucun serveur n'intervient.
- Cet outil utilise-t-il WebAssembly ?
- Non. pdf.js est une bibliothèque JavaScript classique — elle n'utilise pas WebAssembly. Toute l'extraction de texte PDF s'effectue en JavaScript côté client dans votre navigateur.