Extraer texto de un PDF de forma privada: se ejecuta por completo en tu navegador

Selecciona un PDF y la capa de texto de cada página se extrae localmente en tu navegador y se ofrece como archivo de texto descargable, sin subidas.

How it works

  1. Selecciona un archivo PDF de tu dispositivo con el selector de archivos.
  2. El archivo se lee en la memoria del navegador: ningún dato sale de tu navegador.
  3. pdf.js carga el documento en un Web Worker y llama a getTextContent() en cada página para recuperar la capa de texto incrustada.
  4. El texto extraído de todas las páginas se combina en orden y se ofrece como archivo .txt descargable.
  5. Todos los datos temporales se liberan de la memoria una vez completada la descarga.

Frequently asked questions

¿En qué se diferencia de otras herramientas PDF online?
La mayoría de las herramientas PDF online envían tus archivos a un servidor remoto para procesarlos. Esta herramienta procesa todo localmente en tu navegador mediante JavaScript del lado del cliente. Tus archivos no se transmiten a ningún servidor, de modo que el contenido de tus documentos permanece bajo tu control.
¿Se suben mis archivos PDF?
No. Tu navegador lee los archivos directamente. No se transmite nada por la red. La herramienta funciona por completo dentro de la pestaña del navegador que tienes abierta.
¿Puedo comprobar que los archivos no se suben?
Sí. Abre las herramientas de desarrollo de tu navegador (F12), ve a la pestaña Red (Network) y observa si hay alguna solicitud saliente mientras usas la herramienta. No verás salir ningún dato de archivo de tu navegador. Todas las operaciones se completan sin actividad de red.
¿Funciona esta herramienta sin conexión?
Sí. Una vez cargada la página, la herramienta se ejecuta por completo en tu navegador sin necesidad de conexión. Puedes desconectarte de internet y seguir usándola.
¿Qué ocurre cuando actualizo la página?
Como no se almacena nada en un servidor, al actualizar la página se borra la sesión actual. Tendrás que volver a seleccionar los archivos que tuvieras elegidos.
¿Guarda esta herramienta mis archivos?
No. Los archivos se mantienen en la memoria del navegador solo mientras la página está abierta. Al cerrarla o actualizarla se descartan. La herramienta no escribe nada en disco ni envía nada a un servidor.
¿Puede esta herramienta desbloquear PDF protegidos con contraseña?
No. Esta herramienta no intenta eliminar ni eludir la protección con contraseña de un PDF. Si conoces la contraseña, la herramienta Desbloquear PDF de este sitio puede quitarla localmente; después, esta herramienta podrá procesar el archivo.
¿Qué tecnologías utiliza esta herramienta?
Esta herramienta utiliza pdf.js (el motor de PDF del lado del cliente de Mozilla) en un Web Worker para leer la capa de texto incrustada de cada página del PDF dentro de tu navegador. No interviene ningún servidor.
¿Usa esta herramienta WebAssembly?
No. pdf.js es una biblioteca de JavaScript pura: no utiliza WebAssembly. Toda la extracción de texto del PDF se realiza con JavaScript del lado del cliente dentro de tu navegador.