Extrage text din PDF în mod privat — rulează integral în browserul tău

Selectează un PDF, iar stratul de text din fiecare pagină este extras local, în browser, și oferit ca fișier text descărcabil — fără încărcare.

How it works

  1. Selectează un fișier PDF de pe dispozitivul tău folosind selectorul de fișiere.
  2. Fișierul este citit în memoria browserului — niciun fel de date nu părăsesc browserul.
  3. pdf.js încarcă documentul într-un Web Worker și apelează getTextContent() pentru fiecare pagină pentru a prelua stratul de text încorporat.
  4. Textul extras din toate paginile este combinat în ordine și oferit ca fișier .txt descărcabil.
  5. Toate datele temporare sunt eliberate din memorie după ce descărcarea este finalizată.

Frequently asked questions

Prin ce se deosebește de alte instrumente PDF online?
Majoritatea instrumentelor PDF online trimit fișierele tale către un server la distanță pentru prelucrare. Acest instrument prelucrează totul local, în browserul tău, folosind JavaScript pe partea de client. Fișierele tale nu sunt transmise către niciun server, ceea ce înseamnă că conținutul documentului rămâne sub controlul tău.
Fișierele mele PDF sunt încărcate undeva?
Nu. Fișierele tale sunt citite direct de browser. Nimic nu este transmis prin rețea. Instrumentul funcționează integral în fila de browser pe care o ai deschisă.
Pot verifica faptul că fișierele nu sunt încărcate?
Da. Deschide instrumentele pentru dezvoltatori din browser (F12), accesează fila Network și urmărește dacă apar cereri de ieșire în timp ce folosești instrumentul. Vei vedea că niciun fișier nu părăsește browserul. Toate operațiunile se finalizează fără activitate de rețea.
Funcționează acest instrument offline?
Da, odată ce pagina s-a încărcat, instrumentul rulează integral în browser, fără nicio conexiune la rețea. Te poți deconecta de la internet și poți continua să îl folosești.
Ce se întâmplă când reîncarc pagina?
Deoarece nimic nu este stocat pe un server, reîncărcarea paginii îți șterge sesiunea curentă. Va trebui să selectezi din nou fișierele pe care le aveai alese.
Acest instrument îmi stochează fișierele?
Nu. Fișierele sunt păstrate în memoria browserului doar cât timp pagina este deschisă. Închiderea sau reîncărcarea paginii le elimină. Instrumentul nu scrie nimic pe disc și nu trimite nimic către un server.
Poate acest instrument să deblocheze PDF-uri protejate prin parolă?
Nu. Acest instrument nu încearcă să elimine sau să ocolească protecția prin parolă a PDF-ului. Dacă știi parola, instrumentul Unlock PDF de pe acest site o poate elimina local, iar apoi acest instrument poate prelucra fișierul.
Ce tehnologii folosește acest instrument?
Acest instrument folosește pdf.js (motorul PDF pe partea de client al Mozilla) într-un Web Worker pentru a citi stratul de text încorporat din fiecare pagină PDF, în browserul tău. Niciun server nu este implicat.
Folosește acest instrument WebAssembly?
Nu. pdf.js este o bibliotecă JavaScript obișnuită — nu folosește WebAssembly. Toată extragerea textului PDF are loc în JavaScript pe partea de client, în browserul tău.