OCR skeniranog PDF-a uz privatnost — prepoznajte tekst u vašem pregledaču

Izaberite skenirani PDF i jezik; svaka stranica se renderuje i prepoznaje lokalno pomoću Tesseract-a (kompajliranog u WebAssembly), a prepoznati tekst se prikazuje i može preuzeti kao .txt fajl.

How it works

  1. Izaberite skenirani PDF sa svog uređaja i izaberite jezik dokumenta.
  2. Fajl se učitava u memoriju pregledača — nijedan podatak ne napušta vaš pregledač.
  3. pdf.js renderuje svaku stranicu u sliku u Web Worker-u.
  4. Tesseract OCR — kompajliran u WebAssembly i posluživan sa ovog sajta — prepoznaje tekst svake stranice lokalno; jezički model se takođe učitava sa ovog sajta, a ne sa CDN-a treće strane.
  5. Prepoznati tekst se prikazuje po stranici i nudi kao .txt za preuzimanje.

Frequently asked questions

Po čemu se ovo razlikuje od drugih onlajn PDF alata?
Većina onlajn PDF alata šalje vaše fajlove na udaljeni server radi obrade. Ovaj alat sve obrađuje lokalno u vašem pregledaču pomoću JavaScript-a na strani klijenta. Vaši fajlovi se ne prenose ni na jedan server, pa sadržaj dokumenta u potpunosti ostaje pod vašom kontrolom.
Da li se moji PDF fajlovi otpremaju?
Ne. Vaše fajlove čita direktno vaš pregledač. Ništa se ne prenosi preko mreže. Alat radi u potpunosti unutar kartice pregledača koju imate otvorenu.
Mogu li da proverim da se fajlovi ne otpremaju?
Da. Otvorite alatke za programere u pregledaču (F12), pređite na karticu Network (Mreža) i pratite da li tokom korišćenja alata ima odlaznih zahteva. Videćete da nikakvi podaci o fajlu ne napuštaju vaš pregledač. Sve operacije se završavaju bez mrežne aktivnosti.
Da li ovaj alat radi van mreže?
Da, kada se stranica jednom učita, alat radi u potpunosti u vašem pregledaču bez ikakve mrežne veze. Možete se isključiti sa interneta i nastaviti da ga koristite.
Šta se dešava kada osvežim stranicu?
Pošto se ništa ne čuva na serveru, osvežavanje stranice briše vašu trenutnu sesiju. Sve fajlove koje ste izabrali biće potrebno ponovo izabrati.
Da li ovaj alat čuva moje fajlove?
Ne. Fajlovi se drže u memoriji pregledača samo dok je stranica otvorena. Zatvaranje ili osvežavanje stranice ih odbacuje. Alat ništa ne upisuje na disk i ništa ne šalje na server.
Da li ovaj alat može da otključa PDF-ove zaštićene lozinkom?
Ne. Ovaj alat ne pokušava da ukloni niti zaobiđe zaštitu PDF-a lozinkom. Ako znate lozinku, alat Otključaj PDF na ovom sajtu može da je ukloni lokalno; nakon toga ovaj alat može da obradi fajl.
Koje tehnologije ovaj alat koristi?
Ovaj alat koristi pdf.js da renderuje stranice i Tesseract OCR mehanizam kompajliran u WebAssembly (tesseract.js) koji radi u Web Worker-u istog porekla — server nije uključen.
Da li ovaj alat koristi WebAssembly?
Da — ovo je jedan od retkih alata ovde koji ga koristi. Tesseract OCR mehanizam je C++ kompajliran u WebAssembly i radi unutar vašeg pregledača; .wasm binarni fajl se posluživa sa ovog sajta i ništa se ne šalje nigde.
Zašto je prvo pokretanje sporije od narednih?
Pri prvom korišćenju vaš pregledač preuzima OCR mehanizam i jezički model sa ovog sajta (nekoliko megabajta) i kompajlira ih. Nakon toga se keširaju, pa kasnija pokretanja počinju mnogo brže.