OCR skeniranog PDF-a uz privatnost — prepoznajte tekst u vašem pregledaču
Izaberite skenirani PDF i jezik; svaka stranica se renderuje i prepoznaje lokalno pomoću Tesseract-a (kompajliranog u WebAssembly), a prepoznati tekst se prikazuje i može preuzeti kao .txt fajl.
How it works
- Izaberite skenirani PDF sa svog uređaja i izaberite jezik dokumenta.
- Fajl se učitava u memoriju pregledača — nijedan podatak ne napušta vaš pregledač.
- pdf.js renderuje svaku stranicu u sliku u Web Worker-u.
- Tesseract OCR — kompajliran u WebAssembly i posluživan sa ovog sajta — prepoznaje tekst svake stranice lokalno; jezički model se takođe učitava sa ovog sajta, a ne sa CDN-a treće strane.
- Prepoznati tekst se prikazuje po stranici i nudi kao .txt za preuzimanje.
Frequently asked questions
- Po čemu se ovo razlikuje od drugih onlajn PDF alata?
- Većina onlajn PDF alata šalje vaše fajlove na udaljeni server radi obrade. Ovaj alat sve obrađuje lokalno u vašem pregledaču pomoću JavaScript-a na strani klijenta. Vaši fajlovi se ne prenose ni na jedan server, pa sadržaj dokumenta u potpunosti ostaje pod vašom kontrolom.
- Da li se moji PDF fajlovi otpremaju?
- Ne. Vaše fajlove čita direktno vaš pregledač. Ništa se ne prenosi preko mreže. Alat radi u potpunosti unutar kartice pregledača koju imate otvorenu.
- Mogu li da proverim da se fajlovi ne otpremaju?
- Da. Otvorite alatke za programere u pregledaču (F12), pređite na karticu Network (Mreža) i pratite da li tokom korišćenja alata ima odlaznih zahteva. Videćete da nikakvi podaci o fajlu ne napuštaju vaš pregledač. Sve operacije se završavaju bez mrežne aktivnosti.
- Da li ovaj alat radi van mreže?
- Da, kada se stranica jednom učita, alat radi u potpunosti u vašem pregledaču bez ikakve mrežne veze. Možete se isključiti sa interneta i nastaviti da ga koristite.
- Šta se dešava kada osvežim stranicu?
- Pošto se ništa ne čuva na serveru, osvežavanje stranice briše vašu trenutnu sesiju. Sve fajlove koje ste izabrali biće potrebno ponovo izabrati.
- Da li ovaj alat čuva moje fajlove?
- Ne. Fajlovi se drže u memoriji pregledača samo dok je stranica otvorena. Zatvaranje ili osvežavanje stranice ih odbacuje. Alat ništa ne upisuje na disk i ništa ne šalje na server.
- Da li ovaj alat može da otključa PDF-ove zaštićene lozinkom?
- Ne. Ovaj alat ne pokušava da ukloni niti zaobiđe zaštitu PDF-a lozinkom. Ako znate lozinku, alat Otključaj PDF na ovom sajtu može da je ukloni lokalno; nakon toga ovaj alat može da obradi fajl.
- Koje tehnologije ovaj alat koristi?
- Ovaj alat koristi pdf.js da renderuje stranice i Tesseract OCR mehanizam kompajliran u WebAssembly (tesseract.js) koji radi u Web Worker-u istog porekla — server nije uključen.
- Da li ovaj alat koristi WebAssembly?
- Da — ovo je jedan od retkih alata ovde koji ga koristi. Tesseract OCR mehanizam je C++ kompajliran u WebAssembly i radi unutar vašeg pregledača; .wasm binarni fajl se posluživa sa ovog sajta i ništa se ne šalje nigde.
- Zašto je prvo pokretanje sporije od narednih?
- Pri prvom korišćenju vaš pregledač preuzima OCR mehanizam i jezički model sa ovog sajta (nekoliko megabajta) i kompajlira ih. Nakon toga se keširaju, pa kasnija pokretanja počinju mnogo brže.