OCR PDF Hasil Pindai Secara Pribadi — Kenali Teks di Browser Anda
Pilih PDF hasil pindai dan bahasanya; setiap halaman dirender dan dikenali secara lokal oleh Tesseract (dikompilasi ke WebAssembly), dan teks hasil pengenalan ditampilkan serta bisa diunduh sebagai file .txt.
How it works
- Pilih PDF hasil pindai dari perangkat Anda dan pilih bahasa dokumennya.
- File dibaca ke dalam memori browser — tidak ada data yang keluar dari browser Anda.
- pdf.js merender setiap halaman menjadi gambar di dalam Web Worker.
- Tesseract OCR — dikompilasi ke WebAssembly dan disajikan dari situs ini — mengenali teks setiap halaman secara lokal; model bahasanya juga dimuat dari situs ini, bukan dari CDN pihak ketiga.
- Teks hasil pengenalan ditampilkan per halaman dan ditawarkan sebagai unduhan .txt.
Frequently asked questions
- Apa bedanya dengan alat PDF online lain?
- Sebagian besar alat PDF online mengirim file Anda ke server jarak jauh untuk diproses. Alat ini memproses semuanya secara lokal di browser Anda menggunakan JavaScript sisi klien. File Anda tidak pernah dikirim ke server mana pun, sehingga isi dokumen Anda tetap sepenuhnya berada dalam kendali Anda.
- Apakah file PDF saya diunggah?
- Tidak. File Anda dibaca langsung oleh browser. Tidak ada yang dikirim melalui jaringan. Alat ini bekerja sepenuhnya di dalam tab browser yang sedang Anda buka.
- Bisakah saya memastikan file tidak diunggah?
- Bisa. Buka developer tools browser Anda (F12), masuk ke tab Network, lalu perhatikan permintaan keluar saat Anda memakai alat ini. Anda tidak akan melihat data file keluar dari browser. Semua operasi selesai tanpa aktivitas jaringan.
- Apakah alat ini bisa dipakai secara offline?
- Ya. Setelah halaman selesai dimuat, alat ini berjalan sepenuhnya di browser Anda tanpa koneksi jaringan. Anda bisa memutus koneksi internet dan tetap menggunakannya.
- Apa yang terjadi saat saya me-refresh halaman?
- Karena tidak ada yang tersimpan di server, me-refresh halaman akan menghapus sesi Anda saat ini. File yang sudah Anda pilih perlu dipilih ulang.
- Apakah alat ini menyimpan file saya?
- Tidak. File hanya disimpan di memori browser selama halaman terbuka. Menutup atau me-refresh halaman akan membuangnya. Alat ini tidak menulis apa pun ke disk, dan tidak ada yang dikirim ke server.
- Bisakah alat ini membuka PDF yang dilindungi kata sandi?
- Tidak. Alat ini tidak mencoba menghapus atau melewati proteksi kata sandi PDF. Jika Anda tahu kata sandinya, alat Buka Kunci PDF (Unlock PDF) di situs ini bisa menghapusnya secara lokal; setelah itu alat ini dapat memproses file tersebut.
- Teknologi apa yang digunakan alat ini?
- Alat ini menggunakan pdf.js untuk merender halaman dan mesin Tesseract OCR yang dikompilasi ke WebAssembly (tesseract.js) yang berjalan di Web Worker dengan origin yang sama — tidak ada server yang terlibat.
- Apakah alat ini menggunakan WebAssembly?
- Ya — ini salah satu dari sedikit alat di sini yang menggunakannya. Mesin Tesseract OCR adalah C++ yang dikompilasi ke WebAssembly dan berjalan di dalam browser Anda; berkas .wasm-nya disajikan dari situs ini dan tidak ada yang dikirim ke mana pun.
- Mengapa proses pertama lebih lambat dibandingkan proses berikutnya?
- Saat pertama kali digunakan, browser Anda mengunduh mesin OCR dan model bahasa dari situs ini (beberapa megabita) lalu mengompilasinya. Keduanya disimpan dalam cache setelahnya, sehingga proses berikutnya jauh lebih cepat.