Ekstrak Teks dari PDF Secara Pribadi — Berjalan Sepenuhnya di Browser Anda
Pilih sebuah PDF, dan lapisan teks dari setiap halaman diekstrak secara lokal di browser Anda lalu ditawarkan sebagai file teks yang bisa diunduh — tanpa unggah.
How it works
- Pilih file PDF dari perangkat Anda melalui pemilih file.
- File dibaca ke dalam memori browser — tidak ada data yang keluar dari browser Anda.
- pdf.js memuat dokumen di dalam Web Worker dan memanggil getTextContent() untuk setiap halaman guna mengambil lapisan teks yang tertanam.
- Teks yang diekstrak dari semua halaman digabungkan sesuai urutan dan ditawarkan sebagai file .txt yang bisa diunduh.
- Semua data sementara dilepaskan dari memori setelah unduhan selesai.
Frequently asked questions
- Apa bedanya dengan alat PDF online lain?
- Sebagian besar alat PDF online mengirim file Anda ke server jarak jauh untuk diproses. Alat ini memproses semuanya secara lokal di browser Anda menggunakan JavaScript sisi klien. File Anda tidak pernah dikirim ke server mana pun, sehingga isi dokumen Anda tetap sepenuhnya berada dalam kendali Anda.
- Apakah file PDF saya diunggah?
- Tidak. File Anda dibaca langsung oleh browser. Tidak ada yang dikirim melalui jaringan. Alat ini bekerja sepenuhnya di dalam tab browser yang sedang Anda buka.
- Bisakah saya memastikan file tidak diunggah?
- Bisa. Buka developer tools browser Anda (F12), masuk ke tab Network, lalu perhatikan permintaan keluar saat Anda memakai alat ini. Anda tidak akan melihat data file keluar dari browser. Semua operasi selesai tanpa aktivitas jaringan.
- Apakah alat ini bisa dipakai secara offline?
- Ya. Setelah halaman selesai dimuat, alat ini berjalan sepenuhnya di browser Anda tanpa koneksi jaringan. Anda bisa memutus koneksi internet dan tetap menggunakannya.
- Apa yang terjadi saat saya me-refresh halaman?
- Karena tidak ada yang tersimpan di server, me-refresh halaman akan menghapus sesi Anda saat ini. File yang sudah Anda pilih perlu dipilih ulang.
- Apakah alat ini menyimpan file saya?
- Tidak. File hanya disimpan di memori browser selama halaman terbuka. Menutup atau me-refresh halaman akan membuangnya. Alat ini tidak menulis apa pun ke disk, dan tidak ada yang dikirim ke server.
- Bisakah alat ini membuka PDF yang dilindungi kata sandi?
- Tidak. Alat ini tidak mencoba menghapus atau melewati proteksi kata sandi PDF. Jika Anda tahu kata sandinya, alat Buka Kunci PDF (Unlock PDF) di situs ini bisa menghapusnya secara lokal; setelah itu alat ini dapat memproses file tersebut.
- Teknologi apa yang digunakan alat ini?
- Alat ini menggunakan pdf.js (mesin PDF sisi klien dari Mozilla) di dalam Web Worker untuk membaca lapisan teks yang tertanam dari setiap halaman PDF di browser Anda. Tidak ada server yang terlibat.
- Apakah alat ini menggunakan WebAssembly?
- Tidak. pdf.js adalah library JavaScript biasa — tidak menggunakan WebAssembly. Semua proses berjalan dalam JavaScript sisi klien di browser Anda.