Ekstrak Teks daripada PDF Secara Peribadi — Berjalan Sepenuhnya dalam Pelayar Anda
Pilih PDF, dan lapisan teks daripada setiap halaman diekstrak secara setempat dalam pelayar anda dan ditawarkan sebagai fail teks yang boleh dimuat turun — tanpa muat naik.
How it works
- Pilih fail PDF daripada peranti anda menggunakan pemilih fail.
- Fail dibaca ke dalam memori pelayar — tiada data keluar daripada pelayar anda.
- pdf.js memuatkan dokumen dalam Web Worker dan memanggil getTextContent() bagi setiap halaman untuk mendapatkan lapisan teks terbenam.
- Teks yang diekstrak daripada semua halaman digabungkan mengikut susunan dan ditawarkan sebagai fail .txt yang boleh dimuat turun.
- Semua data sementara dilepaskan daripada memori sebaik sahaja muat turun selesai.
Frequently asked questions
- Apa bezanya alat ini dengan alat PDF dalam talian yang lain?
- Kebanyakan alat PDF dalam talian menghantar fail anda ke pelayan jauh untuk diproses. Alat ini memproses segala-galanya secara setempat dalam pelayar anda menggunakan JavaScript sisi pelanggan. Fail anda tidak pernah dihantar ke mana-mana pelayan, jadi kandungan dokumen anda kekal sepenuhnya di bawah kawalan anda.
- Adakah fail PDF saya dimuat naik?
- Tidak. Fail anda dibaca terus oleh pelayar anda. Tiada apa-apa dihantar melalui rangkaian. Alat ini berfungsi sepenuhnya dalam tab pelayar yang anda buka.
- Bolehkah saya sahkan bahawa fail tidak dimuat naik?
- Boleh. Buka alat pembangun pelayar anda (F12), pergi ke tab Network, dan perhatikan jika ada sebarang permintaan keluar semasa menggunakan alat ini. Anda akan dapati tiada data fail keluar daripada pelayar anda. Semua operasi selesai tanpa sebarang aktiviti rangkaian.
- Adakah alat ini berfungsi secara luar talian?
- Ya. Sebaik sahaja halaman selesai dimuatkan, alat ini berjalan sepenuhnya dalam pelayar anda tanpa sebarang sambungan rangkaian. Anda boleh memutuskan sambungan internet dan terus menggunakannya.
- Apa yang berlaku apabila saya muat semula halaman?
- Oleh sebab tiada apa-apa disimpan pada pelayan, memuat semula halaman akan mengosongkan sesi semasa anda. Fail yang telah anda pilih perlu dipilih semula.
- Adakah alat ini menyimpan fail saya?
- Tidak. Fail disimpan dalam memori pelayar hanya selagi halaman dibuka. Menutup atau memuat semula halaman akan membuangnya. Alat ini tidak menulis apa-apa ke cakera, dan tiada apa-apa dihantar ke pelayan.
- Bolehkah alat ini membuka kunci PDF yang dilindungi kata laluan?
- Tidak. Alat ini tidak cuba membuang atau memintas perlindungan kata laluan PDF. Jika anda tahu kata laluannya, alat Buka Kunci PDF di laman ini boleh membuangnya secara setempat; selepas itu alat ini boleh memproses fail tersebut.
- Teknologi apa yang digunakan oleh alat ini?
- Alat ini menggunakan pdf.js (enjin PDF sisi pelanggan daripada Mozilla) dalam Web Worker untuk membaca lapisan teks terbenam daripada setiap halaman PDF dalam pelayar anda. Tiada pelayan terlibat.
- Adakah alat ini menggunakan WebAssembly?
- Tidak. pdf.js ialah pustaka JavaScript biasa — ia tidak menggunakan WebAssembly. Semua pengekstrakan teks PDF berlaku dalam JavaScript sisi pelanggan dalam pelayar anda.