Szöveg kinyerése PDF-ből bizalmasan – teljes egészében a böngésződben fut
Válassz ki egy PDF-et, és az egyes oldalak szövegrétege helyben, a böngésződben kerül kinyerésre, majd letölthető szövegfájlként – feltöltés nélkül.
How it works
- Válassz ki egy PDF fájlt az eszközödről a fájlválasztóval.
- A fájl a böngésző memóriájába kerül – semmilyen adat nem hagyja el a böngésződet.
- A pdf.js egy Web Workerben betölti a dokumentumot, és minden oldalra meghívja a getTextContent() függvényt a beágyazott szövegréteg lekéréséhez.
- Az összes oldalból kinyert szöveg sorrendben összefűződik, és letölthető .txt fájlként.
- Minden ideiglenes adat felszabadul a memóriából, amint a letöltés befejeződött.
Frequently asked questions
- Miben különbözik ez a többi online PDF eszköztől?
- A legtöbb online PDF eszköz a fájljaidat egy távoli szerverre küldi feldolgozásra. Ez az eszköz mindent helyben, a böngésződben dolgoz fel, kliensoldali JavaScript segítségével. A fájljaid soha nem kerülnek átküldésre semmilyen szerverre, vagyis a dokumentumod tartalma teljes mértékben a te ellenőrzésed alatt marad.
- Feltöltődnek a PDF fájljaim?
- Nem. A fájljaidat közvetlenül a böngésződ olvassa be. Semmi nem kerül átküldésre a hálózaton. Az eszköz teljes egészében a megnyitott böngészőfülön belül működik.
- Ellenőrizhetem, hogy a fájlok nem töltődnek fel?
- Igen. Nyisd meg a böngésződ fejlesztői eszközeit (F12), válts a Network (Hálózat) fülre, és figyeld a kimenő kéréseket, miközben az eszközt használod. Nem fogsz látni fájladatokat kilépni a böngésződből. Minden művelet hálózati forgalom nélkül fejeződik be.
- Működik ez az eszköz offline módban?
- Igen, miután az oldal betöltődött, az eszköz teljes egészében a böngésződben fut, hálózati kapcsolat nélkül. Lekapcsolódhatsz az internetről, és folytathatod a használatát.
- Mi történik, ha frissítem az oldalt?
- Mivel semmi nem tárolódik szerveren, az oldal frissítése törli az aktuális munkamenetet. A korábban kiválasztott fájlokat újra ki kell majd választanod.
- Tárolja ez az eszköz a fájljaimat?
- Nem. A fájlok csak addig maradnak a böngésző memóriájában, amíg az oldal nyitva van. Az oldal bezárása vagy frissítése eldobja őket. Az eszköz semmit nem ír a lemezre, és semmit nem küld szerverre.
- Fel tudja oldani ez az eszköz a jelszóval védett PDF-eket?
- Nem. Ez az eszköz nem próbálja eltávolítani vagy megkerülni a PDF jelszavas védelmét. Ha ismered a jelszót, az ezen az oldalon található PDF-feloldó eszköz helyben el tudja távolítani; ezután ez az eszköz fel tudja dolgozni a fájlt.
- Milyen technológiákat használ ez az eszköz?
- Ez az eszköz a pdf.js-t (a Mozilla kliensoldali PDF-motorját) használja egy Web Workerben, hogy minden PDF oldalból beolvassa a beágyazott szövegréteget, a böngésződön belül. Nincs szerver a folyamatban.
- Használ ez az eszköz WebAssemblyt?
- Nem. A pdf.js egyszerű JavaScript könyvtár – nem használ WebAssemblyt. Minden szövegkinyerés kliensoldali JavaScriptben, a böngésződben történik.