Wyodrębnianie tekstu z PDF z poszanowaniem prywatności — działa w całości w przeglądarce

Wybierz plik PDF, a warstwa tekstowa z każdej strony zostanie wyodrębniona lokalnie w przeglądarce i udostępniona jako plik tekstowy do pobrania — bez wysyłania.

How it works

  1. Wybierz plik PDF z urządzenia za pomocą okna wyboru plików.
  2. Plik jest wczytywany do pamięci przeglądarki — żadne dane nie opuszczają przeglądarki.
  3. pdf.js wczytuje dokument w Web Workerze i wywołuje getTextContent() dla każdej strony, aby pobrać osadzoną warstwę tekstową.
  4. Wyodrębniony tekst ze wszystkich stron jest łączony w kolejności i udostępniany jako plik .txt do pobrania.
  5. Wszystkie tymczasowe dane są zwalniane z pamięci po zakończeniu pobierania.

Frequently asked questions

Czym ten serwis różni się od innych narzędzi PDF online?
Większość internetowych narzędzi PDF wysyła Twoje pliki na zdalny serwer w celu przetworzenia. To narzędzie przetwarza wszystko lokalnie w Twojej przeglądarce, korzystając z JavaScriptu działającego po stronie klienta. Twoje pliki nie są przesyłane na żaden serwer, więc zawartość dokumentów pozostaje całkowicie pod Twoją kontrolą.
Czy moje pliki PDF są wysyłane na serwer?
Nie. Twoje pliki są odczytywane bezpośrednio przez przeglądarkę. Nic nie jest przesyłane przez sieć. Narzędzie działa w całości w otwartej karcie przeglądarki.
Czy mogę sprawdzić, że pliki nie są wysyłane?
Tak. Otwórz narzędzia deweloperskie przeglądarki (F12), przejdź do zakładki Sieć (Network) i obserwuj wychodzące żądania podczas korzystania z narzędzia. Zobaczysz, że żadne dane plików nie opuszczają przeglądarki. Wszystkie operacje kończą się bez aktywności sieciowej.
Czy narzędzie działa offline?
Tak. Po wczytaniu strony narzędzie działa w całości w przeglądarce, bez połączenia z siecią. Możesz odłączyć się od internetu i nadal z niego korzystać.
Co się stanie, gdy odświeżę stronę?
Ponieważ nic nie jest zapisywane na serwerze, odświeżenie strony kończy bieżącą sesję. Wybrane wcześniej pliki trzeba będzie wybrać ponownie.
Czy narzędzie przechowuje moje pliki?
Nie. Pliki znajdują się w pamięci przeglądarki tylko tak długo, jak długo strona jest otwarta. Zamknięcie lub odświeżenie strony je usuwa. Narzędzie nie zapisuje niczego na dysku ani nie wysyła niczego na serwer.
Czy to narzędzie może odblokować pliki PDF chronione hasłem?
Nie. To narzędzie nie usuwa ani nie omija ochrony hasłem w plikach PDF. Jeśli znasz hasło, narzędzie Odblokuj PDF na tej stronie może je usunąć lokalnie, a wtedy to narzędzie przetworzy plik.
Z jakich technologii korzysta to narzędzie?
To narzędzie korzysta z pdf.js (silnika PDF firmy Mozilla działającego po stronie klienta) w Web Workerze, aby odczytać osadzoną warstwę tekstową z każdej strony PDF w Twojej przeglądarce. Nie korzysta z żadnego serwera.
Czy narzędzie korzysta z WebAssembly?
Nie. pdf.js to zwykła biblioteka JavaScript — nie używa WebAssembly. Całe wyodrębnianie tekstu z PDF odbywa się w JavaScripcie po stronie klienta, w Twojej przeglądarce.