Извличане на текст от PDF поверително — работи изцяло в браузъра ви

Изберете PDF и текстовият слой от всяка страница се извлича локално в браузъра ви и се предлага като текстов файл за изтегляне — без качване.

How it works

  1. Изберете PDF файл от устройството си чрез избора на файлове.
  2. Файлът се чете в паметта на браузъра — никакви данни не напускат браузъра ви.
  3. pdf.js зарежда документа в Web Worker и извиква getTextContent() за всяка страница, за да извлече вградения текстов слой.
  4. Извлеченият текст от всички страници се комбинира по ред и се предлага като .txt файл за изтегляне.
  5. Всички временни данни се освобождават от паметта, след като изтеглянето приключи.

Frequently asked questions

С какво това се различава от другите онлайн PDF инструменти?
Повечето онлайн PDF инструменти изпращат файловете ви към отдалечен сървър за обработка. Този инструмент обработва всичко локално в браузъра ви чрез JavaScript от страна на клиента. Файловете ви не се предават към никакъв сървър, което означава, че съдържанието на документа остава изцяло под ваш контрол.
Файловете ми PDF качват ли се някъде?
Не. Файловете ви се четат директно от браузъра. Нищо не се предава по мрежата. Инструментът работи изцяло в рамките на отворения от вас раздел на браузъра.
Мога ли да проверя, че файловете не се качват?
Да. Отворете инструментите за разработчици на браузъра (F12), отидете в раздела Network и следете за изходящи заявки, докато използвате инструмента. Няма да видите данни от файла да напускат браузъра ви. Всички операции приключват без мрежова активност.
Работи ли този инструмент офлайн?
Да, след като страницата се зареди, инструментът работи изцяло в браузъра ви без никаква мрежова връзка. Може да изключите интернет и да продължите да го използвате.
Какво се случва, когато презаредя страницата?
Тъй като нищо не се съхранява на сървър, презареждането на страницата изчиства текущата ви сесия. Всички файлове, които сте избрали, ще трябва да бъдат избрани отново.
Този инструмент съхранява ли файловете ми?
Не. Файловете се пазят в паметта на браузъра само докато страницата е отворена. Затварянето или презареждането на страницата ги премахва. Инструментът не записва нищо на диска и не изпраща нищо към сървър.
Може ли този инструмент да отключва защитени с парола PDF файлове?
Не. Този инструмент не се опитва да премахне или заобиколи защитата с парола на PDF. Ако знаете паролата, инструментът Отключване на PDF на този сайт може да я премахне локално; след това този инструмент може да обработи файла.
Какви технологии използва този инструмент?
Този инструмент използва pdf.js (PDF механизмът на Mozilla от страна на клиента) в Web Worker, за да прочете вградения текстов слой от всяка страница на PDF в браузъра ви. Не участва сървър.
Този инструмент използва ли WebAssembly?
Не. pdf.js е обикновена JavaScript библиотека — не използва WebAssembly. Цялото извличане на текст от PDF се извършва чрез JavaScript от страна на клиента в браузъра ви.