Извлечение текста из PDF без передачи данных — всё работает в вашем браузере
Выберите PDF — текстовый слой каждой страницы извлекается локально в браузере и предлагается для скачивания в виде текстового файла, без загрузки.
How it works
- Выберите PDF-файл на устройстве через окно выбора файлов.
- Файл считывается в память браузера — данные не покидают браузер.
- pdf.js загружает документ в Web Worker и вызывает getTextContent() для каждой страницы, чтобы получить встроенный текстовый слой.
- Извлечённый текст со всех страниц объединяется по порядку и предлагается для скачивания в виде файла .txt.
- Все временные данные освобождаются из памяти после завершения скачивания.
Frequently asked questions
- Чем это отличается от других онлайн-сервисов для работы с PDF?
- Большинство онлайн-сервисов для PDF отправляют ваши файлы на удалённый сервер для обработки. Этот инструмент выполняет все операции локально, в вашем браузере, с помощью клиентского JavaScript. Ваши файлы не передаются ни на какой сервер, поэтому содержимое документа остаётся полностью под вашим контролем.
- Загружаются ли мои PDF-файлы куда-либо?
- Нет. Ваши файлы читаются непосредственно браузером. По сети ничего не передаётся. Инструмент работает целиком в открытой вкладке браузера.
- Могу ли я убедиться, что файлы не загружаются?
- Да. Откройте инструменты разработчика в браузере (F12), перейдите на вкладку Network (Сеть) и следите за исходящими запросами во время работы. Вы увидите, что данные файла не покидают браузер. Все операции выполняются без сетевой активности.
- Работает ли инструмент офлайн?
- Да: после загрузки страницы инструмент работает полностью в браузере без подключения к сети. Можно отключиться от интернета и продолжать пользоваться им.
- Что произойдёт, если обновить страницу?
- Поскольку на сервере ничего не хранится, обновление страницы сбрасывает текущую сессию. Выбранные файлы придётся выбрать заново.
- Хранит ли инструмент мои файлы?
- Нет. Файлы находятся в памяти браузера только пока открыта страница. При закрытии или обновлении страницы они удаляются. Инструмент ничего не записывает на диск и ничего не отправляет на сервер.
- Может ли этот инструмент снять защиту с PDF, защищённого паролем?
- Нет. Этот инструмент не пытается снять или обойти парольную защиту PDF. Если вы знаете пароль, инструмент «Снять пароль» на этом сайте может удалить его локально; после этого данный инструмент сможет обработать файл.
- Какие технологии использует инструмент?
- Этот инструмент использует pdf.js (клиентский PDF-движок от Mozilla) в Web Worker, чтобы считывать встроенный текстовый слой с каждой страницы PDF внутри вашего браузера. Сервер не задействован.
- Использует ли инструмент WebAssembly?
- Нет. pdf.js — это обычная JavaScript-библиотека, она не использует WebAssembly. Всё извлечение текста из PDF выполняется в клиентском JavaScript в вашем браузере.