Извлечение текста из PDF без передачи данных — всё работает в вашем браузере

Выберите PDF — текстовый слой каждой страницы извлекается локально в браузере и предлагается для скачивания в виде текстового файла, без загрузки.

How it works

  1. Выберите PDF-файл на устройстве через окно выбора файлов.
  2. Файл считывается в память браузера — данные не покидают браузер.
  3. pdf.js загружает документ в Web Worker и вызывает getTextContent() для каждой страницы, чтобы получить встроенный текстовый слой.
  4. Извлечённый текст со всех страниц объединяется по порядку и предлагается для скачивания в виде файла .txt.
  5. Все временные данные освобождаются из памяти после завершения скачивания.

Frequently asked questions

Чем это отличается от других онлайн-сервисов для работы с PDF?
Большинство онлайн-сервисов для PDF отправляют ваши файлы на удалённый сервер для обработки. Этот инструмент выполняет все операции локально, в вашем браузере, с помощью клиентского JavaScript. Ваши файлы не передаются ни на какой сервер, поэтому содержимое документа остаётся полностью под вашим контролем.
Загружаются ли мои PDF-файлы куда-либо?
Нет. Ваши файлы читаются непосредственно браузером. По сети ничего не передаётся. Инструмент работает целиком в открытой вкладке браузера.
Могу ли я убедиться, что файлы не загружаются?
Да. Откройте инструменты разработчика в браузере (F12), перейдите на вкладку Network (Сеть) и следите за исходящими запросами во время работы. Вы увидите, что данные файла не покидают браузер. Все операции выполняются без сетевой активности.
Работает ли инструмент офлайн?
Да: после загрузки страницы инструмент работает полностью в браузере без подключения к сети. Можно отключиться от интернета и продолжать пользоваться им.
Что произойдёт, если обновить страницу?
Поскольку на сервере ничего не хранится, обновление страницы сбрасывает текущую сессию. Выбранные файлы придётся выбрать заново.
Хранит ли инструмент мои файлы?
Нет. Файлы находятся в памяти браузера только пока открыта страница. При закрытии или обновлении страницы они удаляются. Инструмент ничего не записывает на диск и ничего не отправляет на сервер.
Может ли этот инструмент снять защиту с PDF, защищённого паролем?
Нет. Этот инструмент не пытается снять или обойти парольную защиту PDF. Если вы знаете пароль, инструмент «Снять пароль» на этом сайте может удалить его локально; после этого данный инструмент сможет обработать файл.
Какие технологии использует инструмент?
Этот инструмент использует pdf.js (клиентский PDF-движок от Mozilla) в Web Worker, чтобы считывать встроенный текстовый слой с каждой страницы PDF внутри вашего браузера. Сервер не задействован.
Использует ли инструмент WebAssembly?
Нет. pdf.js — это обычная JavaScript-библиотека, она не использует WebAssembly. Всё извлечение текста из PDF выполняется в клиентском JavaScript в вашем браузере.