私密从 PDF 提取文字——完全在你的浏览器中运行

选择一个 PDF,每一页的文字层都会在浏览器本地提取,并以可下载的文本文件形式提供——无需上传。

How it works

  1. 用文件选择器从你的设备中选取一个 PDF 文件。
  2. 文件读入浏览器内存——没有数据离开你的浏览器。
  3. pdf.js 在 Web Worker 中加载文档,并对每一页调用 getTextContent() 以获取嵌入的文字层。
  4. 所有页面提取出的文字按顺序合并,并以可下载的 .txt 文件形式提供。
  5. 下载完成后,所有临时数据都会从内存中释放。

Frequently asked questions

它与其他在线 PDF 工具有什么不同?
多数在线 PDF 工具会把你的文件上传到远程服务器进行处理。本工具采用客户端 JavaScript,所有处理都在你的浏览器本地完成。文件不会被传输到任何服务器,因此文档内容始终掌握在你自己手中。
我的 PDF 文件会被上传吗?
不会。文件由浏览器直接读取,不会通过网络传输。整个工具仅在你打开的这个浏览器标签页内运行。
我能验证文件没有被上传吗?
可以。打开浏览器的开发者工具(F12),切换到 Network(网络)面板,在使用工具时留意是否有外发请求。你会发现没有任何文件数据离开浏览器,所有操作都在没有网络活动的情况下完成。
这个工具能离线使用吗?
可以。页面加载完成后,工具完全在浏览器中运行,无需网络连接。你可以断开网络后继续使用。
刷新页面后会怎样?
由于服务器上没有保存任何内容,刷新页面会清空当前会话。之前选择的文件需要重新选择。
这个工具会保存我的文件吗?
不会。文件仅在页面打开期间保存在浏览器内存中。关闭或刷新页面后即被丢弃。工具不会向磁盘写入任何内容,也不会发送到服务器。
这个工具能解锁有密码保护的 PDF 吗?
不会。本工具不会尝试移除或绕过 PDF 的密码保护。如果你知道密码,可以先用本站的 Unlock PDF 工具在本地移除密码,然后再用本工具处理文件。
这个工具使用了哪些技术?
本工具在 Web Worker 中使用 pdf.js(Mozilla 的客户端 PDF 引擎),在浏览器中读取每一页 PDF 嵌入的文字层。不涉及任何服务器。
这个工具使用 WebAssembly 吗?
没有。pdf.js 是纯 JavaScript 库,不使用 WebAssembly。所有 PDF 渲染都在浏览器中以客户端 JavaScript 完成。