私密从 PDF 提取文字——完全在你的浏览器中运行
选择一个 PDF,每一页的文字层都会在浏览器本地提取,并以可下载的文本文件形式提供——无需上传。
How it works
- 用文件选择器从你的设备中选取一个 PDF 文件。
- 文件读入浏览器内存——没有数据离开你的浏览器。
- pdf.js 在 Web Worker 中加载文档,并对每一页调用 getTextContent() 以获取嵌入的文字层。
- 所有页面提取出的文字按顺序合并,并以可下载的 .txt 文件形式提供。
- 下载完成后,所有临时数据都会从内存中释放。
Frequently asked questions
- 它与其他在线 PDF 工具有什么不同?
- 多数在线 PDF 工具会把你的文件上传到远程服务器进行处理。本工具采用客户端 JavaScript,所有处理都在你的浏览器本地完成。文件不会被传输到任何服务器,因此文档内容始终掌握在你自己手中。
- 我的 PDF 文件会被上传吗?
- 不会。文件由浏览器直接读取,不会通过网络传输。整个工具仅在你打开的这个浏览器标签页内运行。
- 我能验证文件没有被上传吗?
- 可以。打开浏览器的开发者工具(F12),切换到 Network(网络)面板,在使用工具时留意是否有外发请求。你会发现没有任何文件数据离开浏览器,所有操作都在没有网络活动的情况下完成。
- 这个工具能离线使用吗?
- 可以。页面加载完成后,工具完全在浏览器中运行,无需网络连接。你可以断开网络后继续使用。
- 刷新页面后会怎样?
- 由于服务器上没有保存任何内容,刷新页面会清空当前会话。之前选择的文件需要重新选择。
- 这个工具会保存我的文件吗?
- 不会。文件仅在页面打开期间保存在浏览器内存中。关闭或刷新页面后即被丢弃。工具不会向磁盘写入任何内容,也不会发送到服务器。
- 这个工具能解锁有密码保护的 PDF 吗?
- 不会。本工具不会尝试移除或绕过 PDF 的密码保护。如果你知道密码,可以先用本站的 Unlock PDF 工具在本地移除密码,然后再用本工具处理文件。
- 这个工具使用了哪些技术?
- 本工具在 Web Worker 中使用 pdf.js(Mozilla 的客户端 PDF 引擎),在浏览器中读取每一页 PDF 嵌入的文字层。不涉及任何服务器。
- 这个工具使用 WebAssembly 吗?
- 没有。pdf.js 是纯 JavaScript 库,不使用 WebAssembly。所有 PDF 渲染都在浏览器中以客户端 JavaScript 完成。