ดึงข้อความจาก PDF อย่างเป็นส่วนตัว — ทำงานในเบราว์เซอร์ของคุณทั้งหมด

เลือกไฟล์ PDF แล้วชั้นข้อความจากแต่ละหน้าจะถูกดึงออกมาในเครื่องในเบราว์เซอร์ของคุณ และเสนอเป็นไฟล์ข้อความให้ดาวน์โหลด — ไม่ต้องอัปโหลด

How it works

  1. เลือกไฟล์ PDF จากอุปกรณ์ของคุณด้วยตัวเลือกไฟล์
  2. ไฟล์จะถูกอ่านเข้าหน่วยความจำของเบราว์เซอร์ — ไม่มีข้อมูลออกจากเบราว์เซอร์ของคุณ
  3. pdf.js จะโหลดเอกสารใน Web Worker และเรียก getTextContent() สำหรับแต่ละหน้าเพื่อดึงชั้นข้อความที่ฝังอยู่
  4. ข้อความที่ดึงออกมาจากทุกหน้าจะถูกรวมตามลำดับและเสนอเป็นไฟล์ .txt ให้ดาวน์โหลด
  5. ข้อมูลชั่วคราวทั้งหมดจะถูกปล่อยออกจากหน่วยความจำเมื่อดาวน์โหลดเสร็จสมบูรณ์

Frequently asked questions

เครื่องมือนี้ต่างจากเครื่องมือ PDF ออนไลน์อื่นอย่างไร
เครื่องมือ PDF ออนไลน์ส่วนใหญ่จะส่งไฟล์ของคุณไปประมวลผลที่เซิร์ฟเวอร์ระยะไกล แต่เครื่องมือนี้ประมวลผลทุกอย่างในเบราว์เซอร์ของคุณด้วย JavaScript ที่ทำงานฝั่งไคลเอนต์ ไฟล์ของคุณจะไม่ถูกส่งไปยังเซิร์ฟเวอร์ใด ๆ ซึ่งหมายความว่าเนื้อหาเอกสารยังคงอยู่ในการควบคุมของคุณทั้งหมด
ไฟล์ PDF ของฉันถูกอัปโหลดไหม
ไม่ เบราว์เซอร์ของคุณอ่านไฟล์โดยตรง ไม่มีการส่งข้อมูลผ่านเครือข่าย เครื่องมือนี้ทำงานภายในแท็บเบราว์เซอร์ที่คุณเปิดอยู่ทั้งหมด
ฉันตรวจสอบได้ไหมว่าไฟล์ไม่ได้ถูกอัปโหลด
ได้ เปิดเครื่องมือสำหรับนักพัฒนาในเบราว์เซอร์ (F12) ไปที่แท็บ Network แล้วเฝ้าดูคำขอที่ส่งออกใด ๆ ระหว่างที่ใช้งานเครื่องมือ คุณจะเห็นว่าไม่มีข้อมูลไฟล์ออกจากเบราว์เซอร์ การทำงานทั้งหมดเสร็จสิ้นโดยไม่มีกิจกรรมบนเครือข่าย
เครื่องมือนี้ใช้งานแบบออฟไลน์ได้ไหม
ได้ เมื่อหน้าเว็บโหลดเสร็จแล้ว เครื่องมือจะทำงานในเบราว์เซอร์ของคุณทั้งหมดโดยไม่ต้องเชื่อมต่อเครือข่าย คุณสามารถตัดการเชื่อมต่ออินเทอร์เน็ตแล้วใช้งานต่อได้
เกิดอะไรขึ้นเมื่อฉันรีเฟรชหน้าเว็บ
เนื่องจากไม่มีการเก็บข้อมูลไว้บนเซิร์ฟเวอร์ การรีเฟรชหน้าเว็บจะล้างเซสชันปัจจุบันของคุณ ไฟล์ที่คุณเลือกไว้จะต้องเลือกใหม่อีกครั้ง
เครื่องมือนี้เก็บไฟล์ของฉันไว้ไหม
ไม่ ไฟล์จะถูกเก็บอยู่ในหน่วยความจำของเบราว์เซอร์เฉพาะตราบเท่าที่หน้าเว็บยังเปิดอยู่ การปิดหรือรีเฟรชหน้าจะลบไฟล์เหล่านั้นทิ้ง เครื่องมือไม่ได้เขียนอะไรลงดิสก์ และไม่มีการส่งสิ่งใดไปยังเซิร์ฟเวอร์
เครื่องมือนี้ปลดล็อกไฟล์ PDF ที่มีรหัสผ่านได้ไหม
ไม่ เครื่องมือนี้ไม่พยายามลบหรือข้ามการป้องกันด้วยรหัสผ่านของ PDF หากคุณทราบรหัสผ่าน เครื่องมือ Unlock PDF บนเว็บไซต์นี้สามารถลบรหัสผ่านได้ในเครื่องของคุณ จากนั้นเครื่องมือนี้จึงจะประมวลผลไฟล์ได้
เครื่องมือนี้ใช้เทคโนโลยีอะไร
เครื่องมือนี้ใช้ pdf.js (เอนจิน PDF ฝั่งไคลเอนต์ของ Mozilla) ใน Web Worker เพื่ออ่านชั้นข้อความที่ฝังอยู่จากแต่ละหน้า PDF ภายในเบราว์เซอร์ของคุณ ไม่มีการใช้เซิร์ฟเวอร์
เครื่องมือนี้ใช้ WebAssembly ไหม
ไม่ pdf.js เป็นไลบรารี JavaScript ล้วน ไม่ได้ใช้ WebAssembly การดึงข้อความจาก PDF ทั้งหมดเกิดขึ้นด้วย JavaScript ฝั่งไคลเอนต์ภายในเบราว์เซอร์ของคุณ