Chuyển PDF sang Word miễn phí 2026: so sánh 7 cách giữ layout
Chuyển PDF sang Word để edit là nhu cầu phổ biến. Bài này so sánh 7 tool (Adobe, Smallpdf, PDF24, Google Docs, LibreOffice, Pandoc, tool tự build) + workflow thực tế.
TLDR — chọn tool nhanh theo nhu cầu
- Quick, miễn phí, layout tốt: PDF sang Word — LibreOffice server-side, không watermark.
- Quality cao nhất, có phí: Adobe Acrobat Pro ($19.99/tháng).
- PDF scan (ảnh): OCR PDF → copy text vào Word.
- File phức tạp (nhiều column, TOC): Adobe Pro hoặc edit manual sau convert.
2 loại PDF cần phân biệt: (1) Text-based PDF (tạo từ Word/Indesign) — convert giữ layout tốt. (2) Image-based PDF (scan, ảnh chụp) — cần OCR riêng, convert thông thường output chỉ có ảnh.
Vì sao chuyển PDF sang Word thường khó?
PDF và Word có philosophy khác nhau:
PDF: fixed layout — vị trí mỗi character được lock cố định. Giống ảnh chụp trang giấy. Mục đích: hiển thị identical trên mọi thiết bị, in ra đẹp.
Word (.docx): flow-based — text reflow theo page size. Font, margin, spacing có thể chỉnh. Mục đích: edit được, adaptive layout.
Convert fixed → flow khó vì tool phải GUESS structure:
- Paragraph boundary nằm ở đâu?
- 2 đoạn text gần nhau là 1 paragraph hay 2?
- Table là real table hay chỉ là text aligned bằng tab?
- Header/footer có phải static element hay body text?
Tool AI-based (Adobe Acrobat 2024+) dùng ML để detect structure — accuracy cao hơn. Tool đơn giản (LibreOffice, Pandoc) heuristic rule-based — accuracy thấp hơn cho PDF phức tạp.
7 cách convert PDF → Word (tăng dần theo chất lượng)
Cách 1 — Copy-paste trực tiếp từ PDF reader (accuracy 60-75%)
Mở PDF trong Adobe Reader/Chrome → Ctrl+A → Ctrl+C → paste vào Word. Nhanh nhất. Mất format (column, table, style). Chỉ phù hợp lấy text thô.
Cách 2 — Google Docs 'Open With' (accuracy 75-85%)
Upload PDF lên Google Drive → right-click → Open With → Google Docs. Google OCR + convert tự động. Miễn phí. Layout giữ trung bình, table thường bị vỡ.
Cách 3 — LibreOffice Writer 'Open PDF' (accuracy 75-85%)
Cài LibreOffice free → File → Open → chọn PDF → tự open trong Draw (fix layout). Export sang .docx. Miễn phí, chất lượng trung bình.
Cách 4 — PDF sang Word (accuracy 80-90%)
Tool web này dùng LibreOffice headless trên server — tương đương cách 3 nhưng không cần cài. Giữ layout + font + table cho PDF đơn giản. Tiếng Việt OK.
Cách 5 — Smallpdf/iLovePDF (accuracy 80-90%)
Upload server → convert. Free limit 2 file/ngày. Watermark ở bản free. Chất lượng tương đương cách 4.
Cách 6 — Pandoc CLI (accuracy 80-90%, technical)
```bash # Cài pandoc brew install pandoc # Convert pandoc input.pdf -o output.docx ``` Flexibility cao, batch script, miễn phí. Output mất bookmark + table complex.
Cách 7 — Adobe Acrobat Pro (accuracy 90-98%)
Best in class. Tools → Export PDF → Microsoft Word. ML-based detection. Giữ được column layout, table structure, heading hierarchy. $19.99/tháng nhưng đáng tiền cho workflow professional.
Benchmark thực tế: 4 loại file PDF khác nhau
Test với 4 file input representative:
File 1 — Báo cáo text thuần (30 trang Word → PDF)
| Tool | Layout | Font | Time |
|---|---|---|---|
| PDF sang Word | 95% | 95% | 8s |
| Google Docs | 90% | 85% | 15s |
| Adobe Pro | 99% | 99% | 5s |
File 2 — Brochure thiết kế (2 columns, 10 ảnh)
| Tool | Layout | Ảnh | Time |
|---|---|---|---|
| PDF sang Word | 70% | 85% | 12s |
| Google Docs | 55% | 70% | 20s |
| Adobe Pro | 90% | 95% | 8s |
File 3 — Bảng biểu tài chính (nhiều table)
| Tool | Table | Số | Time |
|---|---|---|---|
| PDF sang Word | 75% | 90% | 10s |
| Google Docs | 60% | 85% | 15s |
| Adobe Pro | 92% | 98% | 6s |
File 4 — Hợp đồng có chữ ký scan
| Tool | Text | Chữ ký | Time |
|---|---|---|---|
| PDF sang Word | 90% | As image | 10s |
| OCR PDF + copy | 85% | - | 60s |
| Adobe Pro OCR | 96% | As image | 20s |
Kết luận: PDF sang Word đủ tốt cho 80% use case văn phòng. Với PDF phức tạp hoặc workflow professional, Adobe Pro đáng tiền.
PDF scan (ảnh quét): cần OCR trước
Workflow khi PDF là ảnh (scan từ máy scanner/điện thoại):
1. Xác định PDF loại gì: mở trong Adobe Reader, thử select text. Chọn được → text-based. Không select được → image-based.
2. Nếu image-based, dùng OCR PDF — Tesseract.js nhận dạng chữ trong ảnh, output text.
3. Copy text → paste vào Word. Hoặc download .txt rồi Word import.
4. Lưu ý: OCR accuracy tiếng Việt ~85-95% cho scan chất lượng cao (300 DPI, chữ rõ). Kém hơn với scan mờ, chụp điện thoại nghiêng. Luôn review output trước khi publish.
Alternative: Adobe Acrobat Pro có 'Scan & OCR' built-in — accuracy cao hơn (~95%+) cho tiếng Việt. iPhone Notes app có OCR tiếng Việt (iOS 16+) — chụp + extract text trực tiếp.
Tips giữ layout tốt nhất khi convert
Tip 1 — Source file matters:
PDF tạo từ Word 'Save as PDF' convert ngược về Word giữ layout tốt nhất (~90-95%). PDF tạo từ InDesign/LaTeX khó convert về Word vì structure khác.
Tip 2 — Font chuẩn:
Font phổ biến (Times New Roman, Arial, Calibri) convert giữ tốt. Font Pro/custom (Myriad, Proxima Nova) có thể substitute thành font tương tự trong Word.
Tip 3 — Avoid column + text wrap:
Layout 2-3 column + text wrap around image khó convert. Nếu có quyền edit source, export single-column PDF rồi convert → Word. Sau đó format lại column trong Word.
Tip 4 — Table structure:
Table trong PDF có border rõ ràng convert tốt hơn table tạo bằng text aligned bằng space/tab. Nếu PDF gốc có nhiều 'fake table', không tool nào convert perfect.
Tip 5 — Heading styles:
Tool không tự detect heading hierarchy. Sau convert, apply Heading 1/2/3 manually trong Word để có navigation pane + TOC auto.
(1) PDF sang Word cho convert, (2) review + fix layout 5-15 phút trong Word, (3) apply heading styles để structure, (4) done. Tổng 10-30 phút cho file 20-50 trang, vs 2-3 giờ nếu retype từ đầu.