Font tiếng Việt trong PDF: test 20 font — lỗi gì khi convert?
Test 20 font VN phổ biến (Times New Roman, Arial, VNI, .vnTime): liệt kê lỗi cụ thể khi chuyển đổi PDF.
Có lần mình convert PDF sang Word cho khách — file dùng font .vnTime, mở Word ra thấy toàn ô vuông. Khách bảo "tool bị lỗi" nhưng thực ra là font không tương thích. Lần khác, file dùng Be Vietnam Pro mà Word không nhận diện, chữ nhảy hết sang Arial.
Mình quyết định test hệ thống 20 font tiếng Việt phổ biến nhất — từ font cũ đời VNI đến font Google mới. Convert PDF→Word và Word→PDF, ghi lại từng lỗi gặp phải.
20 font test
Mình chọn 20 font chia thành 4 nhóm:
- Font hệ thống: Times New Roman, Arial, Calibri, Tahoma, Verdana
- Font VNI cũ: .vnTime, .vnArial, VNI-Times, VNI-Helve, TCVN3 (ABC)
- Font Google hiện đại: Roboto, Be Vietnam Pro, Montserrat, Open Sans, Nunito
- Font thiết kế: SVN-Poppins, UTM-Avo, Quicksand, Lora, Source Sans Pro
Mỗi font mình tạo 1 file PDF chứa: 1 đoạn văn bản tiếng Việt (đủ dấu ă, â, ơ, ư, đ), 1 bảng số liệu, 1 heading có dấu. Dùng công cụ chuyển PDF sang Word của AloPDF để convert.
Kết quả tổng hợp
| Font | PDF→Word | Word→PDF | Lỗi gặp |
|---|---|---|---|
| Times New Roman | OK | OK | Không lỗi |
| Arial | OK | OK | Không lỗi |
| Calibri | OK | OK | Không lỗi |
| Tahoma | OK | OK | Không lỗi |
| Verdana | OK | OK | Không lỗi |
| .vnTime | LỖI | LỖI | Ô vuông, mất hoàn toàn |
| .vnArial | LỖI | LỖI | Ô vuông, mất hoàn toàn |
| VNI-Times | LỖI | LỖI | Dấu rời, ký tự sai |
| VNI-Helve | LỖI | LỖI | Dấu rời, ký tự sai |
| TCVN3 (ABC) | LỖI | LỖI | Encoding sai, chữ biến thành ký hiệu |
| Roboto | OK | OK | Không lỗi |
| Be Vietnam Pro | OK* | OK | Word fallback sang font khác nếu chưa cài |
| Montserrat | OK* | OK | Tương tự Be Vietnam Pro |
| Open Sans | OK | OK | Không lỗi |
| Nunito | OK | OK | Không lỗi |
| SVN-Poppins | OK* | OK | Thiếu 1-2 ký tự đặc biệt (ỹ, ỳ) |
| UTM-Avo | WARN | OK | Spacing dấu hơi lệch |
| Quicksand | OK | OK | Không lỗi |
| Lora | OK | OK | Không lỗi |
| Source Sans Pro | OK | OK | Không lỗi |
OK* = convert được nhưng có thể hiển thị khác nếu máy không cài font đó.
Phân tích lỗi từng nhóm
Font VNI/TCVN3 — thảm họa khi convert
Đây là nhóm font mình gặp nhiều nhất từ file cơ quan nhà nước, file cũ từ năm 2005-2010. Vấn đề cốt lõi: font VNI và TCVN3 dùng encoding riêng, không phải Unicode.
Cụ thể font .vnTime: chữ "ă" nó lưu thành ký tự "¨" ở vị trí code point khác. Khi convert, engine đọc đúng code point nhưng không biết đó là "ă" — nên hiện ô vuông.
Font Google — an toàn nhưng cần lưu ý
Roboto, Open Sans, Nunito, Quicksand — ngon lành cành đào. Lý do: đều là font Unicode, hỗ trợ đủ bảng ký tự tiếng Việt, và được embed đầy đủ trong PDF.
Be Vietnam Pro và Montserrat thì convert OK, nhưng khi mở Word trên máy không cài font → Word tự thay bằng Calibri. Layout có thể xô lệch (vì metric khác). Không phải lỗi tool, mà là Word không có font để render.
Font thiết kế — SVN-Poppins và UTM
SVN-Poppins thiếu vài glyph hiếm (ỹ, ỳ — ít dùng). Mình phát hiện khi test đoạn "kỹ thuật" — chữ "kỹ" hiện đúng vì glyph "ỹ" có trong font, nhưng "ỳ" đơn lẻ thì mất. Trường hợp edge case, ít gặp thực tế.
UTM-Avo: spacing dấu (dấu mũ, dấu huyền) bị lệch 1-2px khi convert sang Word. Đọc được, nhưng nhìn "đau mắt". Nguyên nhân: font định nghĩa mark-to-base anchor khác chuẩn.
Font nào an toàn nhất?
| Mục đích | Font khuyên dùng | Lý do |
|---|---|---|
| Văn bản cơ quan | Times New Roman | Chuẩn theo Nghị định 30/2020/NĐ-CP |
| Báo cáo doanh nghiệp | Arial, Calibri | Có sẵn mọi máy, convert không lỗi |
| Thiết kế hiện đại | Be Vietnam Pro, Roboto | Unicode đầy đủ, miễn phí |
| In ấn | Source Sans Pro, Lora | Hỗ trợ tốt Vietnamese glyphs |
Cách kiểm tra font trong PDF
Trước khi convert, muốn biết file dùng font gì:
- Adobe Reader: File → Properties → Fonts tab
- Foxit: File → Properties → Fonts
- Command line:
pdffonts file.pdf(poppler-utils)
Nếu thấy font tên bắt đầu bằng ".vn", "VNI-", "TCVN", hoặc "ABC" — đó là font cũ, sẽ gặp lỗi khi convert. Xử lý bằng cách chuyển encoding trước.
Tại sao font embed quan trọng?
Mình từng nhận file PDF từ designer dùng SVN-Poppins nhưng không embed. Mở trên máy mình — hiện Courier thay thế, xấu không chịu nổi. Convert sang Word càng tệ hơn vì engine không có glyph data để map.
Kiểm tra embed status bằng pdffonts:
- emb=yes: Font được nhúng — convert an toàn
- emb=no: Font không nhúng — phụ thuộc máy có font đó không
- sub=yes: Chỉ nhúng subset (các ký tự dùng trong file) — vẫn OK
Kết luận
20 font test xong, quy tắc đơn giản: font Unicode + embed = an toàn. Font VNI/TCVN3 = chắc chắn lỗi. Font Google hiện đại = convert tốt nhưng nhớ embed.
Nếu bạn đang cần chuyển PDF sang Word mà file dùng font lạ — check font trước, xử lý encoding nếu cần, rồi mới convert. Sẽ tiết kiệm rất nhiều thời gian sửa lỗi sau đó.
Dùng ngay: Chuyển PDF sang Word (.docx) — Giữ nguyên font, bảng biểu
Chuyển PDF sang Word online miễn phí, giữ nguyên bảng biểu, hình ảnh, font chữ tiếng Việt. Hỗ trợ OCR cho PDF scan. Không cần cài phần mềm, nhanh và chính xác.
Mở công cụ →