Font tiếng Việt trong PDF: test 20 font — lỗi gì khi convert?

Test 20 font VN phổ biến (Times New Roman, Arial, VNI, .vnTime): liệt kê lỗi cụ thể khi chuyển đổi PDF.

Có lần mình convert PDF sang Word cho khách — file dùng font .vnTime, mở Word ra thấy toàn ô vuông. Khách bảo "tool bị lỗi" nhưng thực ra là font không tương thích. Lần khác, file dùng Be Vietnam Pro mà Word không nhận diện, chữ nhảy hết sang Arial.

Mình quyết định test hệ thống 20 font tiếng Việt phổ biến nhất — từ font cũ đời VNI đến font Google mới. Convert PDF→Word và Word→PDF, ghi lại từng lỗi gặp phải.

20 font test

Mình chọn 20 font chia thành 4 nhóm:

  • Font hệ thống: Times New Roman, Arial, Calibri, Tahoma, Verdana
  • Font VNI cũ: .vnTime, .vnArial, VNI-Times, VNI-Helve, TCVN3 (ABC)
  • Font Google hiện đại: Roboto, Be Vietnam Pro, Montserrat, Open Sans, Nunito
  • Font thiết kế: SVN-Poppins, UTM-Avo, Quicksand, Lora, Source Sans Pro

Mỗi font mình tạo 1 file PDF chứa: 1 đoạn văn bản tiếng Việt (đủ dấu ă, â, ơ, ư, đ), 1 bảng số liệu, 1 heading có dấu. Dùng công cụ chuyển PDF sang Word của AloPDF để convert.

Kết quả tổng hợp

Font PDF→Word Word→PDF Lỗi gặp
Times New Roman OK OK Không lỗi
Arial OK OK Không lỗi
Calibri OK OK Không lỗi
Tahoma OK OK Không lỗi
Verdana OK OK Không lỗi
.vnTime LỖI LỖI Ô vuông, mất hoàn toàn
.vnArial LỖI LỖI Ô vuông, mất hoàn toàn
VNI-Times LỖI LỖI Dấu rời, ký tự sai
VNI-Helve LỖI LỖI Dấu rời, ký tự sai
TCVN3 (ABC) LỖI LỖI Encoding sai, chữ biến thành ký hiệu
Roboto OK OK Không lỗi
Be Vietnam Pro OK* OK Word fallback sang font khác nếu chưa cài
Montserrat OK* OK Tương tự Be Vietnam Pro
Open Sans OK OK Không lỗi
Nunito OK OK Không lỗi
SVN-Poppins OK* OK Thiếu 1-2 ký tự đặc biệt (ỹ, ỳ)
UTM-Avo WARN OK Spacing dấu hơi lệch
Quicksand OK OK Không lỗi
Lora OK OK Không lỗi
Source Sans Pro OK OK Không lỗi

OK* = convert được nhưng có thể hiển thị khác nếu máy không cài font đó.

Phân tích lỗi từng nhóm

Font VNI/TCVN3 — thảm họa khi convert

Đây là nhóm font mình gặp nhiều nhất từ file cơ quan nhà nước, file cũ từ năm 2005-2010. Vấn đề cốt lõi: font VNI và TCVN3 dùng encoding riêng, không phải Unicode.

Cụ thể font .vnTime: chữ "ă" nó lưu thành ký tự "¨" ở vị trí code point khác. Khi convert, engine đọc đúng code point nhưng không biết đó là "ă" — nên hiện ô vuông.

Gặp file font VNI? Cách xử lý: dùng tool chuyển encoding VNI→Unicode (như UniKey hoặc vn-convert online) trước, rồi mới convert PDF. Hiện tại không có tool PDF nào tự detect được font VNI đâu — kể cả Adobe Acrobat.

Font Google — an toàn nhưng cần lưu ý

Roboto, Open Sans, Nunito, Quicksand — ngon lành cành đào. Lý do: đều là font Unicode, hỗ trợ đủ bảng ký tự tiếng Việt, và được embed đầy đủ trong PDF.

Be Vietnam Pro và Montserrat thì convert OK, nhưng khi mở Word trên máy không cài font → Word tự thay bằng Calibri. Layout có thể xô lệch (vì metric khác). Không phải lỗi tool, mà là Word không có font để render.

Font thiết kế — SVN-Poppins và UTM

SVN-Poppins thiếu vài glyph hiếm (ỹ, ỳ — ít dùng). Mình phát hiện khi test đoạn "kỹ thuật" — chữ "kỹ" hiện đúng vì glyph "ỹ" có trong font, nhưng "ỳ" đơn lẻ thì mất. Trường hợp edge case, ít gặp thực tế.

UTM-Avo: spacing dấu (dấu mũ, dấu huyền) bị lệch 1-2px khi convert sang Word. Đọc được, nhưng nhìn "đau mắt". Nguyên nhân: font định nghĩa mark-to-base anchor khác chuẩn.

Font nào an toàn nhất?

Mục đích Font khuyên dùng Lý do
Văn bản cơ quan Times New Roman Chuẩn theo Nghị định 30/2020/NĐ-CP
Báo cáo doanh nghiệp Arial, Calibri Có sẵn mọi máy, convert không lỗi
Thiết kế hiện đại Be Vietnam Pro, Roboto Unicode đầy đủ, miễn phí
In ấn Source Sans Pro, Lora Hỗ trợ tốt Vietnamese glyphs

Cách kiểm tra font trong PDF

Trước khi convert, muốn biết file dùng font gì:

  • Adobe Reader: File → Properties → Fonts tab
  • Foxit: File → Properties → Fonts
  • Command line: pdffonts file.pdf (poppler-utils)

Nếu thấy font tên bắt đầu bằng ".vn", "VNI-", "TCVN", hoặc "ABC" — đó là font cũ, sẽ gặp lỗi khi convert. Xử lý bằng cách chuyển encoding trước.

Tip: Khi tạo PDF mới, luôn dùng font Unicode và embed font vào file. Trong Word: File → Options → Save → "Embed fonts in the file". Điều này đảm bảo người nhận luôn thấy đúng font, dù máy họ có cài hay không.

Tại sao font embed quan trọng?

Mình từng nhận file PDF từ designer dùng SVN-Poppins nhưng không embed. Mở trên máy mình — hiện Courier thay thế, xấu không chịu nổi. Convert sang Word càng tệ hơn vì engine không có glyph data để map.

Kiểm tra embed status bằng pdffonts:

  • emb=yes: Font được nhúng — convert an toàn
  • emb=no: Font không nhúng — phụ thuộc máy có font đó không
  • sub=yes: Chỉ nhúng subset (các ký tự dùng trong file) — vẫn OK

Kết luận

20 font test xong, quy tắc đơn giản: font Unicode + embed = an toàn. Font VNI/TCVN3 = chắc chắn lỗi. Font Google hiện đại = convert tốt nhưng nhớ embed.

Nếu bạn đang cần chuyển PDF sang Word mà file dùng font lạ — check font trước, xử lý encoding nếu cần, rồi mới convert. Sẽ tiết kiệm rất nhiều thời gian sửa lỗi sau đó.

Dùng ngay: Chuyển PDF sang Word (.docx) — Giữ nguyên font, bảng biểu

Chuyển PDF sang Word online miễn phí, giữ nguyên bảng biểu, hình ảnh, font chữ tiếng Việt. Hỗ trợ OCR cho PDF scan. Không cần cài phần mềm, nhanh và chính xác.

Mở công cụ →

Bài viết liên quan

Ảnh trong PDF mất nét khi nào? Test 72/150/300 DPI — ngưỡng chấp nhận Test ảnh 72/150/300 DPI trong PDF: khi nào bị mờ, ngưỡng DPI chấp nhận được cho in và xem màn hình. Tốc độ xử lý PDF online: benchmark AloPDF vs 3 đối thủ — có case thua Benchmark tốc độ và kích thước output: AloPDF vs SmallPDF vs iLovePDF vs PDF24. Trung thực, có case… PDF sang Word giữ định dạng: test 30 file phức tạp, chấm điểm 1-10 Test chuyển 30 file PDF phức tạp (bảng, hình, header/footer) sang Word: chấm điểm giữ định dạng từ … OCR tiếng Việt: test 50 file scan — độ chính xác theo font, DPI, góc nghiêng Test OCR 50 file scan tiếng Việt (hóa đơn, giấy tờ, sách): đo tỉ lệ chính xác theo font, DPI, góc n…