Nén PDF bao nhiêu là đủ? Test 100 file từ 1MB đến 50MB
Test thực tế 100 file PDF ở 3 mức nén (50%, 70%, 90%): đo chất lượng text, hình ảnh, và dung lượng output.
Mỗi lần nén PDF mình đều phân vân: nén ít thì giảm không bao nhiêu, nén nhiều thì sợ mất chất lượng. File nén xong có mờ không? Text có bị ảnh hưởng không? Nén 90% với 70% khác nhau thế nào?
Thôi — ngồi test luôn cho rõ. Mình lấy 100 file PDF thật (không phải file mẫu), nén ở 3 mức, rồi so sánh chất lượng. Kết quả khá bất ngờ — text thì không bao giờ bị ảnh hưởng, chỉ có ảnh mới "dính".
Cách test
Mình chia 100 file thành 5 nhóm, mỗi nhóm 20 file:
- Hóa đơn điện tử (VNPT/Viettel) — file nhỏ, chủ yếu text + logo
- Báo cáo Excel export — bảng biểu, chart
- Luận văn Word export — text nhiều, có hình minh họa
- Brochure / catalog — ảnh sản phẩm chiếm 80%
- Slide PPTX export — mix text + hình nền + icon
Engine nén: Ghostscript 10.02 (đúng cái AloPDF đang dùng trên production). 3 mức nén: 50% (nhẹ), 70% (cân bằng), 90% (mạnh nhất).
Đánh giá chất lượng: text thì mình copy ra check lỗi ký tự. Ảnh thì so sánh bằng mắt + tính SSIM score (>0.95 là chấp nhận được).
Kết quả tổng: 100 file
| Mức nén | Dung lượng TB | Giảm | Text OK? | Ảnh OK? |
|---|---|---|---|---|
| 50% (nhẹ) | 5.8 MB | -29% | 100/100 | 100/100 |
| 70% (cân bằng) | 3.1 MB | -62% | 100/100 | 96/100 |
| 90% (mạnh) | 1.4 MB | -83% | 100/100 | 71/100 |
Phát hiện chính: Text không bị ảnh hưởng ở bất kỳ mức nào. Cả 100 file, cả 3 mức — text giữ nguyên. Chỉ có ảnh mới giảm chất lượng.
Nghe có vẻ hiển nhiên, nhưng nhiều người (kể cả mình trước đây) cứ sợ "nén PDF mất text". Không hề. Lý do ở phần cuối bài.
Chi tiết từng nhóm file
Hóa đơn điện tử (20 file, ~370 KB/file)
| Mức | Sau nén | Giảm | Nhận xét |
|---|---|---|---|
| 50% | 310 KB | -16% | Gần như không thay đổi |
| 70% | 245 KB | -34% | Logo hơi mờ, không đáng kể |
| 90% | 180 KB | -51% | Logo mờ rõ, text vẫn OK |
Hóa đơn gốc đã nhỏ sẵn — nén thêm cũng không giảm được nhiều. Kết luận: hóa đơn thì nén hay không cũng được. Chỉ nén khi ghép 50+ file thành 1 rồi muốn giảm tổng dung lượng.
Báo cáo Excel (20 file, ~2.1 MB/file)
| Mức | Sau nén | Giảm | Nhận xét |
|---|---|---|---|
| 50% | 1.5 MB | -29% | Chart sắc nét |
| 70% | 850 KB | -60% | Chart hơi mờ ở zoom 200%, bình thường ở 100% |
| 90% | 420 KB | -80% | Chart mờ rõ rệt |
Đa số người đọc báo cáo ở zoom 100% — nên 70% là đủ. Chỉ khi trình chiếu lên projector (phóng to) mới cần 50%.
Luận văn (20 file, ~5.4 MB/file)
| Mức | Sau nén | Giảm | Nhận xét |
|---|---|---|---|
| 50% | 3.8 MB | -30% | Hình minh họa giữ nguyên |
| 70% | 2.0 MB | -63% | Hình chấp nhận được |
| 90% | 1.1 MB | -80% | Biểu đồ có chữ nhỏ bị mờ, khó đọc |
Gửi email thầy: 70%. Nộp bản chính thức để in: 50% hoặc không nén. Mình từng nén 90% rồi gửi — thầy phản hồi "biểu đồ trang 45 mờ quá em ơi". Từ đó chỉ dùng 70% thôi.
Brochure / catalog (20 file, ~18.5 MB/file)
| Mức | Sau nén | Giảm | Nhận xét |
|---|---|---|---|
| 50% | 12.1 MB | -35% | Ảnh sản phẩm vẫn nét |
| 70% | 5.8 MB | -69% | OK khi xem online, in thì hơi mờ |
| 90% | 2.3 MB | -88% | Ảnh mờ rõ — nhìn "rẻ tiền" |
Đây là nhóm nhạy cảm nhất. Brochure mà ảnh mờ thì mất chuyên nghiệp. Gửi khách hàng: chỉ nên 50%. Dùng nội bộ: 70% tạm OK. Đừng nén 90% cho file nhiều ảnh.
Slide PPTX export (20 file, ~14.8 MB/file)
| Mức | Sau nén | Giảm | Nhận xét |
|---|---|---|---|
| 50% | 9.5 MB | -36% | Slide đẹp |
| 70% | 4.7 MB | -68% | Background hơi mờ, text vẫn rõ |
| 90% | 2.1 MB | -86% | Background mờ rệt, nhưng nếu chỉ đọc nội dung thì chấp nhận |
Slide PDF thường để đọc lại nội dung, không phải để trình chiếu (đã có file PPTX gốc). Nên 70% là OK cho mục đích chia sẻ/lưu trữ.
Bảng quyết định — dùng mức nào?
| Tình huống | Mức nén | Lý do |
|---|---|---|
| Gửi email (< 10 MB) | 70% | Cân bằng, đủ dùng |
| Gửi Zalo (< 25 MB) | 50-70% | Zalo rộng rãi hơn email |
| Upload cổng nhà nước (5-10 MB) | 70-90% | Họ không quan tâm ảnh đẹp |
| Lưu trữ dài hạn | 50% | Giữ chất lượng cho mai sau |
| In ấn | Không nén | Cần 300 DPI |
| Chỉ đọc nội bộ, text-only | 90% | Text không bị ảnh hưởng |
| Gửi khách hàng (brochure/proposal) | 50% | Ảnh mờ = mất chuyên nghiệp |
Tại sao text không bao giờ bị?
Câu hỏi mình thắc mắc lâu rồi, tìm hiểu thì hóa ra đơn giản:
Ghostscript xử lý text và ảnh bằng 2 cách hoàn toàn khác nhau:
- Text → nén bằng FLATE (giống zip) → lossless → không mất gì, bao giờ cũng giải nén lại y nguyên
- Ảnh → nén bằng JPEG → lossy → mất chi tiết tùy mức quality
Khi bạn chọn "nén 70%" — thực ra là giảm JPEG quality của ảnh bên trong PDF xuống 70%. Text thì luôn luôn FLATE, không thay đổi dù bạn chọn mức nào.
Nên: file toàn text (hợp đồng, hóa đơn) → nén 90% thoải mái. File nhiều ảnh (brochure, catalog) → cẩn thận hơn.
Muốn hiểu sâu hơn: Lossy vs Lossless trong nén PDF.
Khi nào KHÔNG nên nén
Mấy trường hợp mình rút kinh nghiệm:
- File đã nén rồi: Nén lại file đã nén — giảm thêm được 3-5% nhưng mất thêm chất lượng ảnh. Không đáng. Check: nếu nén 70% mà chỉ giảm <10% → file gốc đã optimize sẵn.
- File có chữ ký số: Nén = thay đổi byte → chữ ký số vô hiệu. Mình từng nén 1 hợp đồng đã ký → gửi cho đối tác → họ báo "chữ ký không hợp lệ". Bài học nhớ đời.
- File cần in: Máy in cần ảnh 300 DPI. Nén 90% có thể đưa ảnh về ~150 DPI → in ra mờ. Nếu in, giữ nguyên hoặc chỉ 50%.
- PDF/A (lưu trữ pháp lý): File PDF/A yêu cầu tuân thủ chuẩn ISO. Nén có thể phá vỡ compliance — đặc biệt khi remove metadata hoặc re-encode font.
Thử nén
Mở AloPDF Nén PDF → upload file → chọn mức → tải về. So sánh dung lượng trước/sau. Nếu ảnh mờ quá → thử lại mức thấp hơn.
Không cần đoán — cứ thử 70% trước. Đa số trường hợp là đủ.
Dùng ngay: Nén PDF — Giảm dung lượng file PDF mà không mất chất lượng
Nén file PDF online miễn phí, giảm dung lượng tới 90%. 4 mức nén tùy chỉnh. File nén xong vẫn sắc nét, giữ nguyên text và hình ảnh. Nhanh, bảo mật, không cần phần mềm.
Mở công cụ →