Xử lý 100 file PDF hàng loạt: đặt tên → ghép theo tháng → nén → backup
Real case: 100 hóa đơn/tháng → đặt tên chuẩn → ghép theo tháng → nén → backup. Quy trình 4 bước.
Bạn mình làm kế toán ở công ty thương mại, mỗi tháng nhận khoảng 80-120 hóa đơn PDF từ nhà cung cấp. Mỗi file tên kiểu "invoice.pdf", "HD001.pdf", "scan_20250301.pdf" — không quy chuẩn gì cả. Cuối quý cần tìm 1 hóa đơn mà lục 300 file, mất 20 phút mới ra.
Sau 2 lần như vậy, mình giúp bạn ấy setup workflow xử lý hàng loạt. Giờ mỗi tháng bỏ ra 15 phút, cả năm tiết kiệm được chắc 8-10 tiếng tìm kiếm.
Workflow xử lý 100 file PDF hàng loạt
| Bước | Hành động | Thời gian (100 file) |
|---|---|---|
| 1 | Đặt tên chuẩn format | 10 phút |
| 2 | Ghép theo tháng | 2 phút |
| 3 | Nén file ghép | 1 phút |
| 4 | Backup lên Drive | 2 phút |
Bước 1: Đặt tên file theo chuẩn
Đây là bước tốn thời gian nhất nhưng cũng quan trọng nhất. Format mình đề xuất:
YYYYMM_TenNCC_SoTien_MaHD.pdf
Ví dụ thực tế:
202503_ViettelIDC_4500000_HD00142.pdf202503_GiaoHangNhanh_890000_GHN98712.pdf202503_FPTTelecom_1200000_FPT-2503-001.pdf
Batch rename: dùng PowerRename (Windows, miễn phí trong PowerToys) hoặc Finder rename (Mac). Mình thường mở mỗi file xem nhanh 5 giây → rename → next. 100 file mất tầm 8-10 phút khi quen.
Bước 2: Ghép file theo tháng
Sau khi đặt tên xong, dùng ghép file PDF gom tất cả hóa đơn cùng tháng thành 1 file. Ví dụ:
HoaDon_202503_87files_tong324tr.pdf— gom 87 hóa đơn tháng 3HoaDon_202504_96files_tong412tr.pdf— gom 96 hóa đơn tháng 4
Kết quả thực tế mình đo: 87 file riêng lẻ tổng 142MB → ghép thành 1 file = 138MB (nhỏ hơn một chút do giảm overhead metadata). Tìm kiếm trong 1 file (Ctrl+F) nhanh hơn rất nhiều so với mở từng file.
Bước 3: Nén file ghép
File 138MB thì hơi nặng. Dùng nén PDF mức medium:
| File | Trước nén | Sau nén | Giảm |
|---|---|---|---|
| HoaDon_202503 | 138 MB | 41 MB | 70% |
| HoaDon_202504 | 156 MB | 48 MB | 69% |
Hóa đơn scan thường nén rất tốt vì hình ảnh scan 300 DPI có nhiều vùng trắng → nén được mạnh. Hóa đơn điện tử (PDF gốc) thì nén ít hơn, tầm 20-30%.
Bước 4: Backup lên Google Drive
Cấu trúc folder mình recommend:
📁 Kế toán/
📁 Hóa đơn đầu vào/
📁 2025/
📄 HoaDon_202501_tong285tr.pdf
📄 HoaDon_202502_tong310tr.pdf
📄 HoaDon_202503_tong324tr.pdf
📁 File gốc/
📁 202503/
📄 (87 file riêng lẻ đã rename)
Giữ cả file ghép (dễ tìm) lẫn file gốc (khi cần xuất trình từng hóa đơn). Google Drive 15GB free — với file đã nén, chứa được khoảng 3 năm hóa đơn thoải mái.
So sánh trước/sau workflow
| Tiêu chí | Trước | Sau |
|---|---|---|
| Tìm 1 hóa đơn cụ thể | 15-20 phút | 30 giây (Ctrl+F) |
| Dung lượng lưu trữ/tháng | ~150 MB rời rạc | ~45 MB gọn gàng |
| Thời gian xử lý/tháng | 0 (nhưng nợ technical debt) | 15 phút |
| Stress cuối quý | Cao | Gần zero |
Lỗi mình từng mắc
Lần 1: Ghép file mà không sort tên trước → hóa đơn trong file ghép lung tung thứ tự. Phải ghép lại. Bài học: sort file trước khi upload.
Lần 2: Tháng 4/2024 quên backup, ổ cứng laptop bạn mình die mất 96 file. May mà hầu hết hóa đơn điện tử có thể tải lại từ email NCC. Nhưng mất 2 ngày liên hệ. Bài học: backup ngay sau khi xử lý, đừng để "mai làm".
Lần 3: Dùng tên file tiếng Việt có dấu → một số file upload Drive bị lỗi tên. Từ đó chuyển sang không dấu trong tên file: "ViettelIDC" thay vì "Viettel IDC".
15 phút mỗi tháng. Đầu tư nhỏ, nhưng đến lúc cần tìm file gấp sẽ thấy xứng đáng.
Dùng ngay: Ghép file PDF thành 1 file duy nhất
Ghép file PDF, gộp nhiều file PDF thành 1 online miễn phí. Nối file PDF không cần cài phần mềm, xử lý 100% trên trình duyệt — bảo mật tuyệt đối. Hỗ trợ ghép 2, 3 hay nhiều file PDF cùng lúc.
Mở công cụ →