Xử lý 100 file PDF hàng loạt: đặt tên → ghép theo tháng → nén → backup

Real case: 100 hóa đơn/tháng → đặt tên chuẩn → ghép theo tháng → nén → backup. Quy trình 4 bước.

Bạn mình làm kế toán ở công ty thương mại, mỗi tháng nhận khoảng 80-120 hóa đơn PDF từ nhà cung cấp. Mỗi file tên kiểu "invoice.pdf", "HD001.pdf", "scan_20250301.pdf" — không quy chuẩn gì cả. Cuối quý cần tìm 1 hóa đơn mà lục 300 file, mất 20 phút mới ra.

Sau 2 lần như vậy, mình giúp bạn ấy setup workflow xử lý hàng loạt. Giờ mỗi tháng bỏ ra 15 phút, cả năm tiết kiệm được chắc 8-10 tiếng tìm kiếm.

Workflow xử lý 100 file PDF hàng loạt

Bước Hành động Thời gian (100 file)
1 Đặt tên chuẩn format 10 phút
2 Ghép theo tháng 2 phút
3 Nén file ghép 1 phút
4 Backup lên Drive 2 phút

Bước 1: Đặt tên file theo chuẩn

Đây là bước tốn thời gian nhất nhưng cũng quan trọng nhất. Format mình đề xuất:

YYYYMM_TenNCC_SoTien_MaHD.pdf

Ví dụ thực tế:

  • 202503_ViettelIDC_4500000_HD00142.pdf
  • 202503_GiaoHangNhanh_890000_GHN98712.pdf
  • 202503_FPTTelecom_1200000_FPT-2503-001.pdf
Tại sao YYYYMM đứng đầu? Vì khi sort theo tên file, tự động sort theo thời gian. Tên NCC tiếp theo để filter nhanh. Số tiền giúp tìm khi "nhớ mang máng là hóa đơn 4 triệu mấy".

Batch rename: dùng PowerRename (Windows, miễn phí trong PowerToys) hoặc Finder rename (Mac). Mình thường mở mỗi file xem nhanh 5 giây → rename → next. 100 file mất tầm 8-10 phút khi quen.

Bước 2: Ghép file theo tháng

Sau khi đặt tên xong, dùng ghép file PDF gom tất cả hóa đơn cùng tháng thành 1 file. Ví dụ:

  • HoaDon_202503_87files_tong324tr.pdf — gom 87 hóa đơn tháng 3
  • HoaDon_202504_96files_tong412tr.pdf — gom 96 hóa đơn tháng 4

Kết quả thực tế mình đo: 87 file riêng lẻ tổng 142MB → ghép thành 1 file = 138MB (nhỏ hơn một chút do giảm overhead metadata). Tìm kiếm trong 1 file (Ctrl+F) nhanh hơn rất nhiều so với mở từng file.

Mẹo: Upload file lên AloPDF ghép file theo thứ tự tên (đã sort sẵn theo YYYYMM). Kết quả ra đúng thứ tự thời gian, dễ dò.

Bước 3: Nén file ghép

File 138MB thì hơi nặng. Dùng nén PDF mức medium:

File Trước nén Sau nén Giảm
HoaDon_202503 138 MB 41 MB 70%
HoaDon_202504 156 MB 48 MB 69%

Hóa đơn scan thường nén rất tốt vì hình ảnh scan 300 DPI có nhiều vùng trắng → nén được mạnh. Hóa đơn điện tử (PDF gốc) thì nén ít hơn, tầm 20-30%.

Bước 4: Backup lên Google Drive

Cấu trúc folder mình recommend:

📁 Kế toán/
  📁 Hóa đơn đầu vào/
    📁 2025/
      📄 HoaDon_202501_tong285tr.pdf
      📄 HoaDon_202502_tong310tr.pdf
      📄 HoaDon_202503_tong324tr.pdf
      📁 File gốc/
        📁 202503/
          📄 (87 file riêng lẻ đã rename)

Giữ cả file ghép (dễ tìm) lẫn file gốc (khi cần xuất trình từng hóa đơn). Google Drive 15GB free — với file đã nén, chứa được khoảng 3 năm hóa đơn thoải mái.

So sánh trước/sau workflow

Tiêu chí Trước Sau
Tìm 1 hóa đơn cụ thể 15-20 phút 30 giây (Ctrl+F)
Dung lượng lưu trữ/tháng ~150 MB rời rạc ~45 MB gọn gàng
Thời gian xử lý/tháng 0 (nhưng nợ technical debt) 15 phút
Stress cuối quý Cao Gần zero

Lỗi mình từng mắc

Lần 1: Ghép file mà không sort tên trước → hóa đơn trong file ghép lung tung thứ tự. Phải ghép lại. Bài học: sort file trước khi upload.

Lần 2: Tháng 4/2024 quên backup, ổ cứng laptop bạn mình die mất 96 file. May mà hầu hết hóa đơn điện tử có thể tải lại từ email NCC. Nhưng mất 2 ngày liên hệ. Bài học: backup ngay sau khi xử lý, đừng để "mai làm".

Lần 3: Dùng tên file tiếng Việt có dấu → một số file upload Drive bị lỗi tên. Từ đó chuyển sang không dấu trong tên file: "ViettelIDC" thay vì "Viettel IDC".

Áp dụng cho ngành khác: Workflow này không chỉ cho kế toán. Team HR xử lý CV, team sales xử lý báo giá, team pháp chế xử lý hợp đồng — cùng pattern: nhiều file → đặt tên → ghép → nén → backup.

15 phút mỗi tháng. Đầu tư nhỏ, nhưng đến lúc cần tìm file gấp sẽ thấy xứng đáng.

Dùng ngay: Ghép file PDF thành 1 file duy nhất

Ghép file PDF, gộp nhiều file PDF thành 1 online miễn phí. Nối file PDF không cần cài phần mềm, xử lý 100% trên trình duyệt — bảo mật tuyệt đối. Hỗ trợ ghép 2, 3 hay nhiều file PDF cùng lúc.

Mở công cụ →

Bài viết liên quan

PDF cho team remote: tạo → review → ký → version control → archive Workflow quản lý tài liệu PDF cho team remote: tạo, review/comment, ký số, quản lý version, lưu trữ. Chuẩn bị hồ sơ pháp lý PDF: scan → OCR → kiểm tra → đánh số → ghép bộ Workflow 6 bước chuẩn bị hồ sơ pháp lý: scan sạch, OCR, kiểm tra nội dung, đánh số, ghép thành bộ. Tạo ebook PDF từ nhiều nguồn: Word + ảnh + mục lục → 1 file có bookmark Workflow 5 bước: gom chapters Word, ảnh, cover → ghép → thêm mục lục, bookmark, số trang. Gửi tài liệu PDF an toàn: nén → mật khẩu → watermark → gửi → xác nhận Workflow 5 bước gửi tài liệu nhạy cảm: chọn file, nén, đặt mật khẩu, thêm watermark, gửi qua kênh p…