Chào các bác, dạo này em hay phải làm việc với các file PDF báo cáo, mà nó cứ đòi trích xuất dữ liệu sang Excel để phân tích. Làm thủ công thì vừa mất thời gian vừa dễ sai sót. Em mò mẫm trên mạng và tìm được một cái tiện ích nhỏ khá hay, giúp tự động hóa việc này. Nay chia sẻ lên đây để anh em nào cần thì dùng thử ạ.
Cái tiện ích này nó có tên là PDF to Excel Converter (tên em tự đặt cho dễ nhớ thôi chứ thực ra nó có nhiều tên khác nhau tùy nguồn tải). Nó cho phép mình chọn file PDF, sau đó chọn vùng dữ liệu muốn trích xuất và nó sẽ xuất ra file Excel. Khá là tiện lợi, đặc biệt với các bảng biểu dạng cột, dòng rõ ràng trong PDF.
Cách sử dụng cơ bản:
- Tải về và cài đặt tiện ích.
- Mở tiện ích, chọn file PDF nguồn.
- Chọn các trang hoặc vùng dữ liệu cần trích xuất.
- Chọn định dạng đầu ra là Excel (.xlsx).
- Nhấn nút chuyển đổi và chờ kết quả.
Em đã thử với một vài báo cáo và thấy nó hoạt động khá ổn, độ chính xác cao với các file PDF có cấu trúc tốt. Tuy nhiên, với các file PDF scan hoặc có định dạng phức tạp thì có thể sẽ không chính xác hoàn toàn, cần chỉnh sửa lại một chút.
Anh em nào đã từng dùng qua tiện ích tương tự hoặc có cách nào khác hiệu quả hơn thì chia sẻ cho em với nhé. Em cảm ơn!