Chào mọi người,
Dạo này mình đang phải xử lý một đống báo cáo được lưu dưới dạng PDF. Mỗi file PDF lại chứa một bảng dữ liệu mà mình cần tổng hợp lại vào một file Excel duy nhất để phân tích. Việc copy/paste thủ công từng bảng từ mỗi file PDF sang Excel tốn rất nhiều thời gian và dễ sai sót.
Mình đã thử tìm hiểu trên mạng nhưng chủ yếu là hướng dẫn gom dữ liệu từ nhiều file Excel chứ ít thấy nói về việc gom từ PDF. Có ai đã từng gặp trường hợp tương tự và có giải pháp nào hiệu quả không ạ?
Mình đang nghĩ đến các hướng sau:
- Sử dụng công cụ bên thứ ba nào đó để chuyển đổi PDF sang Excel rồi mới gom.
- Tìm cách nào đó để Excel có thể đọc trực tiếp dữ liệu từ file PDF.
- Nhờ cao nhân nào có thể chia sẻ một đoạn VBA hoặc Power Query có thể giúp mình tự động hóa việc này.
Nếu có thể, mọi người chia sẻ thêm về cách xử lý các trường hợp PDF có cấu trúc không hoàn toàn giống nhau thì càng tốt ạ.
Cảm ơn mọi người đã đọc bài!