Chào các anh chị em trong diễn đàn,
Dạo này công ty em có một đống báo cáo gửi về dưới dạng PDF, mà toàn số liệu quan trọng. Mỗi lần muốn đưa vào Excel để phân tích là lại phải ngồi copy-paste thủ công, vừa tốn thời gian mà sai sót thì dễ như chơi.
Em có tìm hiểu và thấy Python có vẻ làm được việc này, đặc biệt là các thư viện như PyPDF2 hay tabula-py. Tuy nhiên, em vẫn còn hơi mơ hồ về cách áp dụng cụ thể. Có anh chị nào đã từng tự động hóa việc trích xuất dữ liệu từ file PDF và nhập vào Excel bằng Python chưa ạ?
Nếu có, anh chị có thể chia sẻ kinh nghiệm hoặc gợi ý một vài script mẫu không ạ? Em đang rất cần để giảm bớt gánh nặng nhập liệu này.
Em xin cảm ơn!