Chào mọi người,
Mình thường xuyên phải làm việc với dữ liệu từ nhiều file Excel khác nhau, và việc tổng hợp chúng lại thành một file duy nhất luôn tốn rất nhiều thời gian. Gần đây, mình có tìm hiểu và áp dụng một số kỹ thuật để tự động hóa quá trình này, và muốn chia sẻ lại với mọi người.
Phương pháp mình thấy hiệu quả nhất là sử dụng Power Query. Với Power Query, bạn có thể dễ dàng kết nối đến các file Excel trong một thư mục, sau đó kết hợp (combine) tất cả dữ liệu lại thành một bảng duy nhất. Quá trình này bao gồm các bước:
- Kết nối đến thư mục chứa các file Excel cần tổng hợp.
- Chọn các file cần lấy dữ liệu (có thể lọc theo tên file, ngày tháng...).
- Chọn các sheet hoặc bảng chứa dữ liệu trong mỗi file.
- Thực hiện các bước làm sạch dữ liệu (nếu cần) như đổi tên cột, lọc bỏ dòng trống, thay đổi kiểu dữ liệu...
- Kết hợp dữ liệu từ tất cả các file thành một bảng duy nhất.
- Load kết quả ra một sheet mới hoặc ra một mô hình dữ liệu.
Ưu điểm của cách này là khi có file mới được thêm vào thư mục, bạn chỉ cần bấm Refresh là dữ liệu sẽ tự động cập nhật. Rất tiện lợi và giảm thiểu sai sót so với việc copy-paste thủ công.
Ngoài Power Query, mình cũng thử qua VBA nhưng thấy phức tạp hơn và khó bảo trì. Có anh em nào có cách nào hay hơn hoặc có kinh nghiệm gì với Power Query thì chia sẻ thêm nhé!
Cảm ơn mọi người đã đọc bài!