Menu

Tự động hóa cập nhật dữ liệu Excel từ nhiều nguồn bằng Python

Ma Hiệp Kiên 11/06/2026 14:55 130 lượt xem 2 trả lời

Chào các bạn, dạo này mình đang tìm hiểu cách dùng Python để xử lý dữ liệu Excel và thấy nó thực sự mạnh mẽ. Hôm nay mình muốn chia sẻ một chút về cách tự động hóa việc cập nhật dữ liệu từ nhiều file Excel khác nhau vào một file tổng hợp duy nhất.

Công việc của mình thỉnh thoảng phải tổng hợp số liệu từ các báo cáo của các phòng ban khác nhau, mỗi phòng ban lại gửi báo cáo dưới dạng file Excel riêng. Việc copy-paste thủ công rất mất thời gian và dễ sai sót.

Sau khi tìm hiểu, mình đã sử dụng thư viện pandas trong Python để giải quyết vấn đề này. Ý tưởng cơ bản là:

  • Liệt kê tất cả các file Excel cần tổng hợp trong một thư mục.
  • Sử dụng vòng lặp để đọc từng file Excel bằng pd.read_excel().
  • Ghép các DataFrame đọc được lại với nhau bằng pd.concat().
  • Lưu kết quả vào một file Excel mới hoặc ghi đè lên file tổng hợp hiện có.

Ví dụ đơn giản về code:

import pandas as pd
import os

folder_path = 'duong_dan_den_thu_muc_chua_file'
output_file = 'tong_hop_du_lieu.xlsx'

all_data = []

for filename in os.listdir(folder_path):
    if filename.endswith('.xlsx'):
        file_path = os.path.join(folder_path, filename)
        df = pd.read_excel(file_path)
        all_data.append(df)

if all_data:
    final_df = pd.concat(all_data, ignore_index=True)
    final_df.to_excel(output_file, index=False)
    print(f'Đã tổng hợp dữ liệu vào {output_file}')
else:
    print('Không tìm thấy file Excel nào trong thư mục.')

Cách này giúp mình tiết kiệm rất nhiều thời gian và đảm bảo tính chính xác. Không biết có bạn nào đã áp dụng Python để tự động hóa các tác vụ tương tự trong Excel chưa? Chia sẻ thêm kinh nghiệm cho mọi người cùng học hỏi nhé!

2
Hay quá bạn ơi! Mình cũng đang đau đầu với việc tổng hợp dữ liệu từ nhiều file Excel đây. Bạn dùng thư viện nào mà hiệu quả vậy? Có thể chia sẻ thêm về cách bạn đọc dữ liệu từ nhiều file cùng lúc không? Mình đang dùng pandas để đọc từng file, nhưng ghép chúng lại vẫn hơi lúng túng.
1

Cảm ơn bạn đã chia sẻ! Quả thực, Python là một trợ thủ đắc lực cho việc xử lý dữ liệu Excel, nhất là khi phải làm việc với nhiều nguồn như vậy.

Bạn có thể bật mí thêm về cách bạn xử lý các định dạng file khác nhau (nếu có) hoặc cách bạn đảm bảo tính nhất quán của dữ liệu khi gom về một mối không? Mình tò mò không biết bạn có dùng phương pháp nào để kiểm tra sai sót sau khi tự động hóa không.

3

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký