Chào mọi người,
Dạo gần đây mình có làm một dự án nhỏ là tự động lấy dữ liệu từ một API và đưa vào file Excel để làm báo cáo. Mình dùng Python để xử lý việc này và thấy khá hiệu quả, nên muốn chia sẻ lại cho anh em nào cần.
Tình huống:
Công ty mình có một API trả về dữ liệu bán hàng theo thời gian thực. Sếp muốn có một file Excel báo cáo hàng ngày, cập nhật dữ liệu mới nhất. Thay vì ngồi copy-paste thủ công, mình đã viết một script Python để làm việc này.
Cách thực hiện:
- Lấy dữ liệu từ API: Sử dụng thư viện
requestscủa Python để gửi yêu cầu đến API và nhận về dữ liệu (thường là JSON). - Xử lý dữ liệu: Dùng thư viện
pandasđể chuyển đổi dữ liệu JSON thành DataFrame, làm sạch và sắp xếp lại nếu cần. - Ghi ra file Excel: Dùng chính
pandasvới phương thứcto_excel()để lưu DataFrame thành file .xlsx.
Code ví dụ (đơn giản hóa):
import requests
import pandas as pd
# URL của API
api_url = "https://api.example.com/sales_data"
# Lấy dữ liệu
response = requests.get(api_url)
data = response.json()
# Chuyển thành DataFrame
df = pd.DataFrame(data)
# Xử lý dữ liệu (ví dụ: đổi tên cột)
df.rename(columns={'sale_amount': 'Doanh thu'}, inplace=True)
# Ghi ra file Excel
output_file = "bao_cao_ban_hang.xlsx"
df.to_excel(output_file, index=False)
print(f"Đã tạo file báo cáo: {output_file}")
Lợi ích:
- Tiết kiệm thời gian, giảm thiểu sai sót do nhập liệu thủ công.
- Báo cáo luôn được cập nhật với dữ liệu mới nhất.
- Có thể tùy chỉnh logic lấy và xử lý dữ liệu theo yêu cầu cụ thể.
Anh em nào đã từng làm tương tự hoặc có cách nào hay hơn thì chia sẻ nhé!