Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Tự động hóa trích xuất dữ liệu Excel sang file JSON bằng Python

Chử Nam Khánh 12/04/2026 19:58 433 lượt xem 2 trả lời

Chào các bác, hôm nay em muốn chia sẻ một chút kinh nghiệm về việc tự động hóa trích xuất dữ liệu từ file Excel sang định dạng JSON bằng Python. Em thấy trong chuyên mục này có nhiều bài về Python xử lý Excel, nhưng chủ yếu là cập nhật dữ liệu hoặc gửi báo cáo. Em thì hay phải làm việc với các API hoặc các hệ thống khác cần dữ liệu dưới dạng JSON, nên việc chuyển đổi này rất hữu ích.

Về cơ bản, chúng ta sẽ dùng thư viện pandas để đọc file Excel và json để xử lý file JSON.

Các bước chính như sau:

  • Đọc dữ liệu Excel vào DataFrame của pandas: df = pd.read_excel('du_lieu_cua_ban.xlsx')
  • Chuyển DataFrame sang định dạng JSON: json_data = df.to_json(orient='records', indent=4)
    Trong đó:
    • orient='records' sẽ tạo ra một danh sách các đối tượng JSON, mỗi đối tượng tương ứng với một hàng trong Excel.
    • indent=4 giúp file JSON dễ đọc hơn với thụt lề 4 khoảng trắng.
  • Ghi dữ liệu JSON ra file: with open('ket_qua.json', 'w', encoding='utf-8') as f: f.write(json_data)

Mã nguồn đầy đủ có thể trông như thế này:

import pandas as pd

# Đọc file Excel
df = pd.read_excel('du_lieu_cua_ban.xlsx')

# Chuyển đổi sang JSON
json_data = df.to_json(orient='records', indent=4)

# Ghi ra file JSON
with open('ket_qua.json', 'w', encoding='utf-8') as f:
    f.write(json_data)

print('Đã chuyển đổi dữ liệu thành công!')

Cách này giúp em tiết kiệm rất nhiều thời gian so với việc copy-paste thủ công. Không biết có bác nào có kinh nghiệm hay cách làm nào khác hiệu quả hơn không, chia sẻ cho em với ạ!

0

Hay quá bác ơi! Em cũng thường xuyên phải làm việc với JSON, mà mỗi lần copy-paste từ Excel sang đúng là mệt. Bác có thể chia sẻ rõ hơn về cách dùng pandas để đọc file Excel không ạ? Em đang dùng bản .xlsx, không biết có cần cài thêm gì không.

5

Tuyệt vời bác ạ! Đúng là nhu cầu chuyển đổi dữ liệu từ Excel sang JSON ngày càng phổ biến, đặc biệt là khi làm việc với các hệ thống web hay API.

Về phần pandas đọc file Excel, bác cứ yên tâm. Thư viện này hỗ trợ tốt cả các định dạng .xls.xlsx. Chỉ cần cài pandas là được, nó sẽ tự động nhận diện định dạng file.

Thế còn phần xử lý dữ liệu sau khi đọc từ Excel sang DataFrame của pandas, bác có gặp khó khăn gì trong việc ánh xạ các cột sang cấu trúc JSON mong muốn không? Em tò mò không biết bác xử lý các trường hợp lồng nhau (nested JSON) như thế nào.

1

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký