Menu

Tự động hóa trích xuất dữ liệu Excel sang JSON bằng Python

Lường Thụy Khang 12/06/2026 04:41 236 lượt xem 3 trả lời

Chào các bạn, dạo này mình thấy nhiều anh em trong diễn đàn chia sẻ các bài viết về tự động hóa với Python và Excel, mình cũng rất thích thú. Hôm nay mình muốn chia sẻ một chút kinh nghiệm về việc trích xuất dữ liệu từ Excel và chuyển đổi sang định dạng JSON bằng Python. Định dạng JSON này rất hữu ích khi chúng ta cần tích hợp dữ liệu Excel vào các ứng dụng web hoặc API.

Thực tế, việc này không quá phức tạp. Chúng ta có thể sử dụng thư viện pandas quen thuộc để đọc file Excel, sau đó sử dụng phương thức to_json() của DataFrame để xuất ra file JSON.

Ví dụ đơn giản:

import pandas as pd

# Đọc file Excel
df = pd.read_excel('du_lieu_cua_ban.xlsx')

# Chuyển đổi và lưu sang file JSON
df.to_json('du_lieu_xuat.json', orient='records', indent=4)

Trong ví dụ trên:

  • pd.read_excel('du_lieu_cua_ban.xlsx'): Đọc dữ liệu từ file Excel có tên du_lieu_cua_ban.xlsx.
  • df.to_json('du_lieu_xuat.json', orient='records', indent=4): Chuyển DataFrame thành chuỗi JSON và lưu vào file du_lieu_xuat.json.
    • orient='records': Định dạng JSON theo kiểu danh sách các đối tượng (mỗi hàng là một đối tượng JSON).
    • indent=4: Thụt lề 4 khoảng trắng cho dễ đọc.

Cách này rất nhanh chóng và hiệu quả cho các tác vụ cần chuyển đổi định dạng dữ liệu. Hy vọng chia sẻ này hữu ích với mọi người!

3

Hay quá bạn ơi! Mình cũng đang tìm hiểu về cách tích hợp Excel với các định dạng khác để làm việc với API. Dùng pandas để đọc file Excel rồi chuyển sang JSON là một hướng đi rất hợp lý.

Bạn có thể chia sẻ thêm về cách bạn xử lý trường hợp file Excel có nhiều sheet không? Hay là cách xử lý dữ liệu bị thiếu/lỗi trong quá trình trích xuất không? Rất mong được học hỏi thêm từ kinh nghiệm của bạn!

2

Hay quá bạn ơi! Mình cũng đang tìm hiểu về cách tích hợp Excel với các định dạng khác để làm việc với API. Dùng pandas để đọc file Excel rồi chuyển sang JSON là một hướng đi rất hợp lý.

Bạn có thể chia sẻ thêm về cách bạn xử lý trường hợp file Excel có nhiều sheet không? Hay là cách xử lý dữ liệu bị thiếu/lỗi trong quá trình trích xuất không? Rất mong được học hỏi thêm từ kinh nghiệm của bạn!

1

Tuyệt vời! Bài chia sẻ của bạn rất hữu ích, nhất là với những ai đang cần làm việc với API.

Mình cũng từng gặp trường hợp tương tự và thấy pandas đúng là "cứu cánh". Ngoài việc đọc file Excel, bạn có thể chia sẻ thêm về cách bạn map các cột dữ liệu từ Excel sang cấu trúc JSON cho phù hợp với yêu cầu của API không? Đôi khi việc này cũng tốn kha khá thời gian.

1

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký