Chào mọi người,
Dạo gần đây mình có làm việc nhiều với việc chuyển đổi dữ liệu từ Excel sang các định dạng khác để tích hợp với các hệ thống khác. Ngoài việc xuất ra CSV hay XML như nhiều bài đã chia sẻ, mình thấy việc xuất dữ liệu Excel sang định dạng JSON cũng rất hữu ích, đặc biệt khi làm việc với các API hoặc các ứng dụng web.
Mình đã thử nghiệm và thấy thư viện pandas của Python xử lý việc này khá đơn giản. Chỉ với vài dòng code là có thể chuyển đổi toàn bộ dữ liệu trong một file Excel sang JSON.
Đây là đoạn code mình hay dùng:
import pandas as pd
# Đọc file Excel
df = pd.read_excel('du_lieu_cua_ban.xlsx')
# Chuyển đổi sang định dạng JSON
# orient='records' sẽ tạo ra một danh sách các dictionary, mỗi dictionary là một dòng
df.to_json('du_lieu_cua_ban.json', orient='records', indent=4, force_ascii=False)
Trong đó:
pd.read_excel('du_lieu_cua_ban.xlsx'): Dùng để đọc dữ liệu từ file Excel của bạn.df.to_json('du_lieu_cua_ban.json', orient='records', indent=4, force_ascii=False): Chuyển đổi DataFrame sang file JSON.orient='records': Định dạng đầu ra là một mảng các đối tượng JSON, mỗi đối tượng đại diện cho một hàng trong Excel.indent=4: Thụt lề 4 khoảng trắng cho dễ đọc.force_ascii=False: Quan trọng để giữ nguyên các ký tự tiếng Việt.
Cách này rất tiện lợi khi bạn cần lấy dữ liệu từ Excel để populate cho một giao diện web hoặc gửi qua API. Có ai đã từng làm việc tương tự hoặc có cách nào khác hiệu quả hơn không, chia sẻ cho mình biết với nhé!