Chào các bạn, dạo này mình thấy nhiều anh em trong diễn đàn chia sẻ các bài viết về tự động hóa với Python và Excel, mình cũng rất thích thú. Hôm nay mình muốn chia sẻ một chút kinh nghiệm về việc trích xuất dữ liệu từ Excel và chuyển đổi sang định dạng JSON bằng Python. Định dạng JSON này rất hữu ích khi chúng ta cần tích hợp dữ liệu Excel vào các ứng dụng web hoặc API.
Thực tế, việc này không quá phức tạp. Chúng ta có thể sử dụng thư viện pandas quen thuộc để đọc file Excel, sau đó sử dụng phương thức to_json() của DataFrame để xuất ra file JSON.
Ví dụ đơn giản:
import pandas as pd
# Đọc file Excel
df = pd.read_excel('du_lieu_cua_ban.xlsx')
# Chuyển đổi và lưu sang file JSON
df.to_json('du_lieu_xuat.json', orient='records', indent=4)
Trong ví dụ trên:
pd.read_excel('du_lieu_cua_ban.xlsx'): Đọc dữ liệu từ file Excel có têndu_lieu_cua_ban.xlsx.df.to_json('du_lieu_xuat.json', orient='records', indent=4): Chuyển DataFrame thành chuỗi JSON và lưu vào filedu_lieu_xuat.json.orient='records': Định dạng JSON theo kiểu danh sách các đối tượng (mỗi hàng là một đối tượng JSON).indent=4: Thụt lề 4 khoảng trắng cho dễ đọc.
Cách này rất nhanh chóng và hiệu quả cho các tác vụ cần chuyển đổi định dạng dữ liệu. Hy vọng chia sẻ này hữu ích với mọi người!