Chào mọi người,
Dạo này mình có làm việc nhiều với Python để xử hóa dữ liệu Excel. Có một tác vụ mình thường xuyên phải làm là sắp xếp dữ liệu theo nhiều tiêu chí khác nhau, ví dụ như sắp xếp theo ngày tháng giảm dần, sau đó theo tên sản phẩm tăng dần, rồi lại theo số lượng giảm dần. Làm thủ công trên Excel thì hơi mất thời gian, đặc biệt với file dung lượng lớn.
Mình đã thử dùng Python để tự động hóa việc này và thấy khá hiệu quả. Dưới đây là đoạn code cơ bản mình hay dùng:
import pandas as pd
# Giả sử bạn có một DataFrame tên là df
# df = pd.read_excel('your_file.xlsx')
# Sắp xếp theo nhiều tiêu chí
# Ví dụ: Sắp xếp theo cột 'Ngay' giảm dần, rồi đến cột 'SanPham' tăng dần, cuối cùng là 'SoLuong' giảm dần
df_sorted = df.sort_values(by=['Ngay', 'SanPham', 'SoLuong'], ascending=[False, True, False])
# Lưu kết quả ra file Excel mới
df_sorted.to_excel('sorted_data.xlsx', index=False)
Trong đó:
pdlà thư viện pandas.sort_values()là hàm dùng để sắp xếp.bynhận vào một danh sách các cột cần sắp xếp.ascendingnhận vào một danh sách các giá trị boolean tương ứng vớibyđể chỉ định sắp xếp tăng dần (True) hay giảm dần (False).
Cách này giúp mình tiết kiệm kha khá thời gian và đảm bảo tính chính xác khi xử lý dữ liệu. Mọi người có ai dùng Python để sắp xếp dữ liệu Excel theo cách khác không, chia sẻ thêm cho mình học hỏi với ạ!