Chào các bác, dạo này em cứ gặp mãi một kiểu dữ liệu khá 'khó chịu' trong Excel, đó là các bản ghi bị chồng chéo lên nhau. Cụ thể là có nhiều dòng cùng một mã hàng hóa, cùng một ngày, nhưng lại có các chỉ số bán hàng (ví dụ: số lượng, doanh thu) được ghi ở các cột khác nhau. Nhìn vào thì rất khó để tổng hợp lại xem trong ngày hôm đó, mã hàng này bán được bao nhiêu.
Em đã thử dùng các cách truyền thống như sắp xếp rồi copy-paste thủ công nhưng với file dung lượng lớn thì 'toát mồ hôi hạt é'.
Gần đây, em có mày mò và tìm ra một cách khá hiệu quả để xử lý dạng này bằng cách kết hợp Power Query. Ý tưởng là:
- Đưa toàn bộ dữ liệu vào Power Query.
- Sử dụng chức năng Unpivot Columns để đưa các cột chỉ số bán hàng về dạng một cột duy nhất, kèm theo tên cột chỉ số tương ứng.
- Sau đó, Group By (Nhóm theo) Mã hàng hóa và Ngày, đồng thời tính tổng các giá trị tương ứng với từng loại chỉ số.
Cách này giúp em gom được dữ liệu về một định dạng chuẩn, dễ dàng phân tích và tạo báo cáo Pivot Table sau đó.
Có bác nào có cách nào khác hay hơn hoặc có tình huống xử lý dữ liệu 'chồng chéo' tương tự không, cùng chia sẻ cho anh em học hỏi với ạ!