Menu

Xử lý dữ liệu trùng lặp thông minh với Power Query

Quản Thúy Phát 12/06/2026 11:58 495 lượt xem 2 trả lời

Chào các bác, hôm nay em muốn chia sẻ một cách khá hay để xử lý dữ liệu trùng lặp trong Excel mà không cần dùng đến hàm hay VBA phức tạp. Em thường xuyên phải làm việc với các file excel có dữ liệu lớn và đôi khi gặp phải tình trạng trùng lặp thông tin. Trước đây, em toàn dùng Remove Duplicates hoặc các hàm như COUNTIF để lọc, nhưng với lượng dữ liệu khổng lồ thì khá chậm và tốn công.

Gần đây, em tìm hiểu về Power Query và thấy nó giải quyết vấn đề này một cách cực kỳ hiệu quả. Các bước thực hiện khá đơn giản:

  • Đầu tiên, các bác nạp dữ liệu vào Power Query Editor.
  • Chọn cột hoặc các cột chứa thông tin các bác muốn kiểm tra trùng lặp.
  • Chuột phải vào tiêu đề cột đó, chọn Remove Duplicates.

Thao tác này sẽ tự động loại bỏ các hàng trùng lặp dựa trên cột các bác đã chọn. Cái hay là Power Query xử lý rất nhanh, kể cả với hàng trăm nghìn dòng. Sau khi xử lý xong, các bác chỉ cần Close & Load để đưa dữ liệu đã lọc về lại bảng tính Excel.

Cách này rất hữu ích cho các bác nào thường xuyên phải tổng hợp báo cáo, nhập liệu từ nhiều nguồn hoặc làm sạch dữ liệu trước khi phân tích. Nó giúp tiết kiệm kha khá thời gian và công sức. Các bác thử xem sao nhé!

3

Hay quá bạn ơi! Mình cũng hay gặp vấn đề với dữ liệu trùng lặp trên file lớn, dùng Remove Duplicates nhiều lúc "đứng hình" luôn. Power Query đúng là cứu cánh. Bạn có thể chia sẻ kỹ hơn về cách bạn áp dụng Power Query để loại bỏ trùng lặp theo nhiều cột không? Mình đang muốn lọc theo cả Mã NV và Ngày làm việc chẳng hạn.

0

Đúng là Power Query xử lý dữ liệu lớn và trùng lặp rất mượt mà thật bạn nhỉ! Mình cũng thích cách nó tự động hóa quy trình, đỡ phải làm thủ công nhiều.

Về vụ lọc trùng lặp theo nhiều cột, bạn có thể thử các bước sau:

  1. Chọn cột bạn muốn dùng để xác định trùng lặp (ví dụ: Mã NV, Ngày làm việc).
  2. Click chuột phải vào tiêu đề cột, chọn "Remove Duplicates".
  3. Trong cửa sổ hiện ra, chọn các cột cần loại bỏ trùng lặp.

Nếu bạn cần giữ lại một bản ghi cụ thể (ví dụ: bản ghi đầu tiên hoặc cuối cùng) dựa trên một tiêu chí nào đó, thì có thể cần thêm bước "Group By" hoặc sắp xếp trước khi loại bỏ trùng lặp. Bạn đang gặp khó khăn ở bước nào hay muốn giữ lại bản ghi theo tiêu chí nào cụ thể không?

4

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký