Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Xử lý dữ liệu 'nhân bản' trong Excel: Cách loại bỏ các dòng trùng lặp hiệu quả

Phi Yên Linh 11/04/2026 21:08 268 lượt xem 2 trả lời

Chào các anh chị, em mới làm quen với Excel và đang gặp một vấn đề khá nan giải. Em có một file dữ liệu khách hàng mà các dòng thông tin bị nhân bản khá nhiều, tức là có những khách hàng xuất hiện lặp đi lặp lại nhiều lần. Việc này làm cho số lượng dòng dữ liệu bị phình to và khó khăn khi phân tích. Em đã thử tìm hiểu trên mạng nhưng có vẻ cách xử lý nó lại liên quan đến Power Query, mà em thì chưa rành lắm.

Hiện tại, em đang cần tìm một cách đơn giản và nhanh chóng để loại bỏ các dòng trùng lặp, chỉ giữ lại một bản ghi duy nhất cho mỗi khách hàng. Có anh chị nào có kinh nghiệm xử lý vấn đề này không ạ? Em có thể dùng những hàm nào hoặc tính năng nào của Excel để làm việc này hiệu quả mà không cần dùng đến Power Query không?

Em có tham khảo qua cách dùng Remove Duplicates trong tab Data, nhưng nó chỉ loại bỏ các dòng trùng lặp hoàn toàn. Trong trường hợp của em, có những dòng chỉ trùng nhau ở một vài cột thông tin chính (ví dụ: Tên khách hàng, Số điện thoại) nhưng các cột khác lại khác nhau một chút. Em muốn giữ lại bản ghi đầu tiên hoặc cuối cùng thôi.

Rất mong nhận được sự giúp đỡ từ các cao thủ Excel ạ. Xin cảm ơn!

5

Chào bạn, vấn đề dòng dữ liệu trùng lặp trong Excel đúng là gây đau đầu thật. Mình hiểu cảm giác khi file dữ liệu cứ phình to ra mà lại khó phân tích.

Nếu bạn muốn một cách nhanh chóng mà không cần Power Query, bạn có thể thử tính năng Remove Duplicates có sẵn trong Excel. Chỉ cần chọn vùng dữ liệu, vào tab Data, chọn Remove Duplicates. Excel sẽ hỏi bạn muốn loại bỏ trùng lặp dựa trên cột nào. Đảm bảo bạn chọn đúng các cột chứa thông tin để xác định một dòng là trùng lặp nhé.

Cách này rất hiệu quả với các file không quá phức tạp. Nếu file của bạn có nhiều điều kiện để xác định trùng lặp hoặc bạn cần giữ lại một bản duy nhất theo tiêu chí nhất định, thì Power Query hoặc công thức INDEX-MATCH sẽ là lựa chọn mạnh mẽ hơn đấy.

2

Chào bạn,

Vấn đề loại bỏ dữ liệu trùng lặp này rất phổ biến, đặc biệt khi mới làm quen với Excel. Mình cũng từng gặp tình huống tương tự và cảm thấy khá bối rối.

Ngoài cách dùng tính năng Remove Duplicates mà bạn mình đã chia sẻ, bạn có thể thử dùng kết hợp một vài bước thủ công để đảm bảo tính chính xác nhé:

  1. Sắp xếp dữ liệu: Trước tiên, hãy sắp xếp dữ liệu theo các cột mà bạn muốn dùng để xác định sự trùng lặp.
  2. Dùng Conditional Formatting: Sau đó, dùng định dạng có điều kiện (Conditional Formatting) để tô màu các dòng trùng lặp. Chọn vùng dữ liệu, vào Home tab -> Conditional Formatting -> Highlight Cells Rules -> Duplicate Values.
  3. Lọc và Xóa: Cuối cùng, bạn có thể lọc theo màu sắc đã định dạng và xóa các dòng đó đi.

Cách này tuy hơi thủ công một chút nhưng lại dễ hình dung và kiểm soát hơn nếu bạn chưa quen với Power Query. Nếu bạn cần xử lý phức tạp hơn hoặc muốn tự động hóa, thì Power Query thực sự là một công cụ rất mạnh đấy!

0

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký