Chào các bác, em là thành viên mới của diễn đàn, cũng đang mày mò học Power BI. Vừa rồi em gặp một tình huống khá khoái với dữ liệu, muốn lên đây chia sẻ và cũng muốn hỏi thêm kinh nghiệm của các cao thủ ạ.
Chả là em có một bảng dữ liệu khách hàng, và cần lọc ra những khách hàng mà có cả hai thông tin là Email và Số điện thoại giống nhau với một bản ghi khác. Khác với việc chỉ trùng Email hoặc chỉ trùng SĐT, trường hợp này yêu cầu cả hai phải khớp cùng lúc.
Ban đầu em loay hoay mãi với Power Query, thử đủ kiểu merge, append nhưng không ra. Sau đó, em nghĩ đến việc sử dụng DAX và cuối cùng cũng tìm ra một cách khá ổn:
Đầu tiên, em tạo một cột mới trong bảng dữ liệu bằng cách kết hợp Email và SĐT lại. Ví dụ, nếu cột Email là [Email] và cột SĐT là [Phone], em tạo cột mới tên là [EmailPhoneCombined] với công thức:
[Email] & "-" & [Phone]Sau đó, em tạo một bảng tính (calculated table) khác để đếm số lần xuất hiện của mỗi giá trị trong cột [EmailPhoneCombined] này. Công thức như sau:
DuplicateCheck = SUMMARIZE( YourTableName, YourTableName[EmailPhoneCombined], "Count", COUNTROWS(YourTableName) )Cuối cùng, em dùng bảng DuplicateCheck này để lọc ra những bản ghi có Count lớn hơn 1 (tức là có cả Email và SĐT trùng nhau).
Cách này tuy hơi thủ công một chút nhưng em thấy khá hiệu quả. Không biết có bác nào có cách nào tối ưu hơn hoặc có thể làm trực tiếp trong Power Query mà không cần DAX không ạ? Rất mong được các bác chỉ giáo thêm!