Menu

Xử lý dữ liệu chuỗi có ký tự đặc biệt trong Power BI

Tiền Uyên Dân 01/04/2026 07:56 580 lượt xem 3 trả lời

Chào mọi người,

Dạo này mình làm báo cáo trên Power BI hay gặp vấn đề với dữ liệu chuỗi chứa các ký tự đặc biệt như dấu nháy đơn, nháy kép, ký tự xuống dòng ( ), hoặc các ký tự không hiển thị được. Những ký tự này đôi khi gây lỗi khi mình thực hiện các phép biến đổi dữ liệu hoặc khi hiển thị trên biểu đồ.

Mình đã thử một vài cách và muốn chia sẻ lại để mọi người cùng tham khảo:

  • Sử dụng hàm Replace trong Power Query: Đây là cách đơn giản và hiệu quả nhất. Trong Power Query Editor, chọn cột chứa dữ liệu chuỗi, vào tab Transform, chọn Replace Values.
    • Để thay thế một ký tự cụ thể, ví dụ dấu nháy đơn ('), nhập ' vào ô Value To Find và để trống ô Replace With để xóa bỏ hoặc nhập một ký tự khác nếu muốn thay thế.
    • Để xử lý ký tự xuống dòng ( ), bạn có thể thử nhập trực tiếp vào ô Value To Find. Nếu không được, bạn có thể cần tìm mã ASCII hoặc Unicode của ký tự đó và dùng hàm Text.From kết hợp với Character.FromNumber nếu cần. Tuy nhiên, cách phổ biến hơn là dùng Replace với Value To Find (ký tự xuống dòng dạng HTML entity) hoặc CHAR(10) trong Excel (nhưng trong Power BI bạn có thể cần tìm ký tự tương đương).
  • Sử dụng hàm Text.Replace trong M language: Nếu bạn muốn linh hoạt hơn hoặc xử lý nhiều ký tự cùng lúc, có thể viết công thức M trực tiếp. Ví dụ, để xóa dấu nháy đơn và dấu nháy kép:
= Text.Replace(Text.Replace([TenCotDuLieu], "'", ""), "\"", "")
  • Sử dụng DAX (ít dùng cho việc làm sạch ban đầu): DAX thường dùng cho tính toán sau khi dữ liệu đã được làm sạch. Tuy nhiên, nếu cần xử lý trong một measure hoặc calculated column, bạn có thể dùng hàm SUBSTITUTE.
Hoặc: NewColumn = SUBSTITUTE(SUBSTITUTE(Sheet1[TenCotDuLieu], "'", ""), "\"", "")

Mình thường ưu tiên xử lý trong Power Query vì nó ảnh hưởng đến toàn bộ quá trình tải và biến đổi dữ liệu. Cách này giúp dữ liệu sạch sẽ ngay từ đầu.

Không biết có anh em nào có cách nào hay hơn hoặc gặp trường hợp phức tạp hơn thì chia sẻ thêm nhé!

2

Chào bạn,

Vấn đề bạn gặp phải với ký tự đặc biệt trong chuỗi dữ liệu là rất phổ biến khi làm việc với Power BI. Hàm Replace trong Power Query đúng là một cứu cánh hiệu quả.

Mình cũng hay dùng cách này, đặc biệt là với các ký tự như dấu nháy đơn/kép hay ký tự xuống dòng. Ngoài ra, bạn có bao giờ gặp trường hợp các ký tự "lạ" không rõ nguồn gốc gây lỗi không? Mình từng phải dùng hàm Text.Clean để xử lý những trường hợp đó. Không biết bạn đã thử qua hàm này chưa?

0

Đúng là vấn đề ký tự đặc biệt trong chuỗi dữ liệu trên Power BI rất hay gặp. Cách dùng hàm Replace trong Power Query là mình hay dùng nhất, đặc biệt là với dấu nháy đơn và nháy kép.

Bạn đã thử xử lý các ký tự xuống dòng ( , ) bằng cách thay thế chúng bằng khoảng trắng chưa? Đôi khi chỉ cần vậy là biểu đồ đã hiển thị chuẩn rồi.

Còn trường hợp nào bạn thấy khó xử lý hơn không, chia sẻ thêm để mọi người cùng học hỏi nhé!

3

Hay quá bạn ơi, cảm ơn bạn đã chia sẻ mẹo xử lý ký tự đặc biệt trong Power BI nhé.

Mình cũng hay gặp tình trạng này, đặc biệt là mấy ký tự xuống dòng làm biểu đồ hiển thị sai. Hàm Replace đúng là cứu cánh.

Ngoài ra, mình còn hay dùng kết hợp thêm hàm Text.RemoveCharacters để loại bỏ hẳn các ký tự không mong muốn theo một danh sách định sẵn. Cách này giúp mình kiểm soát tốt hơn những gì cần loại bỏ.

Bạn đã thử cách này chưa? Hoặc có cách nào "độc chiêu" nào khác không, chia sẻ thêm cho mọi người với!

5

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký