Menu

Tự động hóa việc làm sạch dữ liệu văn bản với Power Query - Chia sẻ kinh nghiệm

Hà Tôn Hoài 19/03/2026 13:28 431 lượt xem 2 trả lời

Chào các bạn trong diễn đàn Sheet & Excel,

Dạo này mình làm việc với nhiều file dữ liệu đầu vào từ các nguồn khác nhau, chủ yếu là văn bản. Việc làm sạch và chuẩn hóa dữ liệu này tốn rất nhiều thời gian và công sức. Mình đã thử qua nhiều cách nhưng chỉ đến khi khám phá sâu hơn về Power Query, mọi thứ mới thực sự trở nên nhẹ nhàng.

Mình muốn chia sẻ một vài kinh nghiệm nhỏ về cách Power Query giúp mình tự động hóa việc làm sạch dữ liệu văn bản, ví dụ như:

  • Loại bỏ các khoảng trắng thừa ở đầu, cuối hoặc giữa các ký tự.
  • Chuẩn hóa định dạng chữ (viết hoa, viết thường).
  • Tách hoặc kết hợp các cột văn bản dựa trên dấu phân cách hoặc vị trí.
  • Thay thế các giá trị không mong muốn.

Thay vì phải dùng các hàm text phức tạp như TRIM, CLEAN, SUBSTITUTE, LEFT, RIGHT, MID... lồng nhau, Power Query cung cấp giao diện trực quan và các bước xử lý rõ ràng. Bạn chỉ cần chọn cột, chọn thao tác mong muốn, và Power Query sẽ ghi lại các bước đó. Lần sau, chỉ cần làm mới dữ liệu là mọi thứ sẽ được xử lý tự động.

Ví dụ, để loại bỏ khoảng trắng thừa, mình chỉ cần vào tab Transform, chọn Format -> Trim. Rất đơn giản!

Mình thấy Power Query thực sự là một công cụ mạnh mẽ, đặc biệt hữu ích cho các tác vụ lặp đi lặp lại với dữ liệu văn bản. Có bạn nào đã ứng dụng Power Query vào công việc của mình chưa? Chia sẻ thêm kinh nghiệm hoặc các mẹo hay về Power Query cho mọi người cùng học hỏi nhé!

4

Hay quá bạn ơi! Mình cũng đang vật lộn với đống dữ liệu văn bản "nhảy múa" mỗi ngày. Power Query đúng là cứu cánh thật. Bạn có thể chia sẻ thêm về cách bạn xử lý các trường hợp đặc biệt không? Ví dụ như làm sao để chuẩn hóa tên viết tắt hoặc loại bỏ ký tự lạ mà không ảnh hưởng đến dữ liệu chính?

4

Cảm ơn bạn đã chia sẻ kinh nghiệm rất hữu ích về Power Query! Mình cũng đang tìm hiểu về nó để xử lý đống dữ liệu văn bản mỗi ngày. Việc tự động hóa khâu làm sạch này quả là tiết kiệm thời gian đáng kể.

Mình có một thắc mắc nhỏ, bạn thường dùng những bước nào trong Power Query để xử lý các trường hợp dữ liệu "lộn xộn" như có ký tự đặc biệt xen kẽ hay định dạng ngày tháng không nhất quán? Chia sẻ thêm chút kinh nghiệm với mọi người nhé!

0

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký