Chào các bạn trong diễn đàn Sheet & Excel,
Dạo này mình làm việc với nhiều file dữ liệu đầu vào từ các nguồn khác nhau, chủ yếu là văn bản. Việc làm sạch và chuẩn hóa dữ liệu này tốn rất nhiều thời gian và công sức. Mình đã thử qua nhiều cách nhưng chỉ đến khi khám phá sâu hơn về Power Query, mọi thứ mới thực sự trở nên nhẹ nhàng.
Mình muốn chia sẻ một vài kinh nghiệm nhỏ về cách Power Query giúp mình tự động hóa việc làm sạch dữ liệu văn bản, ví dụ như:
- Loại bỏ các khoảng trắng thừa ở đầu, cuối hoặc giữa các ký tự.
- Chuẩn hóa định dạng chữ (viết hoa, viết thường).
- Tách hoặc kết hợp các cột văn bản dựa trên dấu phân cách hoặc vị trí.
- Thay thế các giá trị không mong muốn.
Thay vì phải dùng các hàm text phức tạp như TRIM, CLEAN, SUBSTITUTE, LEFT, RIGHT, MID... lồng nhau, Power Query cung cấp giao diện trực quan và các bước xử lý rõ ràng. Bạn chỉ cần chọn cột, chọn thao tác mong muốn, và Power Query sẽ ghi lại các bước đó. Lần sau, chỉ cần làm mới dữ liệu là mọi thứ sẽ được xử lý tự động.
Ví dụ, để loại bỏ khoảng trắng thừa, mình chỉ cần vào tab Transform, chọn Format -> Trim. Rất đơn giản!
Mình thấy Power Query thực sự là một công cụ mạnh mẽ, đặc biệt hữu ích cho các tác vụ lặp đi lặp lại với dữ liệu văn bản. Có bạn nào đã ứng dụng Power Query vào công việc của mình chưa? Chia sẻ thêm kinh nghiệm hoặc các mẹo hay về Power Query cho mọi người cùng học hỏi nhé!