Chào các bạn,
Mình thường xuyên phải làm việc với các file dữ liệu mà thông tin bị gom chung vào một ô, ngăn cách bởi nhiều loại dấu khác nhau như dấu phẩy, dấu chấm phẩy, gạch ngang, thậm chí cả ký tự đặc biệt. Việc này rất khó khăn khi muốn phân tích hay sử dụng dữ liệu đó.
Gần đây, mình có tìm hiểu và áp dụng một cách khá hiệu quả để xử lý loại dữ liệu này, đặc biệt là khi dấu phân cách không đồng nhất. Thay vì dùng Text to Columns với các tùy chọn cố định, mình thường kết hợp chức năng Find and Replace để chuẩn hóa dấu phân cách trước, sau đó mới dùng Text to Columns.
Ví dụ, nếu dữ liệu của bạn có dạng:
Tên_sản_phẩm;Mã_sp,Giá-SLBạn có thể thực hiện các bước sau:
- Bước 1: Chọn vùng dữ liệu cần xử lý.
- Bước 2: Nhấn
Ctrl + Hđể mở hộp thoại Find and Replace. - Bước 3: Trong ô Find what, nhập các dấu phân cách bạn muốn thay thế (ví dụ:
;,,,-). - Bước 4: Trong ô Replace with, nhập một dấu phân cách chuẩn mà bạn muốn dùng (ví dụ: dấu phẩy
,). - Bước 5: Nhấn Replace All.
- Bước 6: Bây giờ, tất cả các dấu phân cách đã được chuẩn hóa thành một loại. Bạn có thể dùng Text to Columns (tab Data) và chọn Delimited, sau đó chọn dấu phân cách bạn vừa chuẩn hóa (ví dụ: Comma) để tách dữ liệu thành các cột.
Cách này giúp mình tiết kiệm rất nhiều thời gian so với việc xử lý thủ công từng ô. Có bạn nào có cách nào khác hay hơn hoặc gặp trường hợp phức tạp hơn không, chia sẻ cùng mọi người nhé!