Chào các bạn trong diễn đàn Sheet & Excel,
Dạo gần đây mình có mày mò thử Python trong Excel và thấy nó mở ra nhiều khả năng mới cho việc xử lý dữ liệu mà trước đây khá tốn công sức. Mình muốn chia sẻ một vài script nhỏ mà mình thấy hữu ích, hy vọng có thể giúp ích cho các bạn mới bắt đầu hoặc đang tìm kiếm giải pháp tự động hóa.
1. Làm sạch dữ liệu tự động:
Mình thường xuyên phải xử lý các file excel có dữ liệu 'lộn xộn', ví dụ như các ký tự lạ, khoảng trắng thừa, hoặc định dạng không nhất quán. Với Python, việc này trở nên đơn giản hơn rất nhiều.
Ví dụ, để loại bỏ khoảng trắng thừa ở đầu và cuối chuỗi trong một cột:
import pandas as pd
df = xl(