Menu

Tự động hóa xử lý chuỗi ký tự phức tạp trong Excel bằng Python

Hoa Mai Bảo 10/06/2026 04:24 326 lượt xem 2 trả lời

Chào mọi người,

Dạo này mình có làm việc nhiều với dữ liệu văn bản trong Excel và nhận thấy các hàm xử lý chuỗi mặc định của Excel đôi khi khá rườm rà, đặc biệt là với các trường hợp phức tạp. Mình tình cờ khám phá ra cách dùng Python trong Excel để giải quyết vấn đề này khá hiệu quả và muốn chia sẻ lại với anh em trong diễn đàn.

Ví dụ, bạn có một cột chứa các mã sản phẩm có định dạng không nhất quán, ví dụ: SP-ABC-123, sp_def_456, Sp-ghi-789. Bạn muốn chuẩn hóa về dạng SP-ABC-123 (viết hoa chữ cái đầu, thay ký tự đặc biệt).

Thay vì dùng hàng loạt hàm SUBSTITUTE, UPPER, REPLACE lồng nhau, mình dùng Python script đơn giản như sau:

import pandas as pd

def normalize_product_code(code):
    code = str(code).upper() # Chuyển về chữ hoa
    code = code.replace('_', '-') # Thay thế ký tự đặc biệt
    # Có thể thêm các xử lý khác ở đây
    return code

df = xl(
                
0
Hay đó bạn! Mình cũng đang "vật lộn" với mấy mớ dữ liệu văn bản mà mấy hàm Excel cũ rích cứ bị lỗi tùm lum. Bạn có thể chia sẻ thêm về cách bạn dùng Python để chuẩn hóa mã sản phẩm không? Mình đặc biệt quan tâm đến việc làm sao để code có thể nhận diện được các định dạng khác nhau (như SP-ABC-123, sp_def_456, Sp-ghi-789) và chuyển về một dạng chuẩn chung. Có dùng thư viện nào đặc biệt không, hay chỉ là các hàm xử lý chuỗi cơ bản của Python thôi? Cảm ơn bạn đã chia sẻ!
0

Hay quá bạn ơi! Mình cũng hay gặp tình huống tương tự, các hàm Excel đôi khi "bó tay" với mấy chuỗi ký tự lằng nhằng. Bạn có thể chia sẻ chi tiết hơn về cách bạn dùng Python để chuẩn hóa các mã sản phẩm đó không? Ví dụ, bạn dùng thư viện nào, và đoạn code xử lý chuỗi như thế nào để nó có thể nhận diện được các định dạng khác nhau (SP-ABC-123, sp_def_456, Sp-ghi-789) và chuyển về một dạng chuẩn chung? Mình tò mò muốn học hỏi thêm.

5

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký