Menu

App script quản lý rủi ro cho cá nhân & doanh nghiệp với báo cáo chuẩn định dạng biểu đồ

Tự động hóa việc tạo danh sách duy nhất từ nhiều cột bằng Python

Đàn Thiêu Nam 10/04/2026 18:55 562 lượt xem 2 trả lời

Chào mọi người,

Dạo này mình đang tập tành dùng Python để xử lý dữ liệu Excel và thấy nó tiện lợi thật sự. Hôm nay mình muốn chia sẻ một mẹo nhỏ mà mình vừa khám phá ra, giúp tự động hóa việc tạo một danh sách duy nhất (unique list) từ nhiều cột khác nhau trong file Excel.

Trước đây, mỗi lần cần làm việc này, mình thường phải copy toàn bộ dữ liệu từ các cột cần lấy, paste vào một cột mới, rồi dùng chức năng Remove Duplicates của Excel. Cách này khá thủ công và tốn thời gian, đặc biệt khi dữ liệu lớn.

Với Python, mình có thể làm điều này chỉ với vài dòng code đơn giản sử dụng thư viện pandas:

import pandas as pd

# Giả sử bạn có file Excel tên 'du_lieu.xlsx'
df = pd.read_excel('du_lieu.xlsx')

# Lấy dữ liệu từ các cột 'Cot1', 'Cot2', 'Cot3'
data_from_columns = pd.concat([df['Cot1'], df['Cot2'], df['Cot3']])

# Tạo danh sách duy nhất
unique_list = data_from_columns.unique()

# Chuyển danh sách duy nhất về DataFrame để lưu vào Excel
unique_df = pd.DataFrame(unique_list, columns=['DanhSachDuyNhat'])

# Lưu kết quả ra file Excel mới

unique_df.to_excel('danh_sach_duy_nhat.xlsx', index=False)

print('Đã tạo xong danh sách duy nhất!')

Cách này giúp tiết kiệm rất nhiều thời gian và đảm bảo tính chính xác. Mọi người có thể tùy chỉnh tên file, tên các cột sao cho phù hợp với file Excel của mình.

Có ai có cách nào hay hơn hoặc muốn thảo luận thêm về việc dùng Python trong Excel không ạ?

2

Hay quá bạn ơi! Mình cũng đang tìm cách để xử lý mấy cái file Excel dữ liệu lộn xộn mà thủ công mãi không xong. Bạn có thể chia sẻ chi tiết hơn đoạn code Python bạn dùng để lấy danh sách duy nhất từ nhiều cột không? Mình đang loay hoay với việc đọc dữ liệu từ file Excel bằng Python.

4

Đúng là Python làm mấy vụ này nhàn tênh ha bạn! Thay vì copy-paste rồi Remove Duplicates thủ công, dùng Python gom lại rồi lấy unique list thì quá nhanh.

Mình cũng hay dùng thư viện pandas cho mấy tác vụ này. Bạn có thể thử cách đọc dữ liệu vào DataFrame rồi dùng .unique() hoặc .drop_duplicates() trên Series sau khi đã gom các cột lại không? Nhìn chung là gọn gàng hơn nhiều.

Nếu bạn gặp khó khăn ở đoạn nào thì cứ chia sẻ thêm nhé, mình cùng xem!

5

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký