Chào mọi người,
Dạo này mình đang tìm hiểu về Python trong Excel và có một vấn đề muốn nhờ mọi người tư vấn ạ.
Công việc của mình đôi khi cần lấy dữ liệu từ các trang web (ví dụ: bảng giá, tin tức) và cập nhật vào file Excel để phân tích. Mình biết là có thể dùng Power Query để làm điều này, nhưng mình muốn thử sức với Python xem sao, vì muốn tích hợp nó vào một quy trình xử lý dữ liệu tự động lớn hơn.
Hiện tại mình mới chỉ làm quen được với việc đọc/ghi file Excel bằng pandas thôi. Mình đang phân vân không biết nên bắt đầu từ đâu để lấy dữ liệu web về Excel bằng Python. Liệu có thư viện nào chuyên dụng cho việc này không, hay mình cần kết hợp pandas với các thư viện web scraping như BeautifulSoup hoặc Scrapy?
Cụ thể hơn, mình muốn lấy bảng dữ liệu từ một trang web cụ thể, sau đó xử lý sơ bộ (ví dụ: loại bỏ cột không cần thiết, định dạng lại ngày tháng) rồi ghi đè hoặc thêm vào một sheet nhất định trong file Excel có sẵn.
Có anh em nào đã từng làm qua việc này chưa? Xin chia sẻ kinh nghiệm hoặc gợi ý về các bước thực hiện, cũng như các thư viện phù hợp với Python trong Excel được không ạ?
Em xin cảm ơn!