Chào mọi người,
Dạo này công việc của mình có liên quan đến việc lấy dữ liệu từ các trang web tin tức về để phân tích. Trước đây mình toàn copy-paste thủ công, mất thời gian mà dễ sai sót. Từ ngày biết đến Power Query, mọi thứ nhẹ nhàng hơn hẳn.
Mình muốn chia sẻ với mọi người cách mình dùng Power Query để tự động cập nhật dữ liệu từ web về Excel. Cách này cực kỳ hữu ích khi bạn cần theo dõi các thông tin thay đổi liên tục trên mạng.
Các bước cơ bản mình thường làm:
- Mở Power Query Editor (Data > Get Data > From Other Sources > From Web).
- Nhập URL của trang web bạn muốn lấy dữ liệu.
- Power Query sẽ hiển thị các bảng có thể lấy được. Chọn bảng phù hợp.
- Tiến hành làm sạch và định hình dữ liệu (transform) theo ý muốn: loại bỏ cột thừa, đổi tên cột, chuyển đổi kiểu dữ liệu, lọc bỏ dòng không cần thiết...
- Sau khi hoàn tất, nhấn 'Close & Load To...' để đưa dữ liệu vào Excel.
Điểm hay nhất là sau này, mỗi khi dữ liệu trên web thay đổi, bạn chỉ cần vào Excel, chọn bảng dữ liệu và nhấn Refresh All (hoặc chuột phải vào bảng chọn Refresh), dữ liệu sẽ tự động cập nhật mà không cần làm lại từ đầu.
Tuy nhiên, có một vài lưu ý nhỏ:
- Không phải trang web nào cũng lấy dữ liệu được dễ dàng, một số trang có cấu trúc phức tạp hoặc yêu cầu đăng nhập sẽ khó hơn.
- Cần chú ý đến cấu trúc của trang web. Nếu trang web thay đổi cấu trúc, bạn có thể cần chỉnh sửa lại các bước trong Power Query.
Có bạn nào đã áp dụng cách này chưa? Chia sẻ thêm kinh nghiệm hoặc những khó khăn gặp phải để mọi người cùng học hỏi nhé!