Menu

Tự động cập nhật dữ liệu từ Web về Excel bằng Power Query - Kinh nghiệm hay!

Thẩm Quang Hân 06/06/2026 08:14 443 lượt xem 3 trả lời

Chào mọi người,

Dạo này công việc của mình có liên quan đến việc lấy dữ liệu từ các trang web tin tức về để phân tích. Trước đây mình toàn copy-paste thủ công, mất thời gian mà dễ sai sót. Từ ngày biết đến Power Query, mọi thứ nhẹ nhàng hơn hẳn.

Mình muốn chia sẻ với mọi người cách mình dùng Power Query để tự động cập nhật dữ liệu từ web về Excel. Cách này cực kỳ hữu ích khi bạn cần theo dõi các thông tin thay đổi liên tục trên mạng.

Các bước cơ bản mình thường làm:

  • Mở Power Query Editor (Data > Get Data > From Other Sources > From Web).
  • Nhập URL của trang web bạn muốn lấy dữ liệu.
  • Power Query sẽ hiển thị các bảng có thể lấy được. Chọn bảng phù hợp.
  • Tiến hành làm sạch và định hình dữ liệu (transform) theo ý muốn: loại bỏ cột thừa, đổi tên cột, chuyển đổi kiểu dữ liệu, lọc bỏ dòng không cần thiết...
  • Sau khi hoàn tất, nhấn 'Close & Load To...' để đưa dữ liệu vào Excel.

Điểm hay nhất là sau này, mỗi khi dữ liệu trên web thay đổi, bạn chỉ cần vào Excel, chọn bảng dữ liệu và nhấn Refresh All (hoặc chuột phải vào bảng chọn Refresh), dữ liệu sẽ tự động cập nhật mà không cần làm lại từ đầu.

Tuy nhiên, có một vài lưu ý nhỏ:

  • Không phải trang web nào cũng lấy dữ liệu được dễ dàng, một số trang có cấu trúc phức tạp hoặc yêu cầu đăng nhập sẽ khó hơn.
  • Cần chú ý đến cấu trúc của trang web. Nếu trang web thay đổi cấu trúc, bạn có thể cần chỉnh sửa lại các bước trong Power Query.

Có bạn nào đã áp dụng cách này chưa? Chia sẻ thêm kinh nghiệm hoặc những khó khăn gặp phải để mọi người cùng học hỏi nhé!

2

Hay quá bạn ơi! Mình cũng đang rất quan tâm đến việc lấy dữ liệu tự động từ web về Excel. Trước giờ toàn làm thủ công nên cũng tốn kha khá thời gian. Bạn có thể chia sẻ thêm về các bước chi tiết hơn một chút không? Ví dụ như làm sao để "chọn đúng bảng" dữ liệu trên web, hoặc xử lý các trường hợp trang web có nhiều bảng dữ liệu khác nhau ạ?

Cảm ơn bạn đã chia sẻ kinh nghiệm quý báu này!

0

Cảm ơn bạn đã chia sẻ kinh nghiệm rất hữu ích này! Mình cũng đang mày mò với Power Query để lấy dữ liệu từ web, quả thực là tiết kiệm thời gian đáng kể so với cách làm thủ công.

Đúng như bạn nói, việc "chọn đúng bảng" đôi khi cũng hơi "cân não", nhất là với những trang web có cấu trúc hơi lộn xộn. Mình cũng hay dùng cách xem trước danh sách bảng mà Power Query gợi ý. Tuy nhiên, có lần mình gặp trang web mà dữ liệu nằm rải rác trong các thẻ HTML, không hẳn là một "bảng" rõ ràng. Lúc đó, mình thử "lục lọi" trong phần "Document" và dùng các bước "Transform" như bạn nói, cũng "vớt vát" được phần nào.

Bạn có mẹo nào hay hơn để xử lý trường hợp dữ liệu không nằm gọn trong các bảng rõ ràng trên web không? Chia sẻ thêm cho anh em học hỏi với nhé!

0

Mình cũng từng tốn nhiều thời gian với việc copy-paste dữ liệu từ web lắm bạn ạ. Từ khi "kết thân" với Power Query thì đúng là nhẹ gánh hẳn!

Về việc "chọn đúng bảng" trên web, bạn có thể thử các cách sau:

  • Khi mở Power Query Editor, bạn sẽ thấy danh sách các bảng (Tables) mà nó nhận diện được từ trang web. Thường thì nó sẽ hiển thị tên của các bảng đó. Bạn cứ click vào từng bảng để xem trước nội dung, cái nào đúng thì mình chọn thôi.
  • Nếu trang web đó có cấu trúc phức tạp, đôi khi Power Query không nhận diện được đúng bảng bạn cần. Lúc này, bạn có thể thử chọn "Document" (hoặc "Page") rồi dùng các bước "Transform" như "Extract Table" hoặc "Remove Other Columns" để lọc ra phần dữ liệu mình muốn.

Thường thì trang web tin tức khá "sạch", dữ liệu được đóng gói trong các thẻ HTML dễ nhận diện. Tuy nhiên, nếu gặp trang khó nhằn hơn, có thể bạn sẽ cần thêm một chút "mẹo" về cấu trúc HTML hoặc dùng các biểu thức M nâng cao hơn một chút.

Bạn thử xem sao nhé, có gì khó khăn cứ hỏi tiếp nha!

4

Bạn cần đăng nhập để trả lời chủ đề này.

Đăng nhập Đăng ký