-
Ở nhóm paper, PreAct đặt mục tiêu rất thực tế cho computer-use agents: khi gặp lại tác vụ quen thuộc, agent không nên suy luận lại từ đầu mà phải tận dụng kinh nghiệm để thao tác nhanh hơn. StepGuard tiếp tục nhấn mạnh rủi ro trong web navigation: chỉ một bước click sai có thể làm hỏng toàn bộ workflow, nên agent cần hiệu chuẩn từng bước. ProvenanceGuard đưa vấn đề factuality vào bối cảnh MCP: khi agent dùng dữ liệu và tool bên ngoài, mỗi kết luận cần truy vết được nguồn, thời điểm và bằng chứng.…