• Ở nhóm paper, MobileGym nổi bật vì xây môi trường mô phỏng để huấn luyện và đánh giá mobile GUI agent — tức AI có thể thao tác app điện thoại qua giao diện, được chấm bằng trạng thái JSON và rollout song song chi phí thấp. Claw-Anything mở rộng câu hỏi này sang trợ lý cá nhân “always-on”, nơi AI có thể truy cập nhiều phần trong đời sống số của người dùng; càng hữu ích thì càng cần kiểm soát quyền chặt hơn. AgentHijack kiểm tra computer-use agent trong môi trường bị lỗi, với 9 loại corruption,…