Ở nhóm paper, MobileGym nổi bật vì xây môi trường mô phỏng để huấn luyện và đánh giá mobile GUI agent — tức AI có thể thao tác app điện thoại qua giao diện, được chấm bằng trạng thái JSON và rollout song song chi phí thấp. Claw-Anything mở rộng câu hỏi này sang trợ lý cá nhân “always-on”, nơi AI có thể truy cập nhiều phần trong đời sống số của người dùng; càng hữu ích thì càng cần kiểm soát quyền chặt hơn. AgentHijack kiểm tra computer-use agent trong môi trường bị lỗi, với 9 loại corruption, nhấn mạnh rằng agent phải bền vững trước tình huống đời thường, không chỉ trước tấn công ác ý.
Trong lập trình, CODESKILL tiếp tục xu hướng agent tự học kỹ năng code, cho thấy mô hình mạnh chưa đủ; AI cần “sổ tay thao tác” và kỹ năng có thể tiến hóa. Paper về Detecting Unfaithful Chain-of-Thought đặt vấn đề sâu hơn: lời giải thích của AI nghe hợp lý, nhưng có thật sự phản ánh quá trình suy luận bên trong không?
Ở nhóm nền tảng và thủ thuật, Codex có Goal mode, Appshots và browser annotation, giúp lập trình viên đặt mục tiêu, tiêu chí thành công và sửa UI trực quan hơn. Anthropic giới thiệu Natural Language Autoencoders, biến activation bên trong mô hình thành mô tả ngôn ngữ tự nhiên để kiểm tra động cơ ẩn và rủi ro an toàn.