Ở nhóm paper, StreamMemBench đặt trọng tâm vào memory trong bối cảnh streaming: agent không chỉ nhớ quá khứ, mà phải dùng ký ức để hỗ trợ việc sắp tới. GitOfThoughts đưa ý tưởng rất mạnh: reasoning và memory của agent có thể tổ chức giống Git, cho phép replay, diff và merge. Điều này biến “suy nghĩ” của agent từ dòng chat khó kiểm soát thành artifact có thể xem lại. HarnessX tiếp tục nhấn mạnh vai trò của harness: agent mạnh không chỉ nhờ model, mà nhờ khung vận hành biết ghép công cụ, thích nghi và tiến hóa. SkillAudit đi vào kiểm toán kỹ năng agent, còn Minim nhấn mạnh quyền riêng tư: agent chỉ nên thấy phần dữ liệu tối thiểu cần thiết, không phải toàn bộ đời sống số của người dùng.
Ở nhóm nền tảng, OpenAI công bố kế hoạch mua Ona để mở rộng Codex bằng môi trường cloud an toàn, bền vững và do khách hàng kiểm soát. Codex hiện có hơn 5 triệu người dùng mỗi tuần, tăng 400% từ đầu năm; Ona từng hỗ trợ 2 triệu developer làm việc trong cloud environment. Google đưa agent vào Looker dashboard, giúp hỏi dữ liệu bằng ngôn ngữ tự nhiên ngay trong dashboard. Anthropic cũng retire các model Claude Sonnet 4 và Opus 4 cũ từ 15/6/2026.
AI agent tương lai cần workspace ổn định, memory kiểm toán được, harness mạnh và quyền truy cập dữ liệu tối thiểu.