Ở nhóm paper, EvoDS cho thấy hướng mới của agent khoa học dữ liệu: không chỉ phân tích dữ liệu, mà còn tự tiến hóa kỹ năng và quản lý ngữ cảnh để làm việc tốt hơn qua nhiều nhiệm vụ. SkillPyramid tiếp tục xu hướng self-evolving agent nhưng nhấn mạnh tổ chức kỹ năng theo tầng, tránh các kỹ năng rời rạc khó tái sử dụng. Diagnosing Knowledge Gaps in LLM Tool Use đặt câu hỏi thực tế: AI có thật sự học được API mới, hay chỉ giỏi với công cụ quen thuộc? Trong khi đó, nghiên cứu về terminal agents đi vào chất lượng trajectory: không phải mọi lịch sử tương tác đều hữu ích để huấn luyện agent lập trình.
Ở nhóm nền tảng, Codex được OpenAI mô tả là công cụ năng suất cho cả knowledge workers, với hơn 5 triệu người dùng hằng tuần; nhóm ngoài lập trình chiếm khoảng 20% và đang tăng nhanh hơn 3 lần. GitHub cũng đưa Copilot SDK lên general availability, hỗ trợ 6 ngôn ngữ và cho phép nhúng agent runtime vào công cụ nội bộ hoặc sản phẩm riêng.