AI agent làm đúng việc, đúng lúc, ít lãng phí hơn

Ở nhóm paper, Meta-Cognitive Memory Policy Optimization tập trung vào bộ nhớ dài hạn của agent. Vấn đề không còn là nhớ càng nhiều càng tốt, mà là biết nên nhớ gì, quên gì và dùng ký ức nào cho nhiệm vụ dài hạn. Redundant or Necessary? đi vào một lỗi phổ biến hơn: agent thường tạo ra nhiều bước thừa trong trajectory, gây tốn token, thời gian và rủi ro sai lệch. SAAS tiếp tục cùng hướng này khi xử lý tình trạng over-search — AI tìm kiếm quá mức dù đã đủ thông tin. Thông điệp rất thực tế: agent giỏi không chỉ biết tìm, mà còn biết dừng.

Ở hướng khoa học, Physics Is All You Need? và ProjectionBench cho thấy AI đang được kiểm tra trong môi trường nghiên cứu nghiêm túc hơn: phát triển phần mềm khoa học dưới giám sát chuyên gia và tạo giả thuyết khi dữ liệu được hé lộ dần.

Về nền tảng, Claude Opus 4.8 nổi bật với coding, agentic tasks và dynamic workflows, cho phép Claude Code chạy nhiều subagent song song. Microsoft Research cũng giới thiệu Data Formulator 0.7, nhấn mạnh phân tích dữ liệu bằng AI trong doanh nghiệp.