-
Ở nhóm paper, Meta-Cognitive Memory Policy Optimization tập trung vào bộ nhớ dài hạn của agent. Vấn đề không còn là nhớ càng nhiều càng tốt, mà là biết nên nhớ gì, quên gì và dùng ký ức nào cho nhiệm vụ dài hạn. Redundant or Necessary? đi vào một lỗi phổ biến hơn: agent thường tạo ra nhiều bước thừa trong trajectory, gây tốn token, thời gian và rủi ro sai lệch. SAAS tiếp tục cùng hướng này khi xử lý tình trạng over-search — AI tìm kiếm quá mức dù đã đủ thông tin. Thông điệp rất…