Trí nhớ agent, kiểm chứng code và thước đo AI xanh

SkillOpt đặt trọng tâm vào agent tự tiến hóa kỹ năng. Thay vì chỉ làm theo lệnh, agent cần biết chọn, điều chỉnh và tối ưu chiến lược hành động qua thời gian. Đây là hướng quan trọng nếu muốn AI không chỉ “trả lời tốt”, mà còn làm việc dài hạn tốt hơn.

SPACENUM kiểm tra khả năng hiểu số lượng và quan hệ không gian của mô hình thị giác-ngôn ngữ. Chủ đề này rất thực tế: AI có thể mô tả ảnh trôi chảy, nhưng chưa chắc hiểu đúng “bao nhiêu vật”, “vật nào ở đâu”, hay “cái gì gần cái gì”.

Trong lập trình, Agentic Proving for Program Verification mở hướng kết hợp AI agent với chứng minh hình thức. Thông điệp rất rõ: AI lập trình tương lai không chỉ viết code chạy được, mà phải hỗ trợ kiểm chứng code đúng.

MemAudit chạm vào rủi ro mới của AI có trí nhớ: bộ nhớ agent có thể bị đầu độc. Paper đề xuất kiểm toán hậu nghiệm để phát hiện ký ức độc hại hoặc bất thường, rất gần với bảo mật AI cá nhân hóa.

Cuối cùng, Energy per Successful Goal đề xuất đo chi phí AI theo năng lượng trên mỗi mục tiêu hoàn thành, thay vì chỉ nhìn token hay tốc độ. Khi agent chạy dài hạn, đây có thể trở thành thước đo quan trọng cho AI bền vững.

AI không chỉ xoay quanh mô hình lớn hơn, mà tập trung vào agent biết học, biết nhớ an toàn, biết chứng minh và biết tiêu thụ tài nguyên hợp lý.