Agent bắt đầu tự xây agent

Ở nhóm paper, MIRAGE tiếp tục hướng mobile agent, nhưng bổ sung implicit reasoning và generative world model để AI dự đoán môi trường trước khi hành động. Scaling Self-Evolving Agents via Parametric Memory mở rộng ý tưởng agent tự tiến hóa bằng bộ nhớ có tham số, thay vì chỉ dựa vào prompt hay skill text. Đặc biệt, The Meta-Agent Challenge đặt câu hỏi rất mạnh: agent hiện nay có thể tự phát triển agent khác không? Đây là bước gần hơn tới hệ sinh thái AI tự thiết kế công cụ cho chính mình.

Ở nhóm an toàn, AICompanionBench tập trung vào việc đánh giá LLM-as-judge cho AI companion. Khi chatbot đồng hành ngày càng gần đời sống cá nhân, vấn đề không chỉ là trả lời hay, mà là đánh giá đúng rủi ro cảm xúc, phụ thuộc và thao túng.

Về nền tảng, Microsoft đẩy mạnh Agent Framework tích hợp GitHub Copilot SDK, giúp xây agent có khả năng đọc/sửa file, chạy shell, fetch URL và gọi MCP. Google Cloud hướng dẫn triển khai agent bằng ADK trên GKE Autopilot với Workload Identity để kiểm soát quyền. Azure SQL cũng đưa Copilot vào thiết kế schema, nhưng vẫn giữ cơ chế duyệt từng thay đổi.