Agent phải biết sai ở đâu và khi nào không nên hành động

Ở nhóm paper, HLL đặt vấn đề về “ranh giới cuối của kiểm chứng”: khi agent ngày càng phức tạp, liệu kết quả của nó còn đủ minh bạch để con người đánh giá? Harness-1 đưa search agent vào huấn luyện tăng cường với harness quản lý trạng thái bên ngoài, giúp quá trình tìm kiếm có cấu trúc và dễ kiểm soát hơn. POIROT tiếp cận lỗi trong hệ multi-agent bằng cách “thẩm vấn” chính các agent để phát hiện điểm bất thường. Where Do Deep-Research Agents Go Wrong? đi thẳng vào bài toán rất thực tế: agent nghiên cứu không chỉ sai ở đáp án cuối, mà có thể sai từ từng đoạn trong trajectory. Learning When Not to Act nhấn mạnh một kỹ năng thường bị xem nhẹ: agent giỏi không phải agent gọi công cụ nhiều nhất, mà là agent biết khi nào không nên hành động.

Về nền tảng, OpenAI đưa frontier models và Codex lên AWS, giúp doanh nghiệp dùng Codex trong hạ tầng Bedrock quen thuộc. Anthropic nộp hồ sơ S-1 bí mật, cho thấy cuộc đua AI đang tiến gần thị trường vốn hơn. Google Cloud tiếp tục nhấn mạnh hạ tầng mạng, data center và năng lượng cho kỷ nguyên AI.