-
Paper Do Agents Know What They Can’t Do? Evaluating Feasibility Awareness in Tool-Using Agents đặt ra một tiêu chí rất thực tế cho AI agent: khi thiếu công cụ cần thiết, agent có biết nhiệm vụ là bất khả thi và dừng sớm không? Đây là vấn đề lớn vì tool-using agent thường tốn nhiều token qua chuỗi suy luận dài, gọi API lặp lại và thử sai nhiều bước. Một ví dụ trong paper cho thấy dừng sớm có thể giảm chi phí hơn 10 lần so với tiếp tục cố làm nhiệm vụ chắc chắn thất bại.…