-
Paper Diagnosing Knowledge Gaps in LLM Tool Use đánh vào một điểm rất thực tế của AI lập trình: model có thể biết Python, nhưng khi gặp API mới chưa có trong dữ liệu huấn luyện, nó thường không chỉ thiếu tên hàm, mà thiếu cả đường dẫn import, tham số, kiểu dữ liệu, hành vi ngữ nghĩa và cách dùng trong chương trình thật. Đóng góp chính là NOVELAPIBENCH, một benchmark động, tự động phát hiện API mới theo từng base model và thư viện mục tiêu, trích xuất “knowledge bundle”, sinh task có test harness chạy được,…