-
Paper Conformal Certification of Reasoning Trace Prefixes đặt ra một vấn đề rất tinh tế: khi AI suy luận sai, thường không phải toàn bộ chuỗi suy luận đều sai. Nhiều bước đầu có thể đúng, rồi lỗi xuất hiện ở một điểm nào đó và kéo đáp án cuối đi lệch. Cách đánh giá truyền thống thường chỉ chấp nhận hoặc loại bỏ toàn bộ câu trả lời, nên hoặc quá mạo hiểm, hoặc lãng phí phần suy luận còn dùng được. Nhóm tác giả đề xuất CROP – Conformal Reasoning Output Prefixes. Ý tưởng là thay vì…