• Paper Beyond Helpfulness: A Teaching-over-Solving Diagnostic for Measuring Educational Impact in LLM Tutors đặt ra một câu hỏi rất đúng với giáo dục AI: một mô hình giải bài giỏi có đồng nghĩa với dạy học tốt không? Câu trả lời của nhóm tác giả là không đủ. Trong lớp học, đưa đáp án đúng quá nhanh có thể làm học sinh hoàn thành nhiệm vụ, nhưng lại làm mất cơ hội tự suy luận. Paper không tạo benchmark mới, mà phân tích lại hai nguồn công khai: MathTutorBench leaderboard và TutorBench sample. Với MathTutorBench, nhóm tác giả tách…