Từ model nhanh hơn đến agent biết điều phối tri thức

Ở nhóm paper, Agents-K1 nhấn mạnh rằng agent tương lai không chỉ cần truy xuất thông tin kiểu RAG, mà phải biết điều phối tri thức theo nhiệm vụ: lấy gì, dùng khi nào, kết hợp ra sao. EurekAgent đặt trọng tâm vào môi trường/harness cho khám phá khoa học tự động, cho thấy muốn AI làm khoa học không chỉ cần model mạnh mà cần không gian thí nghiệm đúng. AgentBeats tiếp tục xu hướng chuẩn hóa đánh giá agent, hướng tới openness, reproducibility và quy trình chấm có thể tái lập. Trong sinh học tính toán, EpiBench đưa agent vào phân tích epigenomics với yêu cầu kết quả phải kiểm chứng được. Reward Modeling for Multi-Agent Orchestration đi vào bài toán điều phối nhiều agent: agent nào làm việc gì, khi nào giao, khi nào dừng.

Các paper gồm Regulating the AI Tutor, Predicting LLM Math Tutor Quality from Four Conversation Signals, Beyond the AI Tutor và CogGen cho thấy AI trong giáo dục đang chuyển từ chatbot trả lời câu hỏi sang hệ thống dạy học có cấu trúc: biết gợi mở Socratic, theo dõi quá trình học, đo chất lượng hội thoại và hỗ trợ tự điều chỉnh học tập.

Ở nhóm nền tảng, Google giới thiệu DiffusionGemma, mô hình text diffusion 26B MoE, có thể sinh văn bản theo block song song và đạt tối đa 4× faster text generation trên GPU. OpenAI nêu case Nextdoor với hơn 110 triệu người dùng ở 11 quốc gia, dùng Codex để hỗ trợ engineering end-to-end. GitHub chuẩn bị npm v12 nhằm siết bảo mật supply-chain.