Ở nhóm nghiên cứu, LongLive-2.0 của NVIDIA tập trung vào tạo video dài hiệu quả hơn, dùng NVFP4 và KV cache lượng tử hóa để tăng tốc 2.15× khi training, 1.84× khi inference, đạt 45.7 FPS với mô hình 5B. PUMA đặt vấn đề ngược lại với xu hướng “nghĩ càng dài càng tốt”: mô hình nên dừng khi suy luận đã hội tụ, giúp giảm trung bình 26.2% token mà vẫn giữ chất lượng. Paper về Knowing–Doing Gap cho thấy AI agent có thể biết cần dùng công cụ nhưng không gọi công cụ, với độ lệch tới 26.5–54.0% ở bài toán số học và 30.8–41.8% ở hỏi đáp sự kiện. StableVLA cải thiện robot vision-language-action khi gặp nhiễu ảnh, tăng khoảng 30% so với baseline, chỉ thêm dưới 10M tham số. Multi-Agent TDD nhấn mạnh AI lập trình không chỉ cần “chạy được”, mà phải có kiểm thử để giao nộp được.

Ở nhóm nền tảng, Google và Blackstone gây chú ý với liên doanh AI cloud: đầu tư ban đầu 5 tỷ USD, hướng tới 500 MW data center. Google I/O 2026 trở thành tâm điểm cho Gemini, Android và Search. Anthropic ra 10 agent template cho tài chính, đồng thời hợp tác Gates Foundation 200 triệu USD cho y tế, giáo dục và kinh tế. Ngoài ra, Vatican chuẩn bị văn kiện về nhân phẩm và AI.

Posted in