Agent 24/7, video thông minh và suy luận tiết kiệm hơn

Ở nhóm nghiên cứu, BetaPRM đề xuất reward model theo từng bước suy luận, đồng thời ước lượng độ tin cậy của phần thưởng; khi kết hợp Adaptive Computation Allocation, hệ thống giảm tới 33.57% token so với Best-of-16. AutoResearchClaw mở hướng AI hỗ trợ nghiên cứu tự động, nơi agent không chỉ tìm tài liệu mà còn tự củng cố quy trình làm nghiên cứu. Aurora biến chỉnh sửa video thành tác vụ của VLM agent dùng công cụ: AI hiểu yêu cầu mơ hồ, lập kế hoạch, rồi điều khiển video diffusion để sửa video. Formal Skill nhấn mạnh agent cần các kỹ năng runtime có thể lập trình và kiểm soát, thay vì chỉ dựa vào prompt. Trong khi đó, Pseudocode-Guided Reasoning cho thấy mã giả có thể giúp mô hình thị giác-ngôn ngữ suy luận có cấu trúc hơn.

Ở nhóm nền tảng, Google là tâm điểm sau I/O 2026 với Gemini 3.5 Flash, được giới thiệu là nhanh gấp 4× theo output tokens/giây và có thể tiết kiệm hơn 1 tỷ USD/năm nếu doanh nghiệp chuyển phần lớn workload sang Flash. Gemini Spark mở hướng agent cá nhân chạy 24/7 trên cloud. Gemini Omni Flash đưa tạo video đa đầu vào vào Gemini app, Flow và YouTube Shorts; Google cũng cho biết SynthID đã watermark hơn 100 tỷ ảnh/video và 60.000 năm audio. Ngoài Google, OpenAI mở applied AI lab đầu tiên ngoài Mỹ tại Singapore, còn Meta điều chuyển hơn 7.000 nhân viên sang các nhóm AI mới.