MagenticLite: khi agent mạnh không nhất thiết cần mô hình khổng lồ

Microsoft Research giới thiệu MagenticLite, MagenticBrain và Fara1.5 như một hướng tiếp cận mới cho AI agent: thay vì chỉ phóng to mô hình, hãy đồng thiết kế mô hình nhỏ, công cụ, harness và giao diện giám sát thành một hệ thống thống nhất. MagenticLite là ứng dụng agentic làm việc xuyên suốt giữa trình duyệt và hệ thống file cục bộ; điểm quan trọng là dữ liệu có thể chạy trên máy người dùng và hướng tới agent hoạt động trực tiếp trên phần cứng cá nhân.

Bộ ba này chia vai rõ ràng. MagenticBrain là mô hình điều phối 14B tham số, được fine-tune từ Qwen 3 14B, đảm nhiệm lập kế hoạch, viết code, dùng terminal và phân quyền cho agent phụ. Fara1.5 là họ mô hình computer-use gồm 4B, 9B và 27B, trong đó bản 9B được khuyến nghị cho phần lớn tác vụ. Trên benchmark Online-Mind2Web gồm 300 tác vụ web, Fara1.5 đạt SOTA trong nhóm mô hình nhỏ, gần như gấp đôi Fara-7B; bản 27B vượt mức 90% hiệu năng.

Điểm tinh tế nhất không nằm ở từng model, mà ở harness. Hệ thống lập kế hoạch từng bước, quản lý ngữ cảnh chủ động, tóm tắt và cắt bớt thông tin dư, rồi giao tác vụ trình duyệt cho Fara1.5 khi cần. Các điểm rủi ro như đăng nhập, thanh toán, gửi form hoặc hành động không thể đảo ngược vẫn yêu cầu người dùng phê duyệt. Toàn bộ browser session và code execution chạy trong Quicksand, một wrapper mã nguồn mở cho sandbox dựa trên QEMU.

Tương lai AI agent không chỉ là “mô hình lớn hơn”, mà là hệ thống nhỏ hơn nhưng được điều phối tốt hơn, an toàn hơn và gần workflow thật hơn.