-
Ở nhóm paper, AOHP cho thấy agent cấp hệ điều hành cần harness mở, cá nhân hóa, hiệu quả và an toàn. Điều này quan trọng vì agent càng gần máy cá nhân thì rủi ro quyền truy cập càng lớn. Managing Procedural Memory và Plans Don’t Persist đi vào lõi kỹ thuật của agent dài hạn: agent không chỉ cần nhớ dữ kiện, mà phải giữ được quy trình, kế hoạch và ngữ cảnh qua nhiều bước. Litmus bổ sung hướng đánh giá mới: mô tả metric bằng code, giảm phụ thuộc vào nhãn thủ công. Ở nhóm…