| STT | Thuật ngữ tiếng Anh | Dịch tiếng Việt dễ hiểu | Giải thích ngắn |
|---|---|---|---|
| 1 | Artificial Intelligence / AI | Trí tuệ nhân tạo | Công nghệ giúp máy tính thực hiện các nhiệm vụ thường cần trí thông minh con người. |
| 2 | AGI / Artificial General Intelligence | Trí tuệ nhân tạo tổng quát | AI có khả năng học và xử lý nhiều lĩnh vực như con người, hiện vẫn là mục tiêu nghiên cứu. |
| 3 | LLM / Large Language Model | Mô hình ngôn ngữ lớn | Mô hình AI được huấn luyện trên lượng dữ liệu văn bản rất lớn để hiểu và sinh ngôn ngữ. |
| 4 | Neural Network | Mạng nơ-ron nhân tạo | Mô hình tính toán lấy cảm hứng từ não bộ, gồm nhiều “nơ-ron” xử lý tín hiệu. |
| 5 | Deep Learning | Học sâu | Nhánh của AI dùng mạng nơ-ron nhiều lớp để học đặc trưng phức tạp từ dữ liệu. |
| 6 | Weights | Trọng số | Các giá trị bên trong mô hình, quyết định cách AI xử lý đầu vào và tạo đầu ra. |
| 7 | Training | Huấn luyện | Quá trình cho AI học từ dữ liệu để điều chỉnh trọng số. |
| 8 | Inference | Suy luận / chạy mô hình | Giai đoạn AI dùng kiến thức đã học để trả lời câu hỏi hoặc tạo kết quả mới. |
| 9 | Token | Đơn vị mã hóa văn bản | Một mẩu văn bản nhỏ mà AI dùng để xử lý ngôn ngữ, có thể là từ, phần của từ hoặc ký tự. |
| 10 | Token Throughput | Tốc độ xử lý token | Số lượng token mô hình có thể xử lý hoặc sinh ra trong một khoảng thời gian. |
| 11 | Memory Cache | Bộ nhớ đệm | Vùng lưu tạm thông tin để AI xử lý nhanh hơn, giảm tính toán lặp lại. |
| 12 | Compute | Năng lực tính toán | Tài nguyên phần cứng như GPU, chip AI, điện năng và máy chủ dùng để chạy hoặc huấn luyện AI. |
| 13 | Parallelization | Xử lý song song | Chia công việc thành nhiều phần để nhiều chip hoặc luồng xử lý cùng lúc. |
| 14 | API Endpoint | Điểm truy cập API | Địa chỉ hoặc cổng dịch vụ để phần mềm gửi yêu cầu đến hệ thống AI. |
| 15 | AI Agent | Tác nhân AI | AI có thể lập kế hoạch, dùng công cụ và thực hiện nhiều bước để hoàn thành nhiệm vụ. |
| 16 | Coding Agent | Tác nhân AI lập trình | AI agent chuyên đọc, viết, sửa, kiểm thử và hỗ trợ quản lý mã nguồn. |
| 17 | Chain of Thought | Chuỗi suy nghĩ / lập luận từng bước | Cách mô hình giải quyết vấn đề qua nhiều bước trung gian. |
| 18 | Fine-tuning | Tinh chỉnh mô hình | Huấn luyện thêm một mô hình có sẵn trên dữ liệu chuyên biệt để phù hợp nhiệm vụ cụ thể. |
| 19 | Transfer Learning | Học chuyển giao | Dùng kiến thức mô hình đã học ở một nhiệm vụ để áp dụng sang nhiệm vụ khác. |
| 20 | Distillation | Chưng cất mô hình | Tạo mô hình nhỏ hơn học theo mô hình lớn hơn để giảm chi phí nhưng vẫn giữ năng lực tốt. |
| 21 | Reinforcement Learning | Học tăng cường | Cách huấn luyện AI bằng phần thưởng và hình phạt để chọn hành động tốt hơn. |
| 22 | GAN / Generative Adversarial Network | Mạng sinh đối kháng | Hệ thống gồm hai mô hình cạnh tranh: một bên tạo dữ liệu giả, một bên phân biệt thật – giả. |
| 23 | Diffusion Model | Mô hình khuếch tán | Mô hình tạo ảnh/video bằng cách học khử nhiễu dần dần từ dữ liệu hỗn loạn. |
| 24 | Hallucination | Ảo giác AI / bịa thông tin | Hiện tượng AI tạo ra thông tin nghe có vẻ đúng nhưng thực tế sai hoặc không có căn cứ. |
AI đang tạo ra một “ngôn ngữ mới” với hàng loạt thuật ngữ như LLM, RAG, RLHF, hallucination, token hay AI agent. Bài tổng hợp của TechCrunch giải thích các khái niệm này theo hướng phổ thông, giúp người đọc hiểu AI không chỉ là chatbot, mà là cả một hệ sinh thái gồm mô hình, dữ liệu, phần cứng, kỹ thuật huấn luyện và cơ chế triển khai.
Nhóm thuật ngữ nền tảng gồm AI, AGI, LLM, neural network, deep learning, weights và training. Có thể hiểu đơn giản: mô hình AI học từ dữ liệu trong quá trình training, điều chỉnh các weights để nhận ra quy luật, rồi dùng neural network và deep learning để xử lý tác vụ phức tạp. LLM là loại mô hình ngôn ngữ lớn đứng sau các công cụ như ChatGPT, Claude, Gemini, Copilot hay Llama.
Nhóm thuật ngữ vận hành gồm inference, token, token throughput, memory cache, compute, parallelization và API endpoints. Đây là phần giải thích vì sao AI tốn nhiều chip, điện, RAM và tiền: mỗi câu hỏi của người dùng được chia thành token, xử lý bằng phần cứng mạnh, rồi tối ưu bằng cache và xử lý song song để trả lời nhanh hơn.
Nhóm thuật ngữ ứng dụng và rủi ro gồm AI agent, coding agent, chain of thought, fine-tuning, transfer learning, distillation, reinforcement learning, GAN, diffusion, hallucination, open source và validation loss. Đây là các khái niệm giúp hiểu vì sao AI có thể viết code, tạo ảnh, suy luận nhiều bước, học chuyên sâu cho từng ngành, nhưng vẫn có thể bịa thông tin hoặc học lệch nếu đánh giá không đúng.