- AI agent là thực thể phần mềm tự trị, thường được sử dụng để bổ sung cho các mô hình ngôn ngữ lớn (LLM).
- Các LLM gần đây như GPT-4o, Gemini Pro, Claude Opus đã thể hiện khả năng lập luận tiên tiến. Các mô hình mã nguồn mở như Mistral và Llama 3 cũng ngang tầm với các mô hình thương mại.
- AI agent dựa vào LLM để lập luận, đồng thời bổ sung các chức năng mới cho LLM. Có thể coi LLM như kernel và AI agent như các chương trình trong hệ điều hành.
- Các hạn chế của LLM: không có bộ nhớ, xử lý đồng bộ, có thể tạo ra thông tin sai lệch, không truy cập internet, kém toán học, đầu ra không xác định.
- AI agent khắc phục các hạn chế trên bằng cách: duy trì bộ nhớ và ngữ cảnh, xử lý bất đồng bộ và song song, kiểm tra dữ liệu thực tế, tích hợp công cụ toán học, chuẩn hóa định dạng đầu ra, tương tác theo nhân vật.
- Ví dụ: AI agent có thể kết hợp duyệt web, môi trường thực thi code với phân tích của LLM để tạo ra câu trả lời chi tiết.
📌 AI agent đóng vai trò quan trọng trong việc bổ sung khả năng của các mô hình ngôn ngữ lớn bằng cách kết nối chúng với các công cụ và dịch vụ bên ngoài cần thiết để hoàn thành nhiệm vụ, giúp khắc phục nhiều hạn chế vốn có của LLM như thiếu bộ nhớ, xử lý tuần tự, không truy cập dữ liệu thực tế.
https://thenewstack.io/ai-agents-key-concepts-and-how-they-overcome-llm-limitations/