RAG là viết tắt của Retrieval-Augmented Generation (Tăng cường tạo Sinh bằng Truy xuất). Đây là một kỹ thuật trong AI kết hợp hai thành phần:
- Retrieval (Truy xuất): Tìm kiếm thông tin liên quan từ nguồn dữ liệu bên ngoài (như cơ sở dữ liệu, tài liệu, website).
- Generation (Tạo sinh): Sử dụng các mô hình ngôn ngữ (LLMs) để tạo ra câu trả lời dựa trên thông tin đã truy xuất.
Ưu điểm RAG:
- Tổ chức, Doanh nghiệp có thể sử dụng dữ liệu nội bộ hoặc chuyên ngành mà không cần huấn luyện lại mô hình LLM, đảm bảo bảo mật và kiểm soát dữ liệu.
- Tự cung cấp thông tin, cập nhật liên tục và chính xác.
- Giảm "ảo giác" (hallucination) - khi AI tạo ra thông tin sai lệch. Bằng cách truy xuất thông tin trực tiếp liên quan đến truy vấn, RAG đảm bảo phản hồi tập trung và chính xác, tránh lạc đề trong các ứng dụng (Chatbot) hỗ trợ khách hàng hoặc tư vấn.
- Có thể trích dẫn nguồn gốc thông tin.
- Dễ dàng cập nhật kiến thức mới cho AI mà không cần huấn luyện lại mô hình.
Lý do cần RAG: Tổ chức, Doanh nghiệp có thể chủ động tận dụng tài liệu nội bộ, FAQs khách hàng hoặc cơ sở kiến thức sẵn có để mở rộng khả năng tư duy AI của mình, mà không phải đầu tư lớn vào việc training LLM. Đảm bảo bảo mật và kiểm soát dữ liệu (số liệu kinh doanh, bí mật công nghệ, quy trình hoạt động đặc thù...).