1. Định nghĩa RAG (Retrieval Augmented Generation - Tạo sinh tăng cường truy xuất):
- RAG là một kỹ thuật để cải thiện hiệu suất của các mô hình ngôn ngữ lớn (LLM) bằng cách cung cấp cho chúng quyền truy cập vào các nguồn dữ liệu bên ngoài.
- Thay vì chỉ dựa vào kiến thức đã được huấn luyện trước đó, RAG cho phép LLM "tra cứu" thông tin liên quan từ các tài liệu, cơ sở dữ liệu hoặc website để đưa ra câu trả lời chính xác và đầy đủ hơn.
- RAG kết hợp khả năng tạo văn bản tự nhiên của LLM với khả năng truy xuất thông tin từ các nguồn bên ngoài.
2. Cách thức hoạt động của RAG:
RAG hoạt động theo ba bước chính:
- Bước 1: Truy vấn (Question) Nhận câu hỏi hoặc yêu cầu từ người dùng.
- Bước 2: Truy xuất (Retrieval):
- Sử dụng câu hỏi để tìm kiếm các tài liệu liên quan trong một kho dữ liệu bên ngoài (ví dụ: tài liệu công ty, website, cơ sở dữ liệu).
- Các kỹ thuật tìm kiếm có thể bao gồm tìm kiếm theo từ khóa, tìm kiếm ngữ nghĩa hoặc sử dụng các mô hình nhúng (embedding models) để tìm các tài liệu có ý nghĩa tương tự với câu hỏi.
- Bước 3: Tạo sinh (Generation):
- Kết hợp thông tin đã truy xuất được với câu hỏi ban đầu để tạo ra một "prompt" mới.
- Sử dụng LLM để tạo ra câu trả lời dựa trên prompt mới này.
- Câu trả lời sẽ chính xác hơn và đầy đủ hơn vì nó được hỗ trợ bởi thông tin từ các nguồn bên ngoài.
(Tổng hợp)