Quay lại trang chủ

📖 Knowledge Base là gì?

💡

Định nghĩa

Knowledge Base cho phép bạn upload tài liệu (PDF, TXT, DOCX, CSV) lên Google AI Studio, sau đó VietBot sẽ đọc và trả lời câu hỏi dựa trên nội dung tài liệu. Khác với Google Search (tìm kiếm internet), Knowledge Base là tìm kiếm trong tài liệu riêng của bạn.

🚫 Không có Knowledge Base

  • Hỏi "Điều khoản hợp đồng nói gì?" → Bot không biết
  • Hỏi "Báo cáo tài chính Q1?" → Bot trả lời chung chung
  • Hỏi "Quy định công ty?" → Không có thông tin
  • Dữ liệu nội bộ không thể truy vấn

✅ Có Knowledge Base

  • Hỏi "Điều khoản hợp đồng nói gì?" → Đọc đúng file hợp đồng
  • Hỏi "Báo cáo tài chính Q1?" → Tìm đúng file báo cáo
  • Hỏi "Quy định công ty?" → Tra cứu tài liệu nội bộ
  • Truy vấn dữ liệu riêng tư, nội bộ được

Tính năng

Upload

Upload trực tiếp

Upload file PDF, TXT, DOCX, CSV lên Google AI Studio ngay trong Web Manager — không cần tay.

Sync

Đồng bộ tự động

Sync danh sách file từ Google AI Studio về DB. Bot đọc file metadata từ DB — nhanh, không cần list mỗi lần.

Per-Agent

Theo từng Agent

Mỗi Agent có danh sách file riêng. Không chia sẻ knowledge base giữa các Agent.

Auto-trigger

Tự động tra cứu

Bot tự nhận biết khi nào câu hỏi liên quan đến tài liệu và tự động tra cứu nội dung.

Context-aware

Giữ nguyên Context

Sau khi trả lời từ KB, bot vẫn giữ context để tiếp tục hội thoại tự nhiên.

Cache

Cache thông minh

Document list cache 5 phút, file info cache 10 phút. Trả lời nhanh, giảm API calls.

📂 Định dạng file hỗ trợ

PDF

PDF

Hỗ trợ đầy đủ PDF text-based. PDF scanned (hình ảnh) cần OCR trước.

TXT

Text

File text thuần — txt, md, văn bản không định dạng.

DOCX

Word Document

Microsoft Word (.docx) — văn bản, bảng biểu, danh sách.

CSV

CSV

Dữ liệu bảng tính — báo cáo, danh sách, thống kê.

⚠️

Giới hạn

Dung lượng tối đa mỗi file: 100MB. Google AI Studio free tier có giới hạn số lượng và dung lượng file. Kiểm tra quota tại aiStudio.google.com.

🔑 Cấu hình Knowledge Base

1

Vào Model Config

Đăng nhập web.vietbot.vn → Chọn Agent → Mở tab LLM Model.

2

Nhập Google API Key

Nhập API Key trong Plugin Information → Bấm Lưu. API key phải có quyền truy cập Google AI Studio.

3

Mở Knowledge Base Dialog

Click nút 📚 Cơ sở tri thức bên cạnh nút Chỉnh sửa chức năng → Hộp thoại KB mở ra.

4

Sync + Upload

Bấm Sync để tải danh sách file hiện có. Click Upload để thêm tài liệu mới.

5

Kích hoạt Tool

Đảm bảo google_documentation được bật trong Chỉnh sửa chức năng.

KB-Only Mode

🎯

Chế độ chỉ dùng Knowledge Base

Bật KB-Only Mode trong Agent Config để bot CHỈ sử dụng Knowledge Base — tất cả tool khác (Google Search, RAGFlow, v.v.) bị tắt. Bot bắt buộc phải trả lời từ tài liệu đã upload. Không còn treo hay không trả lời được.

# KB-Only Mode: Tool filtering All Tools Available: ├── google_documentation ← ĐƯỢC GIỮ LẠI ├── google_search ← BỊ TẮT ├── retrieve_uploaded_file ← BỊ TẮT ├── home_assistant ← BỊ TẮT └── ...others ← BỊ TẮT # Kết quả: Bot chỉ có 1 tool để trả lời mọi câu hỏi # → Không còn treo/timeout → Luôn trả lời được

📡 Luồng xử lý

# Luồng Knowledge Base Retrieval User: "Điều khoản bảo hành trong hợp đồng nói gì?" │ ▼ # 1. Bot nhận câu hỏi → trigger google_documentation Tool: google_documentation Args: { file_keyword: "hợp đồng", user_question: "điều khoản bảo hành" } │ ▼ # 2. Lấy document list từ DB (cache 5 phút) GET /knowledge/documents/{agent_id} → [{file_name, file_id, file_uri, mime_type}, ...] │ ▼ # 3. Tìm file phù hợp → kiểm tra file (cache 10 phút) genai.files.get(name=file_id) → { state: "ACTIVE", uri: "...", mime_type: "application/pdf" } │ ▼ # 4. Đọc nội dung file + câu hỏi → Gemini generate generate_content(contents=[file_uri, user_question]) │ ▼ # 5. Trả lời user bằng giọng nói Bot: "Theo điều khoản bảo hành trong hợp đồng, sản phẩm được bảo hành trong vòng 12 tháng..." # ⏱️ Thời gian: ~3-10 giây (lần đầu chậm hơn do cache miss)
← Quay lại trang chủ Mở Web Manager →