HUST RAG - Hệ thống Hỏi đáp Quy chế Sinh viên
Hệ thống RAG hỗ trợ sinh viên tra cứu quy chế, quy định tại Đại học Bách khoa Hà Nội.
Tính năng
- Hybrid Search (Vector + BM25)
- Reranking với Qwen3-Reranker
- Small-to-Big Retrieval cho bảng biểu
- Giao diện chat Gradio
Cài đặt
Yêu cầu: Python 3.10+
Ubuntu/Debian cần cài thêm:
sudo apt update sudo apt install python3-venv
Bước 1: Chạy setup script
- Linux/Mac:
bash setup.sh - Windows: nhấp đúp
setup.bathoặc gõsetup.battrong cmd
Script sẽ: tạo venv → cài dependencies → tải data → tạo .env
Bước 2: Cấu hình API keys
Sửa file .env:
SILICONFLOW_API_KEY=your_key # Embedding & Reranking GROQ_API_KEY=your_key # LLM Generation
Lấy API keys tại: SiliconFlow | Groq
Bước 3: Chạy ứng dụng
source venv/bin/activate # Linux/Mac venv\Scripts\activate # Windows
python scripts/run_app.py
Truy cập: http://127.0.0.1:7860
Data
Data trên HuggingFace: hungnha/do_an_tot_nghiep
Tải thủ công: huggingface-cli download hungnha/do_an_tot_nghiep --repo-type dataset --local-dir ./data