Spaces:

camelfilm
/

palisade

Sleeping

File size: 8,735 Bytes

01661a1

from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain_community.llms import Ollama
from langchain_community.vectorstores import FAISS
from langchain_core.documents import Document
from typing import List, Dict, Any
import os
import time


class VehicleManualRAG:
    """
    차량 매뉴얼 Q&A를 위한 RAG 시스템
    """

    def __init__(self, vector_store: FAISS, use_ollama: bool = True):

        self.vector_store = vector_store

        # LLM 설정
        if use_ollama:
            print("🤖 Ollama 모델 초기화 중...")
            print("   (Ollama가 설치되어 있어야 합니다)")
            print("   설치: https://ollama.ai")

            # Ollama 모델 (한국어 잘하는 모델)
            self.llm = Ollama(
                model="llama3.2:3b",  # 또는 "gemma2:2b", "mistral" 등
                temperature=0.3,  # 낮을수록 일관된 답변
                num_ctx=4096,  # 컨텍스트 윈도우
            )
        else:
            # OpenAI 사용시 (API 키 필요)
            from langchain_openai import ChatOpenAI
            self.llm = ChatOpenAI(
                model="gpt-3.5-turbo",
                temperature=0.3,
                api_key=os.getenv("OPENAI_API_KEY")
            )

        # 프롬프트 템플릿 설정
        self.prompt_template = self._create_prompt_template()

        # RAG 체인 생성
        self.qa_chain = self._create_qa_chain()

    def _create_prompt_template(self) -> PromptTemplate:

        template = """당신은 현대 팰리세이드 차량 전문가입니다.
아래 차량 매뉴얼 내용을 참고하여 질문에 답변해주세요.

매뉴얼 내용:
{context}

질문: {question}

답변 지침:
1. 매뉴얼에 있는 내용만 답변하세요
2. 구체적인 수치나 방법이 있다면 정확히 제시하세요
3. 매뉴얼에 없는 내용이면 "매뉴얼에서 해당 정보를 찾을 수 없습니다"라고 답변하세요
4. 한국어로 친절하고 명확하게 답변하세요

답변:"""

        return PromptTemplate(
            template=template,
            input_variables=["context", "question"]
        )

    def _create_qa_chain(self) -> RetrievalQA:

        # 체인 타입 설정
        chain_type_kwargs = {
            "prompt": self.prompt_template,
            "verbose": False  # True로 하면 중간 과정 출력
        }

        # RetrievalQA 체인 생성
        qa_chain = RetrievalQA.from_chain_type(
            llm=self.llm,
            chain_type="stuff",  # 모든 문서를 한번에 처리
            retriever=self.vector_store.as_retriever(
                search_kwargs={"k": 5}  # 상위 5개 청크 검색
            ),
            chain_type_kwargs=chain_type_kwargs,
            return_source_documents=True  # 출처 문서도 반환
        )

        return qa_chain

    def answer_question(self, question: str) -> Dict[str, Any]:
        """
        질문에 대한 답변 생성

        Args:
            question: 사용자 질문

        Returns:
            답변과 출처 정보를 담은 딕셔너리
        """
        print(f"\n❓ 질문: {question}")
        print("🔍 관련 내용 검색 중...")

        start_time = time.time()

        try:
            # RAG 체인 실행
            result = self.qa_chain.invoke({"query": question})

            elapsed_time = time.time() - start_time

            # 결과 정리
            answer = result.get("result", "답변을 생성할 수 없습니다.")
            source_documents = result.get("source_documents", [])

            # 출처 페이지 추출
            source_pages = []
            for doc in source_documents:
                page = doc.metadata.get("page", "N/A")
                if page not in source_pages and page != "N/A":
                    source_pages.append(page)

            response = {
                "question": question,
                "answer": answer,
                "source_pages": source_pages,
                "response_time": elapsed_time,
                "source_documents": source_documents
            }

            return response

        except Exception as e:
            print(f"❌ 오류 발생: {e}")

            # Ollama가 설치되지 않은 경우 간단한 대체 방법
            print("\n💡 Ollama 없이 간단한 답변 생성 중...")
            return self._simple_answer(question)

    def _simple_answer(self, question: str) -> Dict[str, Any]:
        """
        LLM 없이 간단한 키워드 기반 답변 (대체 방법)
        """
        # 관련 문서 검색
        docs = self.vector_store.similarity_search(question, k=3)

        if not docs:
            return {
                "question": question,
                "answer": "관련 정보를 찾을 수 없습니다.",
                "source_pages": [],
                "response_time": 0,
                "source_documents": []
            }

        # 간단한 규칙 기반 답변 생성
        answer_parts = []
        keywords = {
            "엔진오일": "엔진오일은 5,000km 또는 6개월마다 교체를 권장합니다.",
            "타이어 공기압": "타이어 공기압은 차량 도어 안쪽 라벨을 참조하세요. 일반적으로 32-35 psi입니다.",
            "와이퍼": "와이퍼는 6개월-1년마다 교체를 권장합니다.",
            "브레이크": "브레이크 패드는 주행거리 30,000-50,000km마다 점검이 필요합니다.",
            "배터리": "배터리는 3-5년마다 교체를 권장합니다."
        }

        # 키워드 매칭
        for keyword, info in keywords.items():
            if keyword in question:
                answer_parts.append(info)
                break

        # 검색된 내용 추가
        answer_parts.append("\n\n관련 매뉴얼 내용:")
        for i, doc in enumerate(docs[:2], 1):
            content = doc.page_content[:200]
            page = doc.metadata.get("page", "N/A")
            answer_parts.append(f"\n{i}. (페이지 {page}) {content}...")

        return {
            "question": question,
            "answer": "\n".join(answer_parts),
            "source_pages": [doc.metadata.get("page", "N/A") for doc in docs],
            "response_time": 0.1,
            "source_documents": docs
        }

    def batch_questions(self, questions: List[str]) -> List[Dict[str, Any]]:
        """
        여러 질문을 한번에 처리
        """
        results = []
        for question in questions:
            result = self.answer_question(question)
            results.append(result)
            print(f"\n✅ 답변: {result['answer'][:200]}...")
            print(f"📄 출처: 페이지 {', '.join(map(str, result['source_pages']))}")
            print(f"⏱️ 응답시간: {result['response_time']:.2f}초")
            print("-" * 50)

        return results


# 테스트 코드
if __name__ == "__main__":
    """
    사용 예시 및 테스트
    """
    from embeddings import VehicleManualEmbeddings
    import os

    # 경로 설정
    current_dir = os.path.dirname(os.path.abspath(__file__))
    project_root = os.path.dirname(current_dir)
    index_path = os.path.join(project_root, "data", "faiss_index")

    print("=" * 60)
    print("🚗 차량 매뉴얼 RAG Q&A 시스템")
    print("=" * 60)

    # 1. 벡터 저장소 로드
    print("\n1️⃣ 벡터 인덱스 로딩...")
    embedder = VehicleManualEmbeddings()
    vector_store = embedder.load_index()

    # 2. RAG 시스템 초기화
    print("\n2️⃣ RAG 시스템 초기화...")
    rag = VehicleManualRAG(vector_store, use_ollama=False)  # Ollama 없이 테스트

    # 3. 테스트 질문들
    print("\n3️⃣ Q&A 테스트 시작")
    print("=" * 60)

    test_questions = [
        "엔진오일 교체 주기는 얼마나 되나요?",
        "타이어 적정 공기압은 얼마인가요?",
        "와이퍼를 어떻게 교체하나요?",
        "브레이크 패드는 언제 교체해야 하나요?",
        "경고등이 켜졌을 때 어떻게 해야 하나요?"
    ]

    # 질문 처리
    results = rag.batch_questions(test_questions[:3])  # 처음 3개만

    # 4. 결과 요약
    print("\n" + "=" * 60)
    print("📊 테스트 결과 요약")
    print("=" * 60)

    for result in results:
        print(f"\nQ: {result['question']}")
        print(f"A: {result['answer'][:100]}...")
        print(f"출처: {len(result['source_pages'])}개 페이지")

    print("\n✅ RAG 시스템 테스트 완료!")
    print("💡 Tip: Ollama를 설치하면 더 정확한 답변을 얻을 수 있습니다.")
    print("   설치: https://ollama.ai")