Spaces:

maeshay
/

GodSaveMoney

Sleeping

File size: 3,460 Bytes

aab927d
 
 
3e4fdb2
aab927d
3e4fdb2
aab927d
 
73dadd8
 
aab927d
 
 
 
73dadd8
aab927d
 
3e4fdb2
aab927d
 
 
 
3e4fdb2
e617f3b
 
 
aab927d
73dadd8
aab927d
 
 
 
 
3e4fdb2
aab927d
73dadd8
aab927d
ccfdf30
 
acbb25a
ccfdf30
 
 
5f703f9
 
3e4fdb2
5f703f9
3e4fdb2
ccfdf30
 
 
aab927d
ccfdf30
 
 
aab927d
 
73dadd8
 
 
 
 
aab927d
73dadd8
aab927d
 
 
 
 
 
 
 
0372ddf
aab927d
0372ddf
 
 
 
aab927d
0372ddf

import re

# 생성된 모든 봇 응답 기록
def generate_reply(ctx, makePipeLine, user_msg):
    # 최초 응답
    response = generate_valid_response(ctx, makePipeLine, user_msg)
    ctx.addHistory("bot", response)

    # 불안정한 응답이 유도되므로 사용하지 않음
    '''
    # 응답이 끊겼다면 추가 생성
    if is_truncated_response(response):
        continuation = generate_valid_response(ctx, makePipeLine, response)
        ctx.addHistory("bot", continuation)
    '''

# 봇 응답 1회 생성
def generate_valid_response(ctx, makePipeline, user_msg) -> str:
    user_name = ctx.getUserName()
    bot_name = ctx.getBotName()

    while True:
        prompt = build_prompt(ctx.getHistory(), user_msg, user_name, bot_name)
        print("\n==========[DEBUG: Prompt]==========")
        print(prompt)
        print("===================================\n")
        full_text = makePipeline.character_chat(prompt)
        response = extract_response(full_text)
        if is_valid_response(response, user_name, bot_name):
            break
    return clean_response(response, bot_name)

# 입력 프롬프트 정리
def build_prompt(history, user_msg, user_name, bot_name):
    with open("assets/prompt/init.txt", "r", encoding="utf-8") as f:
        system_prompt = f.read().strip()

    # 최근 대화 히스토리를 일반 텍스트로 재구성
    dialogue = ""
    for turn in history[-16:]:
        role = user_name if turn["role"] == "user" else bot_name
        dialogue += f"{role}: {turn['text']}\n"

    #유저 입력을 중복적용하므로 삭제
    '''
    dialogue += f"{user_name}: {user_msg}\n"
    '''

    # 모델에 맞는 포맷 구성
    prompt = f"""### Instruction:
{system_prompt}

{dialogue}
### Response:
{bot_name}:"""
    return prompt

# 출력에서 응답 추출 (HyperCLOVAX 포맷에 맞게)
def extract_response(full_text):
    # '### Response:' 이후 텍스트 추출
    if "### Response:" in full_text:
        reply = full_text.split("### Response:")[-1].strip()
    else:
        reply = full_text.strip()
    return reply

# 응답 유효성 검사
def is_valid_response(text: str, user_name, bot_name) -> bool:
    if user_name + ":" in text:
        return False
    return True

# 출력 정제
def clean_response(text: str, bot_name):
    # bot_name 제거
    text = re.sub(rf"{bot_name}:\s*", "", text).strip()
    # 미완성 문장 제거
    return clean_truncated_response(text)

# 미완성 문장 삭제
def clean_truncated_response(text: str) -> str:
    """
    응답 텍스트가 미완성된 문장으로 끝나면 마지막 문장을 제거하여 반환,
    그렇지 않으면 원문 그대로 반환.
    """

    # 문장 분리 ('.', '?', '!', '~' 등 기준 + 줄바꿈 포함)
    sentence_end_pattern = r"(?<=[\.?!~])\s|\n"
    segments = re.split(sentence_end_pattern, text.strip())

    if not segments:
        return text.strip()

    cleaned = []
    for s in segments:
        s = s.strip()
        if not s:
            continue
        # 문장 부호로 끝나는 경우만 포함
        if re.search(r"[.?!~…\u2026\u2639\u263A\u2764\uD83D\uDE0A\uD83D\uDE22]$", s):
            cleaned.append(s)
        else:
            break  # 불완전한 문장이므로 이후 모두 제거

    # 만약 모든 문장이 끝맺음을 잘 했다면 → 원문 반환
    result = " ".join(cleaned)
    return result if result != "" else text.strip()