update prompts and words

Files changed (5) hide show

config/hotwords.json CHANGED Viewed

@@ -5,8 +5,23 @@
     "GO SAME": "GOSIM",
     "go same": "GOSIM",
     "GoSync": "GOSIM",
     "CSN": "CSDN",
     "CSDF": "CSDN",
     "CSTN": "CSDN",
-    "OpenAZI": "Open AGI"
 }

     "GO SAME": "GOSIM",
     "go same": "GOSIM",
     "GoSync": "GOSIM",
+    "Go Son": "GOSIM",
     "CSN": "CSDN",
     "CSDF": "CSDN",
     "CSTN": "CSDN",
+    "OpenAZI": "Open AGI",
+    "CSdn": "CSDN",
+    "DeepSeq": "DeepSeek",
+    "deep sig": "DeepSeek",
+    "deep sick": "DeepSeek",
+    "chat GBT": "ChatGPT",
+    "Deep sike": "DeepSeek",
+    "Deep sink": "DeepSeek",
+    "它跟face": "huggingface",
+    "拉么index": "LlamaIndex",
+    "lama index": "LlamaIndex",
+    "rug": "RAG",
+    "defive": "Dify",
+    "define": "Dify",
+    "open minus":"open manus"
 }

config/hotwords.txt CHANGED Viewed

@@ -32,3 +32,6 @@ MoXIN
 Function
 Func
 Lava

 Function
 Func
 Lava
+C++
+阿里
+pipeline

config/keywords.txt CHANGED Viewed

@@ -1,4 +1,8 @@
 OpenAGI
 GOSIM
 Rust
-LLaMA Factory

 OpenAGI
 GOSIM
 Rust
+LLaMA Factory
+OPENGL
+GPU
+Web3
+DeepSeek

config/prompt.py CHANGED Viewed

@@ -34,16 +34,23 @@ LLM_SYS_7B_PROMPT_EN = """
 """.format(keywords_mapping_string=keywords_mapping_string)
 LLM_SYS_7B_PROMPT_ZH = """
-你是一个中英文翻译专家，请将以下文本从中文翻译成英文，但保留所有英文专业术语、产品名称、代码片段和专有名词的原始英文形式。遇到英文专业术语或需要保留的内容时，请使用原始英文表达，不要翻译。
-翻译规则：
-1. 保留以下内容的原始英文形式，不翻译：
-   - 技术术语和专业词汇
-   - 产品名称、品牌名称
-   - 代码片段、函数名、变量名
-   - 专有名词、缩写和首字母缩略词
-2. 翻译其余内容时，请确保：
-   - 保持原文的段落结构
-   - 翻译内容符合中文表达习惯
-   - 保持专业性和准确性
-如遇到难以判断是否需要保留英文的情况，请优先保留原始英文形式。
 文本："""

 """.format(keywords_mapping_string=keywords_mapping_string)
 LLM_SYS_7B_PROMPT_ZH = """
+你是一位中英文翻译专家。请将以下中文文本翻译成英文，遵循以下要求：
+翻译要求：
+- 保留原文英文内容：以下内容请保持原始英文形式，不进行翻译或改写：
+- 技术术语与专业词汇
+- 产品名称、品牌名称
+- 代码片段、函数名、变量名
+- 专有名词、缩写、首字母缩略词（如 API、NLP、RAG 等）
+- 翻译符合英文表达习惯，流畅自然，不生硬直译。
+- 保持专业性与准确性，清晰传达原意。
+- 如遇原文表达模糊或逻辑不清的情况，允许适度调整语序或措辞，以增强英文表述的清晰度和逻辑性。
+注意：
+若难以确定某个词汇是否需要翻译，请优先保留原始英文形式。
+不需添加额外解释或注释，仅翻译正文内容。
 文本："""
+LLM_SYS_PROMPT_EN = LLM_SYS_7B_PROMPT_EN
+LLM_SYS_PROMPT_ZH =LLM_SYS_7B_PROMPT_ZH

config/settings.py CHANGED Viewed

@@ -60,8 +60,8 @@ WHISPER_MODEL_EN = 'large-v3-turbo-q5_0'
 WHISPER_MODEL_ZH = 'large-v3-turbo-q5_0'
 # LLM
 LLM_MODEL_PATH = (MODEL_DIR / "qwen2.5-1.5b-instruct-q5_0.gguf").as_posix()
-# LLM_LARGE_MODEL_PATH = (MODEL_DIR / "qwen2.5-1.5b-instruct-q5_0.gguf").as_posix()
-LLM_LARGE_MODEL_PATH = (MODEL_DIR / "qwen2.5-7b-instruct-q5_0-00001-of-00002.gguf").as_posix()
 # VAD
 VAD_MODEL_PATH = (MODEL_DIR / "silero-vad" / "silero_vad.onnx").as_posix()

 WHISPER_MODEL_ZH = 'large-v3-turbo-q5_0'
 # LLM
 LLM_MODEL_PATH = (MODEL_DIR / "qwen2.5-1.5b-instruct-q5_0.gguf").as_posix()
+LLM_LARGE_MODEL_PATH = (MODEL_DIR / "qwen2.5-1.5b-instruct-q5_0.gguf").as_posix()
+# LLM_LARGE_MODEL_PATH = (MODEL_DIR / "qwen2.5-7b-instruct-q5_0-00001-of-00002.gguf").as_posix()
 # VAD
 VAD_MODEL_PATH = (MODEL_DIR / "silero-vad" / "silero_vad.onnx").as_posix()