Spaces:

james666600
/

mytest

Running

james666600 commited on Apr 29

Commit

cb95a71

verified ·

1 Parent(s): e3ac475

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,16 +1,28 @@
 import gradio as gr
-from transformers import pipeline
-# 直接加载 Hugging Face 模型
-classifier = pipeline("text-classification", model="bert-base-uncased")
-def predict(text):
-    return classifier(text)
 demo = gr.Interface(
-    fn=predict,
-    inputs=gr.Textbox(label="输入文本"),
-    outputs=gr.Label(label="分类结果"),
-    title="BERT 文本分类演示",
 )
 demo.launch()

 import gradio as gr
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import torch
+# 加载 Qwen3-0.6B 模型和 tokenizer
+model_name = "Qwen/Qwen3-0.6B"
+tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    torch_dtype=torch.float16,  # 半精度减少显存占用
+    device_map="auto",          # 自动选择 GPU
+    trust_remote_code=True      # 信任远程代码（Qwen 需要）
+)
+def generate_text(prompt):
+    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
+    outputs = model.generate(**inputs, max_new_tokens=100)
+    return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# 创建 Gradio 界面
 demo = gr.Interface(
+    fn=generate_text,
+    inputs=gr.Textbox(lines=3, placeholder="输入你的问题..."),
+    outputs=gr.Textbox(label="Qwen3-0.6B 的回答"),
+    title="Qwen3-0.6B 演示 (Free GPU)",
 )
 demo.launch()