Spaces:

kudui
/

dream-s1k-demo

Paused

App Files Files Community

况兑 commited on Oct 7, 2025

Commit

b4c6154

1 Parent(s): a769d64

stabilize: cache to /data + bool attn_mask + minimal app

Browse files

Files changed (3) hide show

README.md +1 -1
app_min.py +68 -0
requirements.txt +4 -3

README.md CHANGED Viewed

@@ -5,7 +5,7 @@ colorFrom: gray
 colorTo: purple
 sdk: gradio
 sdk_version: 5.49.0
-app_file: loss_probe.py
 pinned: false
 license: mit
 ---

 colorTo: purple
 sdk: gradio
 sdk_version: 5.49.0
+app_file: app_min.py
 pinned: false
 license: mit
 ---

app_min.py ADDED Viewed

	@@ -0,0 +1,68 @@

+import os, torch, gradio as gr
+from transformers import AutoModel, AutoTokenizer
+# 持久化缓存到 /data
+BASE = "/data"
+os.makedirs(BASE, exist_ok=True)
+os.environ.setdefault("HF_HOME", f"{BASE}/hf_home")
+os.environ.setdefault("HF_HUB_CACHE", f"{BASE}/hf_home/hub")
+os.environ.setdefault("TRANSFORMERS_CACHE", f"{BASE}/hf_home/transformers")
+os.environ.setdefault("XDG_CACHE_HOME", f"{BASE}/hf_home")
+MODEL_ID = os.getenv("MODEL_ID", "Dream-org/Dream-v0-Instruct-7B")
+REV = os.getenv("REV", None)
+print(f"[INFO] Using MODEL_ID={MODEL_ID} REV={REV or '(latest)'}")
+dtype  = torch.bfloat16 if torch.cuda.is_available() else torch.float32
+device = "cuda" if torch.cuda.is_available() else "cpu"
+print("[INFO] Loading tokenizer...")
+tok = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True, revision=REV)
+print("[INFO] Loading model...")
+model = AutoModel.from_pretrained(
+    MODEL_ID, trust_remote_code=True, torch_dtype=dtype, revision=REV
+).to(device).eval()
+def quick_infer(q: str):
+    if not q.strip(): return ""
+    messages = [{"role": "user", "content": q}]
+    enc = tok.apply_chat_template(messages, return_tensors="pt", return_dict=True, add_generation_prompt=True)
+    input_ids = enc.input_ids.to(device)
+    attention_mask = enc.attention_mask.to(device).bool()  # 关键：转成 bool
+    with torch.no_grad():
+        out = model.diffusion_generate(
+            input_ids,
+            attention_mask=attention_mask,
+            max_new_tokens=64,
+            steps=64,
+            temperature=0.0,
+            return_dict_in_generate=True,
+        )
+    text = tok.decode(out.sequences[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
+    return text
+def self_check():
+    try:
+        msgs = [{"role":"system","content":"只输出一个数字"},{"role":"user","content":"Compute: 1+1"}]
+        enc = tok.apply_chat_template(msgs, return_tensors="pt", return_dict=True, add_generation_prompt=False)
+        _ = model(input_ids=enc["input_ids"].to(device), attention_mask=enc["attention_mask"].to(device).bool())
+        return "OK: forward() 可用（Dream 未必提供 labels->loss，属正常）"
+    except Exception as e:
+        return f"ERR: {repr(e)}"
+with gr.Blocks() as demo:
+    gr.Markdown("## Dream Minimal App  \n- 先点 Self-check  \n- 再试一次推理")
+    with gr.Row():
+        btn = gr.Button("Self-check")
+        out = gr.Textbox(label="Result")
+    btn.click(fn=self_check, inputs=None, outputs=out)
+    with gr.Row():
+        q = gr.Textbox(label="Prompt", value="Compute: 1+1")
+        a = gr.Textbox(label="Output")
+        go = gr.Button("Generate")
+    go.click(fn=quick_infer, inputs=q, outputs=a)
+if __name__ == "__main__":
+    demo.launch()

requirements.txt CHANGED Viewed

@@ -1,6 +1,7 @@
-gradio>=4.44.0
 transformers==4.46.2
 accelerate>=1.0.0
-bitsandbytes>=0.43.1
 huggingface_hub>=0.25.0
-torch>=2.4.0

 transformers==4.46.2
+torch==2.5.1
+gradio==5.49.0
 accelerate>=1.0.0
 huggingface_hub>=0.25.0
+httpx[socks]
+socksio