Spaces:

phanerozoic
/

SchoolSpiritAI

Paused

App Files Files Community

phanerozoic commited on Apr 18

Commit

318dc96

verified ·

1 Parent(s): 5d9986a

Update app.py

Browse files

Files changed (1) hide show

app.py +71 -40

app.py CHANGED Viewed

@@ -1,43 +1,58 @@
 """
 SchoolSpirit AI – Granite‑3.3‑2B chatbot  (Gradio 4.3, messages API)
-Logs every step; caches model & logs on /data.
 """
 import os, re, time, datetime, traceback
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from transformers.utils import logging as hf_logging
-# ── persistent cache & log file ────────────────────────────────────────────
-os.environ["HF_HOME"] = "/data/.huggingface"
-LOG_FILE = "/data/requests.log"
-def log(msg: str):
     ts = datetime.datetime.utcnow().strftime("%H:%M:%S.%f")[:-3]
     line = f"[{ts}] {msg}"
     print(line, flush=True)
-    try:
         with open(LOG_FILE, "a") as f:
             f.write(line + "\n")
     except FileNotFoundError:
         pass
-# ── config ────────────────────────────────────────────────────────────────
-MODEL_ID, MAX_TURNS, MAX_TOKENS, MAX_INPUT_CH = (
-    "ibm-granite/granite-3.3-2b-instruct",
-    4,
-    64,
-    300,
-)
 SYSTEM_MSG = (
-    "You are SchoolSpirit AI, the upbeat mascot for a company that installs "
-    "on‑prem AI chatbots in schools. Keep answers short, friendly, and safe."
 )
-# ── load model ────────────────────────────────────────────────────────────
 hf_logging.set_verbosity_error()
 try:
-    log("Loading model …")
     tok = AutoTokenizer.from_pretrained(MODEL_ID)
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_ID, device_map="auto", torch_dtype="auto"
@@ -48,62 +63,78 @@ try:
         tokenizer=tok,
         max_new_tokens=MAX_TOKENS,
         do_sample=True,
-        temperature=0.6,
     )
     MODEL_ERR = None
     log("Model loaded ✔")
-except Exception as exc:  # noqa
     MODEL_ERR, gen = f"Model load error: {exc}", None
     log(MODEL_ERR)
-# ── helpers ─────────────────────────────────��─────────────────────────────
-clean = lambda t: re.sub(r"\s+", " ", t.strip()) or "…"
-trim  = lambda m: m if len(m) <= 1 + MAX_TURNS * 2 else [m[0]] + m[-MAX_TURNS * 2 :]
-# ── chat function ─────────────────────────────────────────────────────────
-def chat_fn(user_msg: str, history):
     log(f"User sent {len(user_msg)} chars")
     if not history or history[0]["role"] != "system":
         history = [{"role": "system", "content": SYSTEM_MSG}]
     if MODEL_ERR:
         return MODEL_ERR
     user_msg = clean(user_msg or "")
     if not user_msg:
         return "Please type something."
     if len(user_msg) > MAX_INPUT_CH:
         return f"Message too long (>{MAX_INPUT_CH} chars)."
     history.append({"role": "user", "content": user_msg})
-    history = trim(history)
-    prompt_lines = [
-        m["content"] if m["role"] == "system"
-        else f"{'User' if m['role']=='user' else 'AI'}: {m['content']}"
-        for m in history
-    ] + ["AI:"]
     prompt = "\n".join(prompt_lines)
-    log(f"Prompt {len(prompt)} chars → generating")
     t0 = time.time()
     try:
-        raw = gen(prompt)[0]["generated_text"]
         reply = clean(raw.split("AI:", 1)[-1])
-        # truncate at next tag if model starts writing a new turn
-        reply = re.split(r"\n(User:|AI:)", reply, 1)[0].strip()
-        log(f"generate() {time.time() - t0:.2f}s, reply {len(reply)} chars")
-    except Exception:
         log("❌ Inference exception:\n" + traceback.format_exc())
-        reply = "Sorry—backend crashed. Please try again later."
     return reply
-# ── UI ─────────────────────────────────────────────────────────────────────
 gr.ChatInterface(
     fn=chat_fn,
     chatbot=gr.Chatbot(height=480, type="messages"),
     title="SchoolSpirit AI Chat",
-    theme=gr.themes.Soft(primary_hue="blue"),
-    type="messages",
 ).launch()

 """
 SchoolSpirit AI – Granite‑3.3‑2B chatbot  (Gradio 4.3, messages API)
+────────────────────────────────────────────────────────────────────
+• Persistent HF cache:  HF_HOME=/data/.huggingface  (25 GB tier)
+• Persistent request log:  /data/requests.log
+• Detailed system prompt (brand + guardrails)
+• Traces every request:  Received → Prompt → generate() timing
+• Cleans replies & removes any stray “User:” / “AI:” echoes
 """
+# ──────────────────── standard libraries ───────────────────────────────────
+from __future__ import annotations
 import os, re, time, datetime, traceback
+# ───── gradio + hf transformers ────────────────────────────────────────────
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from transformers.utils import logging as hf_logging
+# ──────────────────── persistent disk paths ────────────────────────────────
+os.environ["HF_HOME"] = "/data/.huggingface"            # model / tokenizer cache
+LOG_FILE = "/data/requests.log"                         # simple persistent log
+def log(msg: str) -> None:
+    """Print + append to /data/requests.log with UTC timestamp."""
     ts = datetime.datetime.utcnow().strftime("%H:%M:%S.%f")[:-3]
     line = f"[{ts}] {msg}"
     print(line, flush=True)
+    try:                                                   # ignore first‑run errors
         with open(LOG_FILE, "a") as f:
             f.write(line + "\n")
     except FileNotFoundError:
         pass
+# ──────────────────── chatbot configuration ────────────────────────────────
+MODEL_ID     = "ibm-granite/granite-3.3-2b-instruct"   # 2 B params, Apache‑2
+MAX_TURNS    = 6          # keep last N user/assistant pairs
+MAX_TOKENS   = 128        # reply length (raise if you have patience)
+MAX_INPUT_CH = 400        # user message length guard
 SYSTEM_MSG = (
+    "You are **SchoolSpirit AI**, the friendly digital mascot for a company "
+    "that provides on‑prem AI chat mascots, fine‑tuning services, and turnkey "
+    "GPU hardware for schools.\n\n"
+    "• Keep answers concise, upbeat, and age‑appropriate (K‑12).\n"
+    "• If you are unsure, say so and suggest contacting a human staff member.\n"
+    "• Never request personal data beyond an email if the user volunteers it.\n"
+    "• Do **not** provide medical, legal, or financial advice.\n"
+    "• No politics, mature content, or profanity.\n"
+    "Respond in a friendly, encouraging tone—as a helpful school mascot!"
 )
+# ──────────────────── load model & pipeline ────────────────────────────────
 hf_logging.set_verbosity_error()
 try:
+    log("Loading tokenizer & model …")
     tok = AutoTokenizer.from_pretrained(MODEL_ID)
     model = AutoModelForCausalLM.from_pretrained(
         MODEL_ID, device_map="auto", torch_dtype="auto"
         tokenizer=tok,
         max_new_tokens=MAX_TOKENS,
         do_sample=True,
+        temperature=0.7,
     )
     MODEL_ERR = None
     log("Model loaded ✔")
+except Exception as exc:                                   # noqa: BLE001
     MODEL_ERR, gen = f"Model load error: {exc}", None
     log(MODEL_ERR)
+# ──────────────────── small helpers ────────────────────────────────────────
+def clean(txt: str) -> str:
+    """Collapse whitespace & guarantee non‑empty string."""
+    return re.sub(r"\s+", " ", txt.strip()) or "…"
+def trim_history(msgs: list[dict]) -> list[dict]:
+    """Keep system + last MAX_TURNS pairs."""
+    return msgs if len(msgs) <= 1 + MAX_TURNS * 2 else [msgs[0]] + msgs[-MAX_TURNS * 2 :]
+# ──────────────────── core chat function ───────────────────────────────────
+def chat_fn(user_msg: str, history: list[dict] | None):
     log(f"User sent {len(user_msg)} chars")
+    # ensure history list exists & begins with system prompt
     if not history or history[0]["role"] != "system":
         history = [{"role": "system", "content": SYSTEM_MSG}]
+    # fatal model‑load failure
     if MODEL_ERR:
         return MODEL_ERR
+    # basic user‑input checks
     user_msg = clean(user_msg or "")
     if not user_msg:
         return "Please type something."
     if len(user_msg) > MAX_INPUT_CH:
         return f"Message too long (>{MAX_INPUT_CH} chars)."
+    # add user message & trim
     history.append({"role": "user", "content": user_msg})
+    history = trim_history(history)
+    # build prompt string
+    prompt_lines: list[str] = []
+    for m in history:
+        if m["role"] == "system":
+            prompt_lines.append(m["content"])
+        elif m["role"] == "user":
+            prompt_lines.append(f"User: {m['content']}")
+        else:
+            prompt_lines.append(f"AI: {m['content']}")
+    prompt_lines.append("AI:")
     prompt = "\n".join(prompt_lines)
+    log(f"Prompt {len(prompt)} chars  • generating…")
+    # call generator
     t0 = time.time()
     try:
+        raw   = gen(prompt)[0]["generated_text"]
         reply = clean(raw.split("AI:", 1)[-1])
+        # ✂  remove any echoed tags
+        reply = re.split(r"\b(?:User:|AI:)", reply, 1)[0].strip()
+        log(f"generate() {time.time() - t0:.2f}s  • reply {len(reply)} chars")
+    except Exception:                                      # noqa: BLE001
         log("❌ Inference exception:\n" + traceback.format_exc())
+        reply = "Sorry—AI backend crashed. Please try again later."
     return reply
+# ──────────────────── Gradio UI ────────────────────────────────────────────
 gr.ChatInterface(
     fn=chat_fn,
     chatbot=gr.Chatbot(height=480, type="messages"),
     title="SchoolSpirit AI Chat",
+    theme=gr.themes.Soft(primary_hue="blue"),   # light‑blue accent
+    type="messages",                            # modern message dicts
 ).launch()