Spaces:

UcsTurkey
/

oncu

Paused

App Files Files Community

ciyidogan commited on 14 days ago

Commit

47ff742

verified ·

1 Parent(s): 09fc2d1

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -77

app.py CHANGED Viewed

@@ -1,96 +1,47 @@
 import os
-import sys
-import traceback
-import json
 from fastapi import FastAPI
-from pydantic import BaseModel
 from unsloth import FastLanguageModel
 from transformers import pipeline
 from datetime import datetime
-# === 🕒 Zamanlı log fonksiyonu
-def log(message):
-    timestamp = datetime.now().strftime("%H:%M:%S")
-    line = f"[{timestamp}] {message}"
-    print(line, flush=True)
-# === Model bilgileri
-MODEL_NAME = "atasoglu/Turkish-Llama-3-8B-function-calling"
-HF_TOKEN = os.getenv("HF_TOKEN")
-# === System prompt (bizim intent yapımız)
-SYSTEM_PROMPT = """
-Siz bir görev tabanlı asistan botsunuz. Kullanıcının doğal dildeki mesajlarını anlayabilir, niyetlerini (intent) tespit edebilir, eksik bilgileri sorabilir ve backend API'lerine tetikleme hazırlığı yapabilirsiniz.
-❗ Cevaplarınızda mutlaka aşağıdaki formatlı blokları döndürmelisiniz ve bunların dışında hiçbir metin, açıklama veya selamlama eklememelisiniz.
-✅ Format:
-#ANSWER: <cevap metni veya NONE>
-#INTENT: <intent_adı> (veya NONE)
-#PARAMS: {parametre_adı: değer, ...}
-#MISSING: [eksik_parametre_adı, ...]
-#ACTION_JSON: {api için gönderilecek json, eksikse boş bırak}
-✅ Desteklenen intent'ler:
-- doviz-kuru-intent → parametre: currency (dolar, euro, TL)
-- yol-durumu-intent → parametreler: from_location, to_location (Ankara, İstanbul, İzmir)
-- hava-durumu-intent → parametre: city (Ankara, İstanbul, İzmir)
-❗ Kullanıcıya hitap ederken formal bir dil kullanınız, sadece bu formatlı blokları döndürünüz.
-"""
 app = FastAPI()
 model = None
 tokenizer = None
 pipe = None
-class ChatRequest(BaseModel):
-    prompt: str
 @app.on_event("startup")
 def load_model():
     global model, tokenizer, pipe
-    try:
-        log("🚀 Uygulama başlatılıyor...")
-        log("📥 Model yüklemesi başlatılıyor...")
-        model, tokenizer = FastLanguageModel.from_pretrained(
-            model_name=MODEL_NAME,
-            load_in_4bit=True,
-            token=HF_TOKEN
-        )
-        FastLanguageModel.for_inference(model)
-        pipe = pipeline(
-            "text-generation",
-            model=model,
-            tokenizer=tokenizer,
-            device_map="auto"
-        )
-        log("✅ Model başarıyla yüklendi ve kullanılmaya hazır.")
-    except Exception as e:
-        log(f"❌ Model yükleme hatası: {e}")
-        traceback.print_exc()
-        sys.exit(1)
-@app.post("/chat")
-def chat(req: ChatRequest):
-    try:
-        log(f"💬 Yeni istek alındı: '{req.prompt}'")
-        full_prompt = f"{SYSTEM_PROMPT}\n\nKullanıcı: {req.prompt}\nAsistan:"
-        log("🧠 LLM çağrısı başlatılıyor...")
-        outputs = pipe(
-            full_prompt,
-            max_new_tokens=256,
-            temperature=0.2,
-            top_p=0.95,
-            repetition_penalty=1.1
-        )
-        answer = outputs[0]["generated_text"].replace(full_prompt, "").strip()
-        log("✅ LLM cevabı başarıyla alındı.")
-        return {"response": answer}
-    except Exception as e:
-        log(f"❌ /chat sırasında hata oluştu: {e}")
-        traceback.print_exc()
-        return {"error": f"Hata: {str(e)}"}
 @app.get("/")
 def health():

 import os
 from fastapi import FastAPI
 from unsloth import FastLanguageModel
 from transformers import pipeline
 from datetime import datetime
 app = FastAPI()
 model = None
 tokenizer = None
 pipe = None
+# === Log fonksiyonu
+def log(message):
+    timestamp = datetime.now().strftime("%H:%M:%S")
+    print(f"[{timestamp}] {message}", flush=True)
 @app.on_event("startup")
 def load_model():
     global model, tokenizer, pipe
+    # Hugging Face ve Triton cache dizinleri
+    os.environ["HF_HOME"] = "/app/.cache"
+    os.environ["HF_DATASETS_CACHE"] = "/app/.cache"
+    os.environ["HF_HUB_CACHE"] = "/app/.cache"
+    os.environ["TRITON_CACHE_DIR"] = "/tmp/.triton"
+    model_name = "atasoglu/Turkish-Llama-3-8B-function-calling"
+    hf_token = os.getenv("HF_TOKEN")
+    log("🚀 Model yüklemesi başlatılıyor...")
+    model, tokenizer = FastLanguageModel.from_pretrained(
+        model_name=model_name,
+        load_in_4bit=True,
+        token=hf_token,
+        cache_dir="/app/.cache"
+    )
+    FastLanguageModel.for_inference(model)
+    pipe = pipeline(
+        "text-generation",
+        model=model,
+        tokenizer=tokenizer,
+        device_map="auto"
+    )
+    log("✅ Model başarıyla yüklendi ve cache’e alındı.")
 @app.get("/")
 def health():