Spaces:

88ggg
/

ggg

Sleeping

App Files Files Community

88ggg commited on May 17

Commit

d5381da

verified ·

1 Parent(s): 70cc3e2

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -36

app.py CHANGED Viewed

@@ -3,48 +3,60 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStream
 from threading import Thread
 import gradio as gr
-# Configuración segura (modelo ligero)
-MODEL_NAME = "microsoft/phi-2"
-# Cargar modelo y tokenizer
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained(
-    MODEL_NAME,
-    torch_dtype=torch.float16,
-    device_map="auto"
-)
-def respond(message, history, system_prompt="Eres Gerardo, un asistente útil."):
-    # Construir prompt manualmente
-    prompt = f"{system_prompt}\n\n"
-    for user_msg, bot_msg in history:
-        prompt += f"Usuario: {user_msg}\nAsistente: {bot_msg}\n"
-    prompt += f"Usuario: {message}\nAsistente:"
-    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
-    streamer = TextIteratorStreamer(tokenizer)
-    Thread(
-        target=model.generate,
-        kwargs=dict(
-            inputs,
             streamer=streamer,
             max_new_tokens=512,
             temperature=0.7
         )
-    ).start()
-    response = ""
-    for token in streamer:
-        response += token
-        yield response
-# Interfaz simplificada
-demo = gr.ChatInterface(
-    respond,
-    examples=["Hola", "¿Qué sabes de IA?"],
-    title="🤖 Chatbot de Gerardo"
-)
 if __name__ == "__main__":
-    demo.launch()

 from threading import Thread
 import gradio as gr
+# 1. Configuración del Modelo (usando un modelo más ligero y compatible)
+MODEL_NAME = "mistralai/Mistral-7B-v0.1"  # Modelo bien soportado en Spaces
+# 2. Carga del Modelo con manejo de errores
+try:
+    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+    model = AutoModelForCausalLM.from_pretrained(
+        MODEL_NAME,
+        torch_dtype=torch.float16,
+        device_map="auto"
+    )
+except Exception as e:
+    raise gr.Error(f"Error al cargar el modelo: {str(e)}")
+# 3. Función de Generación con Validación
+def generate_response(message, history):
+    try:
+        # Construir el prompt
+        messages = [{"role": "user", "content": message}]
+        inputs = tokenizer.apply_chat_template(
+            messages,
+            return_tensors="pt"
+        ).to(model.device)
+        streamer = TextIteratorStreamer(tokenizer)
+        generation_kwargs = dict(
+            inputs=inputs,
             streamer=streamer,
             max_new_tokens=512,
             temperature=0.7
         )
+        thread = Thread(target=model.generate, kwargs=generation_kwargs)
+        thread.start()
+        partial_message = ""
+        for new_token in streamer:
+            partial_message += new_token
+            yield partial_message
+    except Exception as e:
+        raise gr.Error(f"Error en generación: {str(e)}")
+# 4. Configuración Robustecida de la Interfaz
+with gr.Blocks(title="Chatbot Gerardo") as demo:
+    chatbot = gr.ChatInterface(
+        fn=generate_response,
+        examples=["Hola", "¿Cómo funciona esto?"],
+        title="🤖 Chatbot de Gerardo",
+        description="Un asistente IA creado por Gerardo"
+    )
+# 5. Lanzamiento Específico para Spaces
 if __name__ == "__main__":
+    demo.launch(server_name="0.0.0.0", server_port=7860)