Spaces:

SandraCLV
/

injectModel1intoModel2

Sleeping

SandraCLV commited on Oct 30, 2023

Commit

27903a3

1 Parent(s): c47375f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,28 +12,22 @@ import IPython.display as ipd
 image_to_text_model = pipeline("image-classification")
 text_to_audio_model = pipeline("text-to-speech")
-# Cargar el modelo que genera audio a partir de texto
-# Función para convertir texto a audio
-def text_to_audio(text):
-    tts = gTTS(text=text, lang='es')
-    tts.save('output.mp3')
-    return ipd.Audio('output.mp3')
 # Función para la interfaz de Gradio
 def image_to_audio(input_image):
     # Convertir la imagen a texto
     text_output = image_to_text_model(input_image)[0]['label']
     # Generar audio a partir del texto
     audio_output = text_to_audio_model(text_output)[0]['audio']
     return audio_output
 # Interfaz Gradio
 iface = gr.Interface(
     fn=image_to_audio,
     inputs=gr.Image(type='pil'),
-    outputs=[gr.Textbox(), gr.Audio()],
     live=True,
     interpretation="default",
     capture_session=True

 image_to_text_model = pipeline("image-classification")
 text_to_audio_model = pipeline("text-to-speech")
 # Función para la interfaz de Gradio
 def image_to_audio(input_image):
     # Convertir la imagen a texto
     text_output = image_to_text_model(input_image)[0]['label']
+     print('text_output is :'+text_output)
     # Generar audio a partir del texto
     audio_output = text_to_audio_model(text_output)[0]['audio']
+    print('audio_output is :'+audio_output)
     return audio_output
 # Interfaz Gradio
 iface = gr.Interface(
     fn=image_to_audio,
     inputs=gr.Image(type='pil'),
+    outputs=[gr.Textbox(value=image_to_text_model, label="Output"), gr.Audio()],
     live=True,
     interpretation="default",
     capture_session=True