Spaces:

SandraCLV
/

injectModel1intoModel2

Sleeping

SandraCLV commited on Oct 30, 2023

Commit

76f44e6

1 Parent(s): 6f3c59e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,43 +1,22 @@
 import gradio as gr
 from transformers import pipeline
-from gtts import gTTS
-import IPython.display as ipd
-#Definir 2 modelos uno de imagen a texto y otro de texto a audio que inyecta
-# el resultado del primero modelo(texto generado) en la entrada del 2º modelo
-# texto to audio
-# Cargar el modelo que convierte imagen a texto
-image_to_text_model = pipeline("image-classification")
-text_to_audio_model = pipeline("text-to-speech")
-def image_to_texto(input_image):
-    # Convertir la imagen a texto
-    text_output = image_to_text_model(input_image)[0]['label']
-    print('text_output is :'+text_output)
-    return text_output
-# Función para la interfaz de Gradio
-def image_to_audio(input_image):
-    # Convertir la imagen a texto
-    text_output = image_to_texto(input_image)[0]['label']
-    print('text_output is :'+text_output)
-    # Generar audio a partir del texto
-    audio_output = text_to_audio_model(text_output)[0]['audio']
-    print('audio_output is :'+audio_output)
-    return audio_output
-# Interfaz Gradio
-iface = gr.Interface(
-    fn=image_to_audio,
-    inputs=gr.Image(type='pil'),
-    outputs=[gr.Textbox(), gr.Audio()],
-    live=True,
-    interpretation="default",
-    capture_session=True
-)
-# Ejecutar la interfaz
-iface.launch()

 import gradio as gr
 from transformers import pipeline
+import speech_recognition as sr
+def transcribe_speech():
+    r = sr.Recognizer()
+    # Record Audio
+    with sr.Microphone() as source:
+        print("Habla ahora:")
+        audio = r.listen(source)
+    # Speech recognition using Google Speech Recognition
+    try:
+        text = r.recognize_google(audio, language='es-ES')
+        print("Creo que dijiste: " + text)
+    except sr.UnknownValueError:
+        print("Google Speech Recognition no pudo entender el audio")
+    except sr.RequestError as e:
+        print("No se pudo solicitar resultados del servicio de Google Speech Recognition; {0}".format(e))
+transcribe_speech()