Spaces:

vankienemk
/

Voice-regconizer

Running

Voice-regconizer / app.py

Update app.py

901f41e verified 4 months ago

796 Bytes

	import gradio as gr
	from transformers import pipeline

	# Tạo pipeline nhận diện giọng nói
	asr = pipeline("automatic-speech-recognition", model="openai/whisper-base")

	# Hàm xử lý âm thanh
	def transcribe(audio_file):
	if audio_file is None:
	return "Chưa có file âm thanh."
	result = asr(audio_file)
	return result["text"]

	# Tạo giao diện
	demo = gr.Interface(
	fn=transcribe,
	inputs=gr.Audio(source="upload", type="filepath", label="Tải lên file âm thanh (.wav, .mp3...)"),
	outputs=gr.Textbox(label="Kết quả chuyển văn bản"),
	title="Nhận diện giọng nói bằng Whisper",
	description="Tải file âm thanh và hệ thống sẽ nhận diện nội dung giọng nói bằng mô hình Whisper của OpenAI."
	)

	demo.launch()