Spaces:

DRDELATV
/

voice

Runtime error

voice / generar_csv.py

Upload folder using huggingface_hub

70e5c60 verified 4 months ago

1.21 kB

	import os
	import csv

	# Carpeta donde están los .wav
	ruta = "voces"

	# Obtener y ordenar archivos .wav
	archivos = sorted([f for f in os.listdir(ruta) if f.endswith(".wav")])

	# Verifica si hay archivos
	if not archivos:
	print("❌ No se encontraron archivos .wav en la carpeta 'voces'.")
	exit()

	# Crear archivo dataset.csv
	with open("dataset.csv", "w", newline='', encoding='utf-8') as f:
	writer = csv.writer(f)
	writer.writerow(["path", "text"])

	print("🧠 Comenzando anotación de dataset...\n")

	for nombre in archivos:
	ruta_relativa = os.path.join(ruta, nombre)
	print(f"\n🎧 Reproduciendo: {ruta_relativa}")
	os.system(f"aplay '{ruta_relativa}'") # Compatibilidad con espacios en nombres

	try:
	texto = input(f"📝 ¿Qué dice exactamente '{nombre}'? ").strip()
	if texto:
	writer.writerow([ruta_relativa, texto])
	print("✅ Guardado.")
	else:
	print("⚠️ Entrada vacía. Archivo omitido.")
	except KeyboardInterrupt:
	print("\n⛔ Proceso interrumpido por el usuario.")
	break

	print("\n📦 Dataset final guardado como 'dataset.csv'")