import os | |
import csv | |
# Carpeta donde están los .wav | |
ruta = "voces" | |
# Obtener y ordenar archivos .wav | |
archivos = sorted([f for f in os.listdir(ruta) if f.endswith(".wav")]) | |
# Verifica si hay archivos | |
if not archivos: | |
print("❌ No se encontraron archivos .wav en la carpeta 'voces'.") | |
exit() | |
# Crear archivo dataset.csv | |
with open("dataset.csv", "w", newline='', encoding='utf-8') as f: | |
writer = csv.writer(f) | |
writer.writerow(["path", "text"]) | |
print("🧠 Comenzando anotación de dataset...\n") | |
for nombre in archivos: | |
ruta_relativa = os.path.join(ruta, nombre) | |
print(f"\n🎧 Reproduciendo: {ruta_relativa}") | |
os.system(f"aplay '{ruta_relativa}'") # Compatibilidad con espacios en nombres | |
try: | |
texto = input(f"📝 ¿Qué dice exactamente '{nombre}'? ").strip() | |
if texto: | |
writer.writerow([ruta_relativa, texto]) | |
print("✅ Guardado.") | |
else: | |
print("⚠️ Entrada vacía. Archivo omitido.") | |
except KeyboardInterrupt: | |
print("\n⛔ Proceso interrumpido por el usuario.") | |
break | |
print("\n📦 Dataset final guardado como 'dataset.csv'") | |