Audio Tasks - a alecccdd Collection

alecccdd 's Collections

Fun

Impressive Large Models

Vision Tasks (Watermark)

Vision Tasks (Humans)

Vision Datasets

Vision Datasets (Human)

Diffusion Tasks

Text Generation

Text Datasets (Reasoning)

Text Datasets (Grammar)

ReID

small & highly efficient

Audio Tasks

updated 10 days ago

Soul-AILab/SoulX-Podcast-1.7B

Text-to-Speech • 2B • Updated Dec 18, 2025 • 380 • 231
bosonai/higgs-audio-v2-generation-3B-base

Text-to-Speech • 6B • Updated Jul 28, 2025 • 142k • 657
Running

32

Vocal Isolator

🗣

32

Isolate vocals from audio files
nvidia/personaplex-7b-v1

Audio-to-Audio • Updated 4 days ago • 83.8k • 1.57k
FlashLabs/Chroma-4B

Any-to-Any • 6B • Updated 5 days ago • 7.78k • 346
Running on Zero

Featured

1.11k

Qwen3-TTS Demo

🎙

1.11k

Generate realistic speech from text with custom voices or voice cloning
Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice

Text-to-Speech • 2B • Updated 4 days ago • 228k • 837