Spaces:

OpenSound
/

SoloAudio

Running on Zero

OpenSound commited on May 23

Commit

a75f69b

verified ·

1 Parent(s): 6a74d82

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -142,7 +142,7 @@ def tse(gt_file_input, text_input, num_infer_steps, eta, seed, guidance_scale, g
             padding = target_length - current_length
             mixture = np.pad(mixture, (0, padding), mode='constant')
         mixture = torch.tensor(mixture).unsqueeze(0).to(device)
-        # mixture = autoencoder(audio=mixture.unsqueeze(1))
         text_inputs = processor(
             text=[text_input],
@@ -159,9 +159,9 @@ def tse(gt_file_input, text_input, num_infer_steps, eta, seed, guidance_scale, g
         timbre = clapmodel.get_text_features(**inputs)
     # mixture = autoencoder(embedding=mixture).squeeze(1)
-    # pred = sample_diffusion(mixture, timbre, num_infer_steps, eta, seed, guidance_scale, guidance_rescale)
-    # return sample_rate, pred.squeeze().cpu().numpy()
-    return sample_rate, mixture.squeeze().cpu().numpy()
 # CSS styling (optional)

             padding = target_length - current_length
             mixture = np.pad(mixture, (0, padding), mode='constant')
         mixture = torch.tensor(mixture).unsqueeze(0).to(device)
+        mixture = autoencoder(audio=mixture.unsqueeze(1))
         text_inputs = processor(
             text=[text_input],
         timbre = clapmodel.get_text_features(**inputs)
     # mixture = autoencoder(embedding=mixture).squeeze(1)
+    pred = sample_diffusion(mixture, timbre, num_infer_steps, eta, seed, guidance_scale, guidance_rescale)
+    return sample_rate, pred.squeeze().cpu().numpy()
+    # return sample_rate, mixture.squeeze().cpu().numpy()
 # CSS styling (optional)