VLLM 和 Sglang 部署 Qwen3-Omni,GPU 的利用率都不高,请问是什么原因? #114

#27
by yixue - opened

VLLM 和 Sglang 部署 Qwen3-Omni,GPU 的利用率都不高,请问是什么原因?跑更大的文本大模型,都不会出现这样的情况。

Sign up or log in to comment