Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

132

Full-text search

Active filters: Quantization

VPTQ-community/Mistral-Large-Instruct-2407-v16-k65536-16384-woft

9B • Updated Feb 25 • 1 • 2

VPTQ-community/Mistral-Large-Instruct-2407-v8-k65536-256-woft

13B • Updated Feb 25 • 2

VPTQ-community/Mistral-Large-Instruct-2407-v16-k65536-65536-woft

10B • Updated Feb 25 • 2 • 1

VPTQ-community/Mistral-Large-Instruct-2407-v8-k65536-65536-woft

17B • Updated Feb 26 • 1 • 2

VPTQ-community/Mistral-Large-Instruct-2407-v16-k65536-1024-woft

8B • Updated Feb 25 • 1

VPTQ-community/Mistral-Large-Instruct-2407-v16-k65536-4096-woft

8B • Updated Feb 26

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v8-k65536-256-woft

42B • Updated Feb 26 • 1 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v8-k65536-65536-woft

55B • Updated Feb 26 • 2

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v8-k65536-256-woft

9B • Updated Feb 25

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v16-k65536-65536-woft

8B • Updated Feb 25

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v8-k65536-65536-woft

11B • Updated Feb 25 • 5

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v16-k65536-1024-woft

6B • Updated Feb 25 • 1

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v8-k65536-0-woft

7B • Updated Feb 25

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v16-k65536-16384-woft

7B • Updated Feb 25 • 2

VPTQ-community/Llama-3.1-Nemotron-70B-Instruct-HF-v16-k65536-256-woft

6B • Updated Feb 25 • 1

Puhaha/gemma-2-9b-it-SimPO_q4_k_m

9B • Updated Nov 16, 2024 • 14

mit-han-lab/svdq-int4-flux.1-schnell

Text-to-Image • Updated Jul 21 • 5.2k • 16

mit-han-lab/nunchaku-t5

Text Generation • Updated Jul 21 • 4 • 18

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v8-k65536-256-woft

9B • Updated Feb 25 • 3

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v16-k65536-16384-woft

7B • Updated Feb 25

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v8-k65536-0-woft

7B • Updated Feb 25 • 1

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v16-k65536-65536-woft

8B • Updated Feb 25 • 7

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v8-k65536-65536-woft

11B • Updated Feb 25 • 3 • 1

VPTQ-community/Meta-Llama-3.3-70B-Instruct-v16-k65536-1024-woft

6B • Updated Feb 25 • 1

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v12-k65536-4096-woft-vllm

2B • Updated Jan 13

mit-han-lab/svdq-int4-sana-1600m

Text-to-Image • Updated Jul 21 • 52 • 2

mit-han-lab/svdq-int4-flux.1-canny-dev

Image-to-Image • Updated Jul 21 • 153 • 5

mit-han-lab/svdq-int4-flux.1-depth-dev

Image-to-Image • Updated Jul 21 • 200 • 5

mit-han-lab/svdq-int4-flux.1-fill-dev

Image-to-Image • Updated Jul 21 • 135k • 31

mit-han-lab/svdq-flux.1-schnell-pix2pix-turbo

Image-to-Image • Updated Jul 21 • 129 • 1