HuggingFaceTB
/

SmolLM2-1.7B-Instruct

Text Generation

Transformers.js

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

SmolLM2-1.7B-Instruct / onnx /model_quantized.onnx

Commit History

Upload optimized ONNX model w/ GQA (#26)

31b70e2
verified

Xenova HF Staff commited on Apr 21

Fix q8 weights (use uint8 for q8; int8 produces poor results) (#18)

b75eb65
verified

Xenova HF Staff commited on Nov 26, 2024

Upload optimized ONNX weights (deduplicated) (#17)

b36fc77
verified

Xenova HF Staff commited on Nov 26, 2024