Edit Models filters

Inference Providers

HF Inference API

Misc

retrieval-augmented-generation

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

44

Full-text search

Active filters: retrieval-augmented-generation

thanhtantran/Vi-Qwen2-7B-RAG-rk3588-1.2.0

Text Generation • Updated May 2 • 8

thanhtantran/GRPO-VI-Qwen2-7B-RAG-rk3588-1.2.0

Text Generation • Updated May 2 • 9 • 1

mradermacher/GRPO-VI-Qwen2-7B-RAG-GGUF

8B • Updated Jul 11 • 63

mradermacher/GRPO-VI-Qwen2-7B-RAG-i1-GGUF

8B • Updated Jul 11 • 47

NishKook/legal-qa-lora

Updated Jun 6 • 1

dmis-lab/llama-3.1-medprm-reward-v1.0

Text Generation • 8B • Updated Jun 18 • 72 • 14

vlad-m-dev/distiluse-base-multilingual-v2-merged-onnx

Feature Extraction • Updated Jun 22 • 1

QuantFactory/llama-3.1-medprm-reward-v1.0-GGUF

Text Generation • 8B • Updated Jun 23 • 67 • 3

onnx-community/distiluse-base-multilingual-v2-merged-onnx

Feature Extraction • Updated Jun 26 • 1

constehub/rag-evaluation

Text Generation • 8B • Updated Jul 23 • 9

tensorblock/AITeamVN_GRPO-VI-Qwen2-7B-RAG-GGUF

Text Generation • 8B • Updated Jul 17 • 20

tensorblock/dmis-lab_llama-3.1-medprm-reward-v1.0-GGUF

Text Generation • 8B • Updated Jul 18 • 116

quanghd96/Vi-Qwen2-1.5B-RAG-Q4_K_M-GGUF

Text Generation • 2B • Updated Jul 23 • 1.06k

hamzi275/multilingual

Question Answering • Updated Aug 12