grailfinder

AI & ML interests

None yet

Recent Activity

commented on an article about 2 months ago

New in llama.cpp: Model Management

upvoted an article about 2 months ago

New in llama.cpp: Model Management

View all activity

Organizations

None yet

commented on New in llama.cpp: Model Management about 2 months ago

https://github.com/ggml-org/llama.cpp/tree/master/tools/server#using-multiple-models

models_directory
 │
 │  # single file
 ├─ llama-3.2-1b-Q4_K_M.gguf
 ├─ Qwen3-8B-Q4_K_M.gguf
 │
 │  # multimodal
 ├─ gemma-3-4b-it-Q8_0
 │    ├─ gemma-3-4b-it-Q8_0.gguf
 │    └─ mmproj-F16.gguf   # file name must start with "mmproj"

upvoted an article about 2 months ago

Article

New in llama.cpp: Model Management

Dec 11, 2025

•

116

grailfinder

AI & ML interests

Recent Activity

Organizations

grailfinder's activity

New in llama.cpp: Model Management