25 6 25

Benjamin Minixhofer

benjamin

https://github.com/bminixhofer

AI & ML interests

NLP, Efficiency, Machine Learning in Rust, Multilinguality, Transfer Learning

Recent Activity

updated a model 19 days ago

benjamin/gemma-3-4b-it-flax

published a model 19 days ago

benjamin/gemma-3-4b-it-flax

liked a Space 2 months ago

liujch1998/infini-gram

View all activity

Organizations

Collections 1

Papers 9

models 78

datasets 7

benjamin/SeaExam-formatted

Viewer • Updated Nov 15, 2025 • 9.73k • 11

benjamin/execute

Viewer • Updated Sep 18, 2025 • 172k • 36

benjamin/OpenMathInstruct-2-2M-formatted

Viewer • Updated Apr 24, 2025 • 2M • 26

benjamin/ai2_arc_full_sentence

Viewer • Updated Jan 6, 2025 • 7.79k • 51

benjamin/flanv2_subsample

Viewer • Updated Dec 6, 2024 • 10M • 28

benjamin/compoundpiece

Viewer • Updated Jul 24, 2023 • 44.2M • 105 • 1

benjamin/ner-uk

Viewer • Updated Oct 26, 2022 • 12.8k • 36 • 2

Benjamin Minixhofer

AI & ML interests

Recent Activity

Organizations

Collections 1

benjamin/Llama3-2-3B-IT-Byte

benjamin/Gemma2-2B-IT-Byte

benjamin/Llama3.2-3B-IT-with-Qwen2-Tokenizer

benjamin/Gemma2-2B-IT-with-Qwen2-Tokenizer

benjamin/Llama3-2-3B-IT-Byte

benjamin/Gemma2-2B-IT-Byte

benjamin/Llama3.2-3B-IT-with-Qwen2-Tokenizer

benjamin/Gemma2-2B-IT-with-Qwen2-Tokenizer

Papers 9

models 78

benjamin/gemma-3-4b-it-flax

benjamin/Llama-3.1-8B-flax

benjamin/gemma-3-12b-pt-flax

benjamin/dolma2-tokenizer_superbpe_olmo2_p99_truncate_10G__extend_400K

benjamin/dolma2-tokenizer_superbpe_olmo2_p99_truncate_10G__extend_200K

benjamin/Qwen3-14B-flax

benjamin/gemma-3-1b-it-flax

benjamin/gemma-3-12b-it-flax

benjamin/Qwen3-1.7B-Base-flax

benjamin/Qwen3-4B-Base-flax

datasets 7

benjamin/SeaExam-formatted

benjamin/execute

benjamin/OpenMathInstruct-2-2M-formatted

benjamin/ai2_arc_full_sentence

benjamin/flanv2_subsample

benjamin/compoundpiece

benjamin/ner-uk

Benjamin Minixhofer

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 9

models 78 Sort: Recently updated

datasets 7 Sort: Recently updated

models 78

datasets 7