UMA-4B

Agentic RL fine-tuned model

Usage

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("dp66/UMA-4B")
model = AutoModelForCausalLM.from_pretrained("dp66/UMA-4B")

Training Details

Base Model: Qwen/Qwen3-4B-Instruct-2507

Downloads last month: 17

Safetensors

Model size

4B params

Tensor type

BF16

Model tree for dp66/UMA-4B

Base model

Qwen/Qwen3-4B-Instruct-2507

Finetuned

(386)

this model

Quantizations

1 model