Tucano2

Polygl0t 's Collections

Tucano2

LilMoo

LilTii

ViTucano-v1 (Portuguese)

Tucano (Portuguese)

TeenyTinyLlama (Portuguese)

updated 1 day ago

An open suite of large language models (LLMs) with 0.5-3.7 billion parameters, designed to address the gap in open-source development for Portuguese.

Upvote

Tucano 2 Cool: Better Open Source LLMs for Portuguese

Paper • 2603.03543 • Published 3 days ago • 5
Polygl0t/Tucano2-0.6B-Base

Text Generation • 0.7B • Updated 1 day ago • 15

Note 🧱 Base version of Tucano2 0.6B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-0.5B-Base

Text Generation • 0.5B • Updated 1 day ago • 26

Note 🧱 Base version of Tucano2 0.5B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-0.5B-Instruct

Text Generation • 0.5B • Updated 1 day ago • 30 • 1

Note 💬 Instruct version of Tucano2 0.5B. Suited for chat applications.
Polygl0t/Tucano2-qwen-0.5B-Think

Text Generation • 0.5B • Updated 1 day ago • 55

Note 🤔 Think version of Tucano2 0.5B. Suited for reasoning tasks.
Polygl0t/Tucano2-qwen-1.5B-Base

Text Generation • 2B • Updated 1 day ago • 269

Note 🧱 Base version of Tucano2 1.5B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-1.5B-Instruct

Text Generation • 2B • Updated 1 day ago • 280 • 1

Note 💬 Instruct version of Tucano2 1.5B. Suited for chat applications.
Polygl0t/Tucano2-qwen-1.5B-Think

Text Generation • 2B • Updated 1 day ago • 25

Note 🤔 Think version of Tucano2 1.5B. Suited for reasoning tasks.
Polygl0t/Tucano2-qwen-3.7B-Base

Text Generation • 4B • Updated 1 day ago • 17

Note 🧱 Base version of Tucano2 3.7B. Use as a foundation for post-training.
Polygl0t/Tucano2-qwen-3.7B-Instruct

Text Generation • 4B • Updated 1 day ago • 48 • 1

Note 💬 Instruct version of Tucano2 3.7B. Suited for chat applications.
Polygl0t/Tucano2-qwen-3.7B-Think

Text Generation • 4B • Updated 1 day ago • 39

Note 🤔 Think version of Tucano2 3.7B. Suited for reasoning tasks.
Polygl0t/gigaverbo-v2

Viewer • Updated 1 day ago • 375M • 56

Note 📚 Pretraining dataset.
Polygl0t/gigaverbo-v2-synth

Viewer • Updated 1 day ago • 11.2M • 53

Note 📚 Synthetic dataset.
Polygl0t/gigaverbo-v2-sft

Viewer • Updated 1 day ago • 4.09M • 52

Note 📚 Supervised fine-tuning dataset.
Polygl0t/gigaverbo-v2-preferences

Viewer • Updated 1 day ago • 28.4k • 35

Note 📚 Preference dataset.
Polygl0t/GigaVerbo-v2-ablation-EDU-Synth-1.5B

Text Generation • 2B • Updated 1 day ago • 16

Note 🔬 Ablation Experiment (Edu+Synth)
Polygl0t/GigaVerbo-v2-ablation-EDU-1.5B

Text Generation • 2B • Updated 1 day ago • 14

Note 🔬 Ablation Experiment (Edu)
Polygl0t/GigaVerbo-v2-ablation-Synth-1.5B

Text Generation • 2B • Updated 1 day ago • 13

Note 🔬 Ablation Experiment (Synth)
Polygl0t/GigaVerbo-v2-ablation-NonEDU-1.5B

Text Generation • 2B • Updated 1 day ago • 13

Note 🔬 Ablation Experiment (NonEdu)
Polygl0t/portuguese-edu-qwen-annotations

Viewer • Updated 1 day ago • 700k • 2

Note 📚 Annotations to train classifiers/filters (Educational).
Polygl0t/portuguese-toxicity-qwen-annotations

Viewer • Updated 1 day ago • 700k • 2

Note 📚 Annotations to train classifiers/filters (Toxicity).
Polygl0t/portuguese-instruct-quality-qwen-annotations

Viewer • Updated 1 day ago • 500k • 2

Note 📚 Annotations to train classifiers/filters (Instructions).
Polygl0t/portuguese-bertimbau-edu-classifier

Text Classification • 0.1B • Updated 1 day ago • 13

Note 🎯 Quality Filter (Educational)
Polygl0t/portuguese-bertimbau-large-edu-classifier

Text Classification • 0.3B • Updated 1 day ago • 13

Note 🎯 Quality Filter (Educational)
Polygl0t/portuguese-bertimbau-toxicity-classifier

Text Classification • 0.1B • Updated 1 day ago • 15

Note 🎯 Quality Filter (Toxicity)
Polygl0t/portuguese-bertabaporu-large-toxicity-classifier

Text Classification • 0.4B • Updated 1 day ago • 13

Note 🎯 Quality Filter (Toxicity)
Polygl0t/portuguese-qwen3-4b-instruct-quality-classifier

Text Classification • 4B • Updated 1 day ago • 14

Note 🎯 Quality Filter (Instructions)
Polygl0t/portuguese-qwen3-4b-instruct-quality-judge

Text Generation • 4B • Updated 1 day ago • 13

Note 🎯 Quality Filter (Instructions)
Polygl0t/tokenizers

Viewer • Updated 1 day ago • 8.98M • 2

Note 📚 Data used to train the Tucano2 tokenizer.
Polygl0t/gsm8k-pt

Viewer • Updated 22 days ago • 8.76k • 22

Note 🏆 An evaluation for mathematical reasoning in Portuguese.
Polygl0t/IFEval-PT

Viewer • Updated 22 days ago • 300 • 20

Note 🏆 An evaluation for instruction following in Portuguese.
Polygl0t/portuguese-eval-logs-olmo2-smollm3

Viewer • Updated 1 day ago • 203 • 19

Note 🔬 Evaluation suite experiments.

Upvote