Yang Yang's picture

19

Yang Yang

yangyang14641

·

yangyang14641

AI & ML interests

None yet

Organizations

None yet

liked a model 6 months ago

mistralai/Mistral-Small-3.2-24B-Instruct-2506

24B • Updated 10 days ago • 180k • 533

liked a Space 10 months ago

The Ultra-Scale Playbook

The ultimate guide to training LLM on large GPU Clusters

liked 2 models 12 months ago

deepseek-ai/DeepSeek-R1

Text Generation • 685B • Updated Mar 27, 2025 • 505k • • 12.9k

hexgrad/Kokoro-82M

Text-to-Speech • Updated Apr 10, 2025 • 2.95M • • 5.49k

liked 15 models about 1 year ago

deepseek-ai/DeepSeek-Coder-V2-Instruct

Text Generation • 236B • Updated Aug 21, 2024 • 90.6k • 673

deepseek-ai/DeepSeek-Coder-V2-Lite-Base

Text Generation • 16B • Updated Jul 3, 2024 • 21k • 99

deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

Text Generation • 16B • Updated Jul 3, 2024 • 165k • • 514

deepseek-ai/DeepSeek-Coder-V2-Base

Text Generation • 236B • Updated Jul 3, 2024 • 80.3k • 80

deepseek-ai/DeepSeek-V3

Text Generation • 685B • Updated Mar 27, 2025 • 862k • • 4.01k

deepseek-ai/DeepSeek-V3-Base

685B • Updated Mar 27, 2025 • 4.5k • 1.68k

nvidia/OpenMath2-Llama3.1-70B

Text Generation • 71B • Updated Nov 25, 2024 • 562 • 21

nvidia/OpenMath2-Llama3.1-8B

Text Generation • 8B • Updated Nov 25, 2024 • 285 • • 32

nvidia/OpenMath2-Llama3.1-70B-nemo

Updated Nov 25, 2024 • 9

nvidia/OpenMath2-Llama3.1-8B-nemo

Updated Nov 25, 2024 • 6

TheBloke/Llama-2-7B-Chat-GGUF

Text Generation • 7B • Updated Oct 14, 2023 • 137k • 506

nvidia/Llama-3.1-Nemotron-70B-Instruct-HF

Text Generation • 71B • Updated Apr 13, 2025 • 5.06k • • 2.06k

foduucom/stockmarket-pattern-detection-yolov8

Object Detection • Updated Apr 2, 2025 • 11.5k • 384

meta-llama/Llama-3.3-70B-Instruct

Text Generation • 71B • Updated Dec 21, 2024 • 335k • • 2.61k

openai/whisper-large-v3-turbo

Automatic Speech Recognition • 0.8B • Updated Oct 4, 2024 • 3.32M • • 2.75k