Andrew Siah's picture

Andrew Siah

andrewsiah

·

AI & ML interests

None yet

Organizations

andrewsiah 's models 10

andrewsiah/Qwen-2.5-1.5B-Instruct-Datamix

Text Generation • 2B • Updated Feb 16, 2025

andrewsiah/Qwen-2.5-7B-Simple-RL

Text Generation • 8B • Updated Feb 15, 2025 • 2

andrewsiah/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • 2B • Updated Feb 14, 2025 • 2

andrewsiah/Qwen2.5-1.5B-Open-R1-Distill

Updated Feb 13, 2025

andrewsiah/Reinforce-1

Reinforcement Learning • Updated Aug 1, 2023

andrewsiah/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 19, 2023 • 3

andrewsiah/taxi-v3

Reinforcement Learning • Updated Jun 19, 2023

andrewsiah/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 19, 2023

andrewsiah/ppo-Huggy

Reinforcement Learning • Updated Jun 18, 2023 • 13

andrewsiah/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 18, 2023 • 6