Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Rosie Zhao's picture

Rosie Zhao

rosieyzh

abhishekpanigrahi's profile picture

schonsense's profile picture

contactvaibhavi's profile picture

·

https://rosieyzh.github.io/

rosieyzh
rosieyzh

AI & ML interests

theory of machine learning, deep learning

Organizations

rosieyzh 's collections 3

OLMo-150M and OLMo-1B Pretrained Models

Pretrained models from scratch used in "Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining".

rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_base

Text Generation • 1B • Updated Jul 7 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_base

Text Generation • 1B • Updated Jul 7 • 5
rosieyzh/OLMo-150M-as_fm3_tg_omi1_omi2

Text Generation • 0.2B • Updated Jul 7 • 5
rosieyzh/OLMo-150M-as_fm3_tg_omi1

Text Generation • 0.2B • Updated Jul 7 • 7

OLMo-1B-as_fm3_tg_omi2

OLMo 1B model pretrained with Algebraic Stack, FineMath3, TinyGSM, and OpenMathInstruct2. Includes checkpoints from doing PPO using GSM8K train.

rosieyzh/OLMo-1B-as_fm3_tg_omi2_ppo

Text Generation • 1B • Updated Jun 19 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode1

Text Generation • 1B • Updated Jun 18 • 5
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode2

Text Generation • 1B • Updated Jun 18 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode3

Text Generation • 1B • Updated Jun 18 • 7

OLMo-1B-as_fm3_tg_omi1_omi2

OLMo 1B model pretrained with Algebraic Stack, FineMath3, TinyGSM, OMI1, and OMI2. Includes checkpoints from doing PPO using GSM8K train.

rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_ppo

Text Generation • 1B • Updated Jun 19 • 11
rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_episode1

Text Generation • 1B • Updated Jun 19 • 4
rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_episode2

Text Generation • 1B • Updated Jun 19 • 6
rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_episode3

Text Generation • 1B • Updated Jun 19 • 5

OLMo-150M and OLMo-1B Pretrained Models

Pretrained models from scratch used in "Echo Chamber: RL Post-training Amplifies Behaviors Learned in Pretraining".

rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_base

Text Generation • 1B • Updated Jul 7 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_base

Text Generation • 1B • Updated Jul 7 • 5
rosieyzh/OLMo-150M-as_fm3_tg_omi1_omi2

Text Generation • 0.2B • Updated Jul 7 • 5
rosieyzh/OLMo-150M-as_fm3_tg_omi1

Text Generation • 0.2B • Updated Jul 7 • 7

OLMo-1B-as_fm3_tg_omi1_omi2

OLMo 1B model pretrained with Algebraic Stack, FineMath3, TinyGSM, OMI1, and OMI2. Includes checkpoints from doing PPO using GSM8K train.

rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_ppo

Text Generation • 1B • Updated Jun 19 • 11
rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_episode1

Text Generation • 1B • Updated Jun 19 • 4
rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_episode2

Text Generation • 1B • Updated Jun 19 • 6
rosieyzh/OLMo-1B-as_fm3_tg_omi1_omi2_episode3

Text Generation • 1B • Updated Jun 19 • 5

OLMo-1B-as_fm3_tg_omi2

OLMo 1B model pretrained with Algebraic Stack, FineMath3, TinyGSM, and OpenMathInstruct2. Includes checkpoints from doing PPO using GSM8K train.

rosieyzh/OLMo-1B-as_fm3_tg_omi2_ppo

Text Generation • 1B • Updated Jun 19 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode1

Text Generation • 1B • Updated Jun 18 • 5
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode2

Text Generation • 1B • Updated Jun 18 • 8
rosieyzh/OLMo-1B-as_fm3_tg_omi2_episode3

Text Generation • 1B • Updated Jun 18 • 7

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs