RLHF-And-Friends
/

TLDR-Mistral-7B-SFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

TLDR-Mistral-7B-SFT-PPO

14.5 GB

2 contributors

History: 5 commits

evgurov's picture

Update tokenizer_config.json

0b4de89 verified 10 months ago