RL_CAMEL / README.md

hug-me-please

Update README.md

9b15d6f verified 11 months ago

preview code

raw

history blame contribute delete

324 Bytes

metadata

license: apache-2.0
library_name: transformers
tags:
  - trl
  - ppo
  - transformers
  - reinforcement-learning

TO USE:

from transformers import AutoTokenizer, LlamaForCausalLM

model = LlamaForCausalLM.from_pretrained("hug-me-please/RL_CAMEL")
tokenizer = AutoTokenizer.from_pretrained("hug-me-please/RL_CAMEL")