pyamy
/

llama3-dpo-llm-judge

preference-learning

Model card Files Files and versions Metrics Training metrics Community

llama3-dpo-llm-judge / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

pyamy's picture

Upload DPO LLM Judge fine-tuned model

f582c27 verified 16 days ago

Aug10_17-19-08_Cheddar
Upload DPO LLM Judge fine-tuned model 16 days ago