Dumpling-Mistral-Nemo-8B / README.md

nbeerbower

Update README.md

09852c1 verified 10 months ago

preview code

raw

history blame contribute delete

2 kB

metadata

license: apache-2.0
library_name: transformers
base_model:
  - nbeerbower/mistral-nemo-kartoffel-PRUNE3
datasets:
  - nbeerbower/GreatFirewall-DPO
  - nbeerbower/Schule-DPO
  - nbeerbower/Purpura-DPO
  - nbeerbower/Arkhaios-DPO
  - jondurbin/truthy-dpo-v0.1
  - antiven0m/physical-reasoning-dpo
  - flammenai/Date-DPO-NoAsterisks
  - flammenai/Prude-Phi3-DPO
  - Atsunori/HelpSteer2-DPO
  - jondurbin/gutenberg-dpo-v0.1
  - nbeerbower/gutenberg2-dpo
  - nbeerbower/gutenberg-moderne-dpo

🧪 Experimental

An attempt to recover intelligence with a quick train, results are meh

Dumpling-Mistral-Nemo-8B

nbeerbower/mistral-nemo-kartoffel-PRUNE3 finetuned on:

Method

QLoRA ORPO tune with 2x RTX 3090 for 2 epochs.