SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
Label |
Examples |
supportive |
- '"Die jungen Revolutionäre: Klima-Aktivist*innen erzwingen politische Verantwortung!\n\nInmitten der politischen Apathie und korporatistischen Dominanz, gibt es Hoffnung: die jungen Menschen, die sich für den Schutz unseres Planeten einsetzen. Die Fridays for Future-Demonstrationen und ähnliche Aktionen zeigen, dass die Zeit des Stillstands vorbei ist. Es ist an der Zeit, dass Politiker endlich handeln, anstatt nur zu reden - und die jungen Menschen sind bereit, den Druck auszuüben, um dies zu erreichen."'
- 'Die Bundesregierung plant die flächendeckende Einführung von Wärmepumpen in Deutschland. Ziel ist es, den Anteil erneuerbarer Wärme an der Gesamtwärmeversorgung zu erhöhen und den CO2-Ausstoß zu reduzieren. Die Initiative soll auch die Energieeffizienz verbessern und die Abhängigkeit von fossilen Brennstoffen verringern. Experten hoffen, dass diese Maßnahme einen wichtigen Schritt in Richtung einer klimafreundlichen Zukunft darstellt.'
- '„Heizkosten senken, CO2 reduzieren: Bund und Länder planen flächendeckende Einführung von Wärmepumpen. Die Initiative soll bis 2030 umgesetzt werden. Experten hoffen, dass die Maßnahme nicht nur den Klimaschutz fördert, sondern auch die Heizkosten für Millionen deutscher Haushalte senkt. In Zukunft sollen Wärmepumpen in neuen Gebäuden standardmäßig vorgesehen werden, um eine emissionsarme und wirtschaftliche Erwärmung zu ermöglichen.“'
|
opposed |
- '"Klima-Dramatik auf der Straße: Radikale Aktivisten blockieren die Realität ab"\n\nDie jüngste Aktion von "Fridays for Future" in Berlin hat wieder gezeigt, dass die Proteste der Klima-Aktivist*innen nicht nur lärmig und lahmlegen, sondern auch sinnlos sind. Statt konstruktiv an Lösungen zu arbeiten, verbringen sie ihre Zeit damit, Straßen zu blockieren und die Alltäglichkeit in Berlin zu stören. Wir brauchen Handlungsabkömmlinge, nicht bloße Demonstranten.'
- '"Steuernde Fehlplanung: Grüne Wärme-Pumpe-Hysterie kostet Steuerzahler Milliarden"\n\nDie Regierung will uns mit einer teuren, ineffizienten und unpraktischen Wärmepumpen-Revolution in die Zukunft führen. Die flächendeckende Einführung dieser teuren Geräte wird den Stromverbrauch erhöhen, die Steuerzahler belasten und unsere Umwelt nicht wirklich schützen. Wir brauchen eine realistische Energiewende, nicht eine teure Fehlplanung von Grünen, die sich in ihre eigene Welt versenken."'
- 'Neue Schikane an den Straßen: Bund plant Tempo-Limit für Autobahnen\nEin neuer Vorschlag des Bundesverkehrswegeplans (BVWP) will eine allgemeine Geschwindigkeitsbegrenzung auf Autobahnen einführen. Laut Plänen soll die Höchstgeschwindigkeit von derzeit 130 km/h auf 120 km/h reduziert werden. Kritiker warnen vor Auswirkungen auf den Verkehr und die Wirtschaft, da sich dies zu erheblichen Verzögerungen führen könnte, insbesondere bei Lkw-Fahrten. Der Vorschlag wird in der nächsten Sitzung des Bundesverkehrsministeriums diskutiert.'
|
Evaluation
Metrics
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("cbpuschmann/MiniLM-klimacoder_v0.4")
preds = model("\"Von 'Klimakriegen' zu rechten Schreien in die Menge: Proteste der jungen Aktivisten überfordern die Gesellschaft. Statt produktiven Lösungsansätzen für den Klimawandel, sorgen diese Gruppen lediglich für Aufsehen und Chaos auf Straßen und Plätzen. Es ist höchste Zeit, dass sich die Jugendlichen von solchen Aktionismus distanzieren und sich an tatsächliche politische Gestaltung beteiligen.\"")
Training Details
Training Set Metrics
Training set |
Min |
Median |
Max |
Word count |
36 |
64.4771 |
98 |
Label |
Training Sample Count |
opposed |
235 |
supportive |
245 |
Training Hyperparameters
- batch_size: (32, 32)
- num_epochs: (1, 1)
- max_steps: -1
- sampling_strategy: oversampling
- body_learning_rate: (2e-05, 1e-05)
- head_learning_rate: 0.01
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- l2_weight: 0.01
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
Epoch |
Step |
Training Loss |
Validation Loss |
0.0003 |
1 |
0.2397 |
- |
0.0138 |
50 |
0.253 |
- |
0.0276 |
100 |
0.152 |
- |
0.0415 |
150 |
0.0264 |
- |
0.0553 |
200 |
0.0064 |
- |
0.0691 |
250 |
0.0014 |
- |
0.0829 |
300 |
0.0007 |
- |
0.0968 |
350 |
0.0003 |
- |
0.1106 |
400 |
0.0002 |
- |
0.1244 |
450 |
0.0002 |
- |
0.1382 |
500 |
0.0002 |
- |
0.1521 |
550 |
0.0001 |
- |
0.1659 |
600 |
0.0001 |
- |
0.1797 |
650 |
0.0003 |
- |
0.1935 |
700 |
0.0001 |
- |
0.2074 |
750 |
0.0001 |
- |
0.2212 |
800 |
0.0001 |
- |
0.2350 |
850 |
0.0 |
- |
0.2488 |
900 |
0.0 |
- |
0.2626 |
950 |
0.0 |
- |
0.2765 |
1000 |
0.0 |
- |
0.2903 |
1050 |
0.0 |
- |
0.3041 |
1100 |
0.0 |
- |
0.3179 |
1150 |
0.0 |
- |
0.3318 |
1200 |
0.0 |
- |
0.3456 |
1250 |
0.0 |
- |
0.3594 |
1300 |
0.0 |
- |
0.3732 |
1350 |
0.0 |
- |
0.3871 |
1400 |
0.0 |
- |
0.4009 |
1450 |
0.0 |
- |
0.4147 |
1500 |
0.0 |
- |
0.4285 |
1550 |
0.0 |
- |
0.4424 |
1600 |
0.0 |
- |
0.4562 |
1650 |
0.0 |
- |
0.4700 |
1700 |
0.0 |
- |
0.4838 |
1750 |
0.0 |
- |
0.4976 |
1800 |
0.0 |
- |
0.5115 |
1850 |
0.0 |
- |
0.5253 |
1900 |
0.0 |
- |
0.5391 |
1950 |
0.0 |
- |
0.5529 |
2000 |
0.0 |
- |
0.5668 |
2050 |
0.0 |
- |
0.5806 |
2100 |
0.0 |
- |
0.5944 |
2150 |
0.0 |
- |
0.6082 |
2200 |
0.0 |
- |
0.6221 |
2250 |
0.0 |
- |
0.6359 |
2300 |
0.0 |
- |
0.6497 |
2350 |
0.0 |
- |
0.6635 |
2400 |
0.0 |
- |
0.6774 |
2450 |
0.0 |
- |
0.6912 |
2500 |
0.0 |
- |
0.7050 |
2550 |
0.0 |
- |
0.7188 |
2600 |
0.0 |
- |
0.7327 |
2650 |
0.0 |
- |
0.7465 |
2700 |
0.0 |
- |
0.7603 |
2750 |
0.0 |
- |
0.7741 |
2800 |
0.0 |
- |
0.7879 |
2850 |
0.0 |
- |
0.8018 |
2900 |
0.0 |
- |
0.8156 |
2950 |
0.0 |
- |
0.8294 |
3000 |
0.0 |
- |
0.8432 |
3050 |
0.0 |
- |
0.8571 |
3100 |
0.0 |
- |
0.8709 |
3150 |
0.0 |
- |
0.8847 |
3200 |
0.0 |
- |
0.8985 |
3250 |
0.0 |
- |
0.9124 |
3300 |
0.0 |
- |
0.9262 |
3350 |
0.0 |
- |
0.9400 |
3400 |
0.0 |
- |
0.9538 |
3450 |
0.0 |
- |
0.9677 |
3500 |
0.0 |
- |
0.9815 |
3550 |
0.0 |
- |
0.9953 |
3600 |
0.0 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0
- Sentence Transformers: 3.2.1
- Transformers: 4.42.2
- PyTorch: 2.5.1+cu121
- Datasets: 3.1.0
- Tokenizers: 0.19.1
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}