wilfredomartel commited on
Commit
f64dba8
·
verified ·
1 Parent(s): 23be63c

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
2_Dense/config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "in_features": 768,
3
+ "out_features": 3072,
4
+ "bias": false,
5
+ "activation_function": "torch.nn.modules.linear.Identity"
6
+ }
2_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9ed7c12f6edeacab20637e728ad07eeaebd5b7736c531159d3ecd7426623d1d5
3
+ size 9437272
3_Dense/config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "in_features": 3072,
3
+ "out_features": 768,
4
+ "bias": false,
5
+ "activation_function": "torch.nn.modules.linear.Identity"
6
+ }
3_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:22701e632de59207cca0cb7e8f266e338693b2c9444d57540567b116f0e3c04c
3
+ size 9437272
README.md ADDED
@@ -0,0 +1,791 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - es
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - dense
10
+ - generated_from_trainer
11
+ - dataset_size:100000
12
+ - loss:CachedMultipleNegativesRankingLoss
13
+ base_model: google/embeddinggemma-300m
14
+ widget:
15
+ - source_sentence: ¿Cuál fue la decisión final de la Sala de Admisión de la Corte
16
+ Constitucional respecto a la acción extraordinaria de protección N°. 3349-18-EP
17
+ y cuál es la implicación de dicha decisión según la ley?
18
+ sentences:
19
+ - La Sala de Admisión de la Corte Constitucional resolvió INADMITIR a trámite la
20
+ acción extraordinaria de protección signada con el No. 3349-18-EP. Según lo dispuesto
21
+ en el antepenúltimo inciso del artículo 62 de la Ley Orgánica de Garantías Jurisdiccionales
22
+ y Control Constitucional, esta decisión de inadmisión no es susceptible de recurso
23
+ alguno y, por lo tanto, causa ejecutoria. En consecuencia, se procedió a notificar
24
+ el auto y a archivar la causa, sin que el fondo del asunto pueda ser revisado
25
+ por la Corte Constitucional.
26
+ - La Corte Constitucional inadmitió a trámite la acción extraordinaria de protección
27
+ N°. 0844-19-EP porque el fundamento de la demanda se sustentaba en la falta de
28
+ aplicación o errónea aplicación de la ley, específicamente en la interpretación
29
+ de los requisitos para la interposición del recurso de casación. El tribunal consideró
30
+ que el accionante pretendía que la Corte Constitucional verificara la observancia
31
+ de normativa infraconstitucional, lo cual corresponde a la justicia ordinaria
32
+ y no es el objeto de la acción extraordinaria de protección. Según el artículo
33
+ 62, numeral 4 de la Ley Orgánica de Garantías Jurisdiccionales y Control Constitucional
34
+ (LOGJCC), este tipo de fundamento desnaturaliza la acción. La Sala de Admisión,
35
+ al advertir esta situación, resolvió inadmitir la causa, determinando que la decisión
36
+ era definitiva e inapelable conforme al artículo 440 de la Constitución.
37
+ - La Sala de Admisión de la Corte Constitucional, mediante auto de 20 de junio de
38
+ 2019, resolvió negar el pedido de revocatoria presentado el 20 de mayo de 2019
39
+ por el señor Franklin Bayardo Guangaje Panches. Esta decisión confirmó lo previamente
40
+ dispuesto en los autos de 3 de abril y 2 de mayo de 2019, los cuales habían inadmitido
41
+ a trámite la acción extraordinaria de protección y negado la primera solicitud
42
+ de revocatoria, respectivamente. Adicionalmente, la Sala conminó al accionante
43
+ a litigar bajo los principios de buena fe y lealtad procesal, a acatar las disposiciones
44
+ de las autoridades competentes y a cumplir con el ordenamiento jurídico, amparándose
45
+ en lo establecido en los artículos 23 de la Ley Orgánica de Garantías Jurisdiccionales
46
+ y Control Constitucional, y los artículos 26 y 130, numeral 9, del Código Orgánico
47
+ de la Función Judicial. Finalmente, se dispuso notificar el auto, archivar la
48
+ causa y devolver el proceso de origen.
49
+ - source_sentence: ¿Cuál fue la decisión final de la Sala de Admisión de la Corte
50
+ Constitucional respecto a la acción extraordinaria de protección No. 3263-18-EP,
51
+ y qué implicaciones tiene dicha resolución en cuanto a la posibilidad de recurrirla?
52
+ sentences:
53
+ - La Sala de Admisión de la Corte Constitucional, tras analizar la demanda y los
54
+ requisitos de admisibilidad en el caso No. 3263-18-EP, resolvió INADMITIR a trámite
55
+ la acción extraordinaria de protección interpuesta por Carmen María Garrido Salazar.
56
+ Esta decisión se fundamentó en el incumplimiento de las causales de inadmisibilidad
57
+ establecidas en el artículo 62 de la Ley Orgánica de Garantías Jurisdiccionales
58
+ y Control Constitucional (LOGJCC), específicamente la falta de un argumento claro
59
+ sobre el derecho violado y su relación directa con la acción judicial, así como
60
+ el fundamento de la acción en la supuesta errónea aplicación de la ley. En consecuencia,
61
+ la Sala dispuso notificar el auto, archivar la causa y devolver el proceso al
62
+ juzgado de origen. La resolución emitida por la Sala de Admisión, de conformidad
63
+ con lo dispuesto en el artículo 62 de la LOGJCC y el artículo 23 de la Codificación
64
+ del Reglamento de Sustanciación de Procesos de Competencia de la Corte Constitucional,
65
+ no es susceptible de recurso alguno y causa ejecutoria, lo que significa que la
66
+ decisión es definitiva, vinculante y no puede ser impugnada posteriormente ante
67
+ ninguna otra instancia, concluyendo así el conocimiento de la Corte sobre este
68
+ asunto.
69
+ - La Corte Constitucional inadmitió la acción extraordinaria de protección No. 0597-10-EP
70
+ debido a que el accionante, Filemón Alberto Trujillo Macías, no cumplió con los
71
+ requisitos establecidos en el artículo 62 de la Ley Orgánica de Garantías Jurisdiccionales
72
+ y Control Constitucional. Específicamente, no demostró con argumentación clara
73
+ el derecho violado ni justificó la relevancia constitucional del problema jurídico
74
+ y de la pretensión. Además, la Corte determinó que la sentencia recurrida era
75
+ anterior a la vigencia de la Constitución de la República, contraviniendo la disposición
76
+ transitoria quinta de la Ley Orgánica de Garantías Jurisdiccionales y Control
77
+ Constitucional. La Sala de Admisión concluyó que la pretensión jurídica no se
78
+ ajustaba a los requisitos de esta acción excepcional, la cual no debe basarse
79
+ únicamente en consideraciones de injusticia o error en la sentencia, ni en la
80
+ falta de aplicación o errónea aplicación de la ley.
81
+ - La Corte Constitucional, en el caso 0200-11-EP, admite una acción extraordinaria
82
+ de protección cuando se cumplen requisitos formales y sustantivos específicos.
83
+ Según el artículo 437 de la Constitución, este recurso procede contra sentencias,
84
+ autos definitivos y resoluciones con fuerza de sentencia, siempre que se trate
85
+ de resoluciones firmes o ejecutoriadas. Crucialmente, el recurrente debe demostrar
86
+ que durante el juzgamiento se violó, por acción u omisión, el debido proceso u
87
+ otros derechos reconocidos en la Constitución. El artículo 62 de la Ley Orgánica
88
+ de Garantías Jurisdiccionales y Control Constitucional detalla que la demanda
89
+ debe fundamentarse en la violación de derechos constitucionales, y no meramente
90
+ en la apreciación de la prueba por parte del juzgador. En este caso particular,
91
+ la Sala de Admisión de la Corte Constitucional determinó que el accionante no
92
+ argumentó de manera clara los derechos vulnerados ni la relación directa e inmediata
93
+ con la autoridad judicial, limitándose a narrar hechos y pretender una revisión
94
+ de la jurisprudencia aplicada por la Sala de Casación, lo cual excede las atribuciones
95
+ de la Corte Constitucional.
96
+ - source_sentence: ¿En qué circunstancias la Corte Constitucional inadmitió la acción
97
+ extraordinaria de protección N°. 0706-19-EP interpuesta por Verónica Nataly Chicaiza
98
+ Chicaiza contra los autos de archivo y negativa de revocatoria de una investigación
99
+ penal?
100
+ sentences:
101
+ - La Corte Constitucional inadmitió la acción extraordinaria de protección No. 0565-09-EP
102
+ porque la accionante, Rosa Elena López Aguilar, no cumplió con los requisitos
103
+ de procedibilidad establecidos en la normativa constitucional y en las Reglas
104
+ de Procedimiento para el Ejercicio de las Competencias de la Corte Constitucional
105
+ para el Período de Transición. Específicamente, la accionante no mencionó de manera
106
+ concreta cuál era la actuación judicial con carácter de auto definitivo o sentencia
107
+ que impugnaba, ni justificó la violación de derechos constitucionales. Además,
108
+ la acción se presentó contra un particular (su hermano), cuando la acción extraordinaria
109
+ de protección está destinada a vigilar el cumplimiento de derechos constitucionales
110
+ en las actuaciones de quienes ejercen potestad jurisdiccional en la justicia ordinaria,
111
+ no contra particulares. Por lo tanto, la Sala de Admisión determinó que la demanda
112
+ no cumplía con los requisitos formales y de fondo para su trámite.
113
+ - Lino Zenen Barahona Barahona fue declarado penalmente responsable en calidad de
114
+ autor directo del delito de violencia psicológica contra la mujer. La tipificación
115
+ específica de este delito se encuentra en el numeral 3 del artículo 157 del Código
116
+ Orgánico Integral Penal (COIP). En cuanto a la sanción, el tribunal de garantías
117
+ penales con sede en el cantón Milagro le impuso una pena privativa de la libertad
118
+ de un año. Esta sentencia de primera instancia fue emitida el 15 de julio de 2016.
119
+ - La Corte Constitucional inadmitió la acción extraordinaria de protección N°. 0706-19-EP,
120
+ presentada por Verónica Nataly Chicaiza Chicaiza, debido a que la acción se dirigía
121
+ contra autos que no tenían el carácter de definitivos. Específicamente, se trataba
122
+ del auto que ordenó el archivo de una investigación previa y de la resolución
123
+ que negó la revocatoria de dicho auto. Según el artículo 58 de la Ley Orgánica
124
+ de Garantías Jurisdiccionales y Control Constitucional, la acción extraordinaria
125
+ de protección procede contra sentencias o autos definitivos que violen derechos
126
+ constitucionales. El auto de archivo de una investigación previa, conforme al
127
+ artículo 586 del Código Orgánico Integral Penal, no es una decisión final, ya
128
+ que el fiscal puede solicitar su reapertura si surgen nuevos elementos. Por lo
129
+ tanto, al no cumplirse el requisito de que la acción se interponga contra una
130
+ resolución definitiva, la Corte Constitucional determinó su incompetencia para
131
+ tramitar el caso.
132
+ - source_sentence: ¿Cuál fue la razón principal por la que la Sala de Admisión de
133
+ la Corte Constitucional inadmitió la acción extraordinaria de protección N°. 2398-19-EP
134
+ presentada por Juan Cornelio Valencia Pérez?
135
+ sentences:
136
+ - La Sala de Admisión de la Corte Constitucional inadmitió la acción extraordinaria
137
+ de protección N°. 2398-19-EP, presentada por Juan Cornelio Valencia Pérez, debido
138
+ a que la demanda incumplía el requisito de que el fundamento de la acción no se
139
+ agotara solamente en lo injusto o equivocado de la sentencia, conforme lo estipula
140
+ el numeral 3 del artículo 62 de la Ley Orgánica de Garantías Jurisdiccionales
141
+ y Control Constitucional. Específicamente, el accionante basaba su inconformidad
142
+ en el razonamiento y la decisión de los jueces del Tribunal Distrital de lo Contencioso
143
+ Administrativo que declararon la caducidad del derecho para reclamar la responsabilidad
144
+ objetiva del Estado. La Corte enfatizó que la acción extraordinaria de protección
145
+ tiene como objeto garantizar la protección de los derechos constitucionales y
146
+ el debido proceso en autos definitivos, pero no actúa como una instancia adicional
147
+ para revisar la apreciación de hechos, pruebas o derecho ordinario por parte de
148
+ los jueces.
149
+ - La Corte Constitucional inadmitió la acción extraordinaria de protección N°. 2623-19-EP,
150
+ presentada por Julián Andrés Neumann Viteri, debido a que el fundamento de la
151
+ acción no se sustentaba en la vulneración de derechos constitucionales con una
152
+ relación causal clara e inmediata con el accionar de la autoridad judicial. Específicamente,
153
+ se determinó que los reparos del accionante se centraban en la supuesta errónea
154
+ aplicación del artículo 220 del Código Orgánico Integral Penal y en la inconformidad
155
+ con la valoración de las pruebas por parte de la Sala Especializada de lo Penal
156
+ Militar, Penal Policial y Tránsito de la Corte Nacional de Justicia. Según el
157
+ numeral 1 del artículo 62 de la Ley Orgánica de Garantías Jurisdiccionales y Control
158
+ Constitucional (LOGJCC), la acción debe contener un argumento claro sobre el derecho
159
+ violado y su relación con la autoridad judicial, independientemente de los hechos
160
+ del proceso penal. Asimismo, las causales 4 y 5 del mismo artículo establecen
161
+ que no son admisibles las acciones cuyo fundamento se base en la falta o errónea
162
+ aplicación de la ley, o en la apreciación de la prueba por parte del juzgador.
163
+ Por estas razones, la acción fue inadmitida.
164
+ - La Corte Constitucional del Ecuador inadmitió a trámite la acción extraordinaria
165
+ de protección N° 1897-19-EP, presentada por el señor Segundo Luis Aurelio Contreras
166
+ Urgiles, debido a que el accionante incumplió una condición de admisibilidad fundamental.
167
+ Específicamente, el numeral 1 del artículo 62 de la Ley Orgánica de Garantías
168
+ Jurisdiccionales y Control Constitucional exige la existencia de un argumento
169
+ claro que relacione la vulneración de un derecho con la actuación judicial impugnada.
170
+ En este caso, si bien el señor Contreras Urgiles impugnó el auto de 5 de junio
171
+ de 2019 emitido por el Tribunal Distrital de lo Contencioso Administrativo, no
172
+ atribuyó a dicho auto la vulneración de los derechos a la tutela judicial efectiva,
173
+ debido proceso (garantía de motivación) y seguridad jurídica que alegaba. La demanda
174
+ se centraba reiteradamente en las actuaciones previas del Servicio Nacional de
175
+ Aduana del Ecuador y en un acto administrativo de esta entidad, pero no estableció
176
+ un nexo directo e inmediato entre el auto judicial y las supuestas violaciones
177
+ constitucionales. Por esta razón, la Sala de Admisión, al no encontrar la debida
178
+ fundamentación en la conexión entre la actuación judicial y los derechos vulnerados,
179
+ procedió a la inadmisión de la causa.
180
+ - source_sentence: ¿En qué fecha y ante qué instancia judicial se presentó originalmente
181
+ la demanda de acción de protección por parte de Martha Luzmila Mayta Zapata y
182
+ Angelito González Medina contra el Ministerio de Inclusión Económica, y cuáles
183
+ fueron los memorandos impugnados?
184
+ sentences:
185
+ - La demanda de acción de protección por parte de Martha Luzmila Mayta Zapata y
186
+ Angelito González Medina contra el Ministerio de Inclusión Económica se presentó
187
+ el 11 de marzo de 2019. La instancia judicial ante la cual se interpuso fue la
188
+ Unidad Judicial Multicompetente Penal de Zamora. En su demanda, los accionantes
189
+ impugnaron específicamente los memorandos MIES-CZ-7-2019-1422-M y MIES-CZ-7-2019-1423-M.
190
+ Estos memorandos fueron la base para que el Ministerio de Inclusión Económica
191
+ diera por terminada unilateralmente la relación laboral que mantenían los señores
192
+ Mayta Zapata y González Medina con dicha entidad.
193
+ - La pretensión específica de Isauro Apolo López Feijo al presentar la acción por
194
+ incumplimiento No. 0060-09-AN ante la Corte Constitucional era obtener el cumplimiento
195
+ efectivo de la Resolución No. 0263-07-RA, emitida por la Tercera Sala del ex Tribunal
196
+ Constitucional. Concretamente, solicitaba que la Corte ordenara a la autoridad
197
+ correspondiente su restitución al cargo de Inspector Agropecuario profesional
198
+ 1 en la Agencia Ecuatoriana de Aseguramiento de la Calidad del Agro "AGROCALIDAD",
199
+ la emisión de la acción de personal y el respectivo nombramiento desde la fecha
200
+ en que fue apartado de la institución, y el pago de las remuneraciones dejadas
201
+ de percibir.
202
+ - La Corte Constitucional inadmitió la acción extraordinaria de protección No. 1331-11-EP,
203
+ presentada por César Regalado Iglesias, Gerente General de la CNT EP, debido a
204
+ que la pretensión jurídica del accionante no se ajustaba a los requisitos establecidos
205
+ en la Ley Orgánica de Garantías Jurisdiccionales y Control Constitucional. Específicamente,
206
+ la Sala de Admisión determinó que no se cumplían los presupuestos del artículo
207
+ 62, numerales 3 y 8 de dicha ley. El numeral 3 establece que el fundamento de
208
+ la acción no debe agotarse únicamente en la consideración de lo injusto o equivocado
209
+ de la sentencia. El numeral 8 indica que la admisión del recurso extraordinario
210
+ de protección debe permitir solventar una violación grave de derechos, establecer
211
+ precedentes judiciales, corregir la inobservancia de precedentes de la Corte Constitucional
212
+ o sentenciar sobre asuntos de relevancia nacional. En este caso, la pretensión
213
+ del accionante era dejar sin efecto la sentencia de la Segunda Sala de lo Penal
214
+ y Tránsito de la Corte Provincial del Guayas, lo cual implicaba someter a debate
215
+ constitucional aspectos ya analizados en el proceso de acción de protección, sin
216
+ demostrar una violación grave de derechos o la necesidad de establecer un precedente.
217
+ datasets:
218
+ - wilfredomartel/rvzrtx600k20250828
219
+ pipeline_tag: sentence-similarity
220
+ library_name: sentence-transformers
221
+ metrics:
222
+ - cosine_accuracy@1
223
+ - cosine_accuracy@3
224
+ - cosine_accuracy@5
225
+ - cosine_accuracy@10
226
+ - cosine_precision@1
227
+ - cosine_precision@3
228
+ - cosine_precision@5
229
+ - cosine_precision@10
230
+ - cosine_recall@1
231
+ - cosine_recall@3
232
+ - cosine_recall@5
233
+ - cosine_recall@10
234
+ - cosine_ndcg@10
235
+ - cosine_mrr@10
236
+ - cosine_map@100
237
+ model-index:
238
+ - name: EmbeddingGemma-300m trained on 100k Legal Spanish Retrieval Dataset.
239
+ results:
240
+ - task:
241
+ type: information-retrieval
242
+ name: Information Retrieval
243
+ dataset:
244
+ name: legal spanish eval 10kq 10kd
245
+ type: legal-spanish-eval-10kq-10kd
246
+ metrics:
247
+ - type: cosine_accuracy@1
248
+ value: 0.455
249
+ name: Cosine Accuracy@1
250
+ - type: cosine_accuracy@3
251
+ value: 0.9713
252
+ name: Cosine Accuracy@3
253
+ - type: cosine_accuracy@5
254
+ value: 0.9881
255
+ name: Cosine Accuracy@5
256
+ - type: cosine_accuracy@10
257
+ value: 0.994
258
+ name: Cosine Accuracy@10
259
+ - type: cosine_precision@1
260
+ value: 0.455
261
+ name: Cosine Precision@1
262
+ - type: cosine_precision@3
263
+ value: 0.3237666666666666
264
+ name: Cosine Precision@3
265
+ - type: cosine_precision@5
266
+ value: 0.19762000000000002
267
+ name: Cosine Precision@5
268
+ - type: cosine_precision@10
269
+ value: 0.09940000000000002
270
+ name: Cosine Precision@10
271
+ - type: cosine_recall@1
272
+ value: 0.455
273
+ name: Cosine Recall@1
274
+ - type: cosine_recall@3
275
+ value: 0.9713
276
+ name: Cosine Recall@3
277
+ - type: cosine_recall@5
278
+ value: 0.9881
279
+ name: Cosine Recall@5
280
+ - type: cosine_recall@10
281
+ value: 0.994
282
+ name: Cosine Recall@10
283
+ - type: cosine_ndcg@10
284
+ value: 0.7878992891637517
285
+ name: Cosine Ndcg@10
286
+ - type: cosine_mrr@10
287
+ value: 0.7155972222222212
288
+ name: Cosine Mrr@10
289
+ - type: cosine_map@100
290
+ value: 0.7159046238160348
291
+ name: Cosine Map@100
292
+ - type: cosine_accuracy@1
293
+ value: 0.455
294
+ name: Cosine Accuracy@1
295
+ - type: cosine_accuracy@3
296
+ value: 0.9713
297
+ name: Cosine Accuracy@3
298
+ - type: cosine_accuracy@5
299
+ value: 0.9881
300
+ name: Cosine Accuracy@5
301
+ - type: cosine_accuracy@10
302
+ value: 0.994
303
+ name: Cosine Accuracy@10
304
+ - type: cosine_precision@1
305
+ value: 0.455
306
+ name: Cosine Precision@1
307
+ - type: cosine_precision@3
308
+ value: 0.3237666666666666
309
+ name: Cosine Precision@3
310
+ - type: cosine_precision@5
311
+ value: 0.19762000000000002
312
+ name: Cosine Precision@5
313
+ - type: cosine_precision@10
314
+ value: 0.09940000000000002
315
+ name: Cosine Precision@10
316
+ - type: cosine_recall@1
317
+ value: 0.455
318
+ name: Cosine Recall@1
319
+ - type: cosine_recall@3
320
+ value: 0.9713
321
+ name: Cosine Recall@3
322
+ - type: cosine_recall@5
323
+ value: 0.9881
324
+ name: Cosine Recall@5
325
+ - type: cosine_recall@10
326
+ value: 0.994
327
+ name: Cosine Recall@10
328
+ - type: cosine_ndcg@10
329
+ value: 0.7878992891637517
330
+ name: Cosine Ndcg@10
331
+ - type: cosine_mrr@10
332
+ value: 0.7155972222222212
333
+ name: Cosine Mrr@10
334
+ - type: cosine_map@100
335
+ value: 0.7159046238160348
336
+ name: Cosine Map@100
337
+ ---
338
+
339
+ # EmbeddingGemma-300m trained on 100k Legal Spanish Retrieval Dataset.
340
+
341
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [google/embeddinggemma-300m](https://huggingface.co/google/embeddinggemma-300m) on the [rvzrtx600k20250828](https://huggingface.co/datasets/wilfredomartel/rvzrtx600k20250828) dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
342
+
343
+ ## Model Details
344
+
345
+ ### Model Description
346
+ - **Model Type:** Sentence Transformer
347
+ - **Base model:** [google/embeddinggemma-300m](https://huggingface.co/google/embeddinggemma-300m) <!-- at revision c5cfa06e5e282a820e85d57f7fb053207494f41d -->
348
+ - **Maximum Sequence Length:** 2048 tokens
349
+ - **Output Dimensionality:** 768 dimensions
350
+ - **Similarity Function:** Cosine Similarity
351
+ - **Training Dataset:**
352
+ - [rvzrtx600k20250828](https://huggingface.co/datasets/wilfredomartel/rvzrtx600k20250828)
353
+ - **Language:** es
354
+ - **License:** apache-2.0
355
+
356
+ ### Model Sources
357
+
358
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
359
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
360
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
361
+
362
+ ### Full Model Architecture
363
+
364
+ ```
365
+ SentenceTransformer(
366
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'Gemma3TextModel'})
367
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
368
+ (2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
369
+ (3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
370
+ (4): Normalize()
371
+ )
372
+ ```
373
+
374
+ ## Usage
375
+
376
+ ### Direct Usage (Sentence Transformers)
377
+
378
+ First install the Sentence Transformers library:
379
+
380
+ ```bash
381
+ pip install -U sentence-transformers
382
+ ```
383
+
384
+ Then you can load this model and run inference.
385
+ ```python
386
+ from sentence_transformers import SentenceTransformer
387
+
388
+ # Download from the 🤗 Hub
389
+ model = SentenceTransformer("wilfredomartel/embeddinggemma-300m-legal-spanish-100k")
390
+ # Run inference
391
+ queries = [
392
+ "\u00bfEn qu\u00e9 fecha y ante qu\u00e9 instancia judicial se present\u00f3 originalmente la demanda de acci\u00f3n de protecci\u00f3n por parte de Martha Luzmila Mayta Zapata y Angelito Gonz\u00e1lez Medina contra el Ministerio de Inclusi\u00f3n Econ\u00f3mica, y cu\u00e1les fueron los memorandos impugnados?",
393
+ ]
394
+ documents = [
395
+ 'La demanda de acción de protección por parte de Martha Luzmila Mayta Zapata y Angelito González Medina contra el Ministerio de Inclusión Económica se presentó el 11 de marzo de 2019. La instancia judicial ante la cual se interpuso fue la Unidad Judicial Multicompetente Penal de Zamora. En su demanda, los accionantes impugnaron específicamente los memorandos MIES-CZ-7-2019-1422-M y MIES-CZ-7-2019-1423-M. Estos memorandos fueron la base para que el Ministerio de Inclusión Económica diera por terminada unilateralmente la relación laboral que mantenían los señores Mayta Zapata y González Medina con dicha entidad.',
396
+ 'La Corte Constitucional inadmitió la acción extraordinaria de protección No. 1331-11-EP, presentada por César Regalado Iglesias, Gerente General de la CNT EP, debido a que la pretensión jurídica del accionante no se ajustaba a los requisitos establecidos en la Ley Orgánica de Garantías Jurisdiccionales y Control Constitucional. Específicamente, la Sala de Admisión determinó que no se cumplían los presupuestos del artículo 62, numerales 3 y 8 de dicha ley. El numeral 3 establece que el fundamento de la acción no debe agotarse únicamente en la consideración de lo injusto o equivocado de la sentencia. El numeral 8 indica que la admisión del recurso extraordinario de protección debe permitir solventar una violación grave de derechos, establecer precedentes judiciales, corregir la inobservancia de precedentes de la Corte Constitucional o sentenciar sobre asuntos de relevancia nacional. En este caso, la pretensión del accionante era dejar sin efecto la sentencia de la Segunda Sala de lo Penal y Tránsito de la Corte Provincial del Guayas, lo cual implicaba someter a debate constitucional aspectos ya analizados en el proceso de acción de protección, sin demostrar una violación grave de derechos o la necesidad de establecer un precedente.',
397
+ 'La pretensión específica de Isauro Apolo López Feijo al presentar la acción por incumplimiento No. 0060-09-AN ante la Corte Constitucional era obtener el cumplimiento efectivo de la Resolución No. 0263-07-RA, emitida por la Tercera Sala del ex Tribunal Constitucional. Concretamente, solicitaba que la Corte ordenara a la autoridad correspondiente su restitución al cargo de Inspector Agropecuario profesional 1 en la Agencia Ecuatoriana de Aseguramiento de la Calidad del Agro "AGROCALIDAD", la emisión de la acción de personal y el respectivo nombramiento desde la fecha en que fue apartado de la institución, y el pago de las remuneraciones dejadas de percibir.',
398
+ ]
399
+ query_embeddings = model.encode_query(queries)
400
+ document_embeddings = model.encode_document(documents)
401
+ print(query_embeddings.shape, document_embeddings.shape)
402
+ # [1, 768] [3, 768]
403
+
404
+ # Get the similarity scores for the embeddings
405
+ similarities = model.similarity(query_embeddings, document_embeddings)
406
+ print(similarities)
407
+ # tensor([[0.8918, 0.0548, 0.0770]])
408
+ ```
409
+
410
+ <!--
411
+ ### Direct Usage (Transformers)
412
+
413
+ <details><summary>Click to see the direct usage in Transformers</summary>
414
+
415
+ </details>
416
+ -->
417
+
418
+ <!--
419
+ ### Downstream Usage (Sentence Transformers)
420
+
421
+ You can finetune this model on your own dataset.
422
+
423
+ <details><summary>Click to expand</summary>
424
+
425
+ </details>
426
+ -->
427
+
428
+ <!--
429
+ ### Out-of-Scope Use
430
+
431
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
432
+ -->
433
+
434
+ ## Evaluation
435
+
436
+ ### Metrics
437
+
438
+ #### Information Retrieval
439
+
440
+ * Dataset: `legal-spanish-eval-10kq-10kd`
441
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
442
+
443
+ | Metric | Value |
444
+ |:--------------------|:-----------|
445
+ | cosine_accuracy@1 | 0.455 |
446
+ | cosine_accuracy@3 | 0.9713 |
447
+ | cosine_accuracy@5 | 0.9881 |
448
+ | cosine_accuracy@10 | 0.994 |
449
+ | cosine_precision@1 | 0.455 |
450
+ | cosine_precision@3 | 0.3238 |
451
+ | cosine_precision@5 | 0.1976 |
452
+ | cosine_precision@10 | 0.0994 |
453
+ | cosine_recall@1 | 0.455 |
454
+ | cosine_recall@3 | 0.9713 |
455
+ | cosine_recall@5 | 0.9881 |
456
+ | cosine_recall@10 | 0.994 |
457
+ | **cosine_ndcg@10** | **0.7879** |
458
+ | cosine_mrr@10 | 0.7156 |
459
+ | cosine_map@100 | 0.7159 |
460
+
461
+ #### Information Retrieval
462
+
463
+ * Dataset: `legal-spanish-eval-10kq-10kd`
464
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
465
+
466
+ | Metric | Value |
467
+ |:--------------------|:-----------|
468
+ | cosine_accuracy@1 | 0.455 |
469
+ | cosine_accuracy@3 | 0.9713 |
470
+ | cosine_accuracy@5 | 0.9881 |
471
+ | cosine_accuracy@10 | 0.994 |
472
+ | cosine_precision@1 | 0.455 |
473
+ | cosine_precision@3 | 0.3238 |
474
+ | cosine_precision@5 | 0.1976 |
475
+ | cosine_precision@10 | 0.0994 |
476
+ | cosine_recall@1 | 0.455 |
477
+ | cosine_recall@3 | 0.9713 |
478
+ | cosine_recall@5 | 0.9881 |
479
+ | cosine_recall@10 | 0.994 |
480
+ | **cosine_ndcg@10** | **0.7879** |
481
+ | cosine_mrr@10 | 0.7156 |
482
+ | cosine_map@100 | 0.7159 |
483
+
484
+ <!--
485
+ ## Bias, Risks and Limitations
486
+
487
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
488
+ -->
489
+
490
+ <!--
491
+ ### Recommendations
492
+
493
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
494
+ -->
495
+
496
+ ## Training Details
497
+
498
+ ### Training Dataset
499
+
500
+ #### rvzrtx600k20250828
501
+
502
+ * Dataset: [rvzrtx600k20250828](https://huggingface.co/datasets/wilfredomartel/rvzrtx600k20250828) at [2f52ccc](https://huggingface.co/datasets/wilfredomartel/rvzrtx600k20250828/tree/2f52ccc93b4911c67f4fb4dfadaeb3d6199156b5)
503
+ * Size: 100,000 training samples
504
+ * Columns: <code>query</code> and <code>pos</code>
505
+ * Approximate statistics based on the first 1000 samples:
506
+ | | query | pos |
507
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
508
+ | type | string | string |
509
+ | details | <ul><li>min: 23 tokens</li><li>mean: 54.38 tokens</li><li>max: 94 tokens</li></ul> | <ul><li>min: 81 tokens</li><li>mean: 213.07 tokens</li><li>max: 459 tokens</li></ul> |
510
+ * Samples:
511
+ | query | pos |
512
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
513
+ | <code>¿Cuál fue la razón principal por la que la Corte Constitucional inadmitió a trámite la acción extraordinaria de protección N° 2850-19-EP, presentada por Javier Jefferson Delgado Guano y otros contra la sentencia de la Sala Única Multicompetente de la Corte Provincial de Esmeraldas?</code> | <code>La Corte Constitucional inadmitió a trámite la acción extraordinaria de protección N° 2850-19-EP debido a que los accionantes no presentaron un argumento claro sobre los derechos supuestamente violados ni la relación directa e inmediata, por acción u omisión, de la Sala Única Multicompetente de la Corte Provincial de Esmeraldas con dicha vulneración. Esta omisión constituye la causal de inadmisión establecida en el artículo 62, numeral 1 de la Ley Orgánica de Garantías Jurisdiccionales y Control Constitucional (LOGJCC), que exige un argumento claro sobre el derecho violado y su nexo directo con la actuación de la autoridad judicial. Específicamente, el párrafo 10 del documento indica que los accionantes vierten sus argumentos respecto a la Resolución del Consejo de Disciplina No. 001-2018, sancionándolos por una falta militar, pero no establecen de forma precisa cómo la sentencia de la Corte Provincial de Esmeraldas del 12 de agosto de 2019 vulneró sus derechos constitucionales.</code> |
514
+ | <code>¿Por qué la Sala de Admisión de la Corte Constitucional inadmitió a trámite la acción extraordinaria de protección N°. 3090-19-EP presentada por José Antonio Guzñay contra la sentencia de la Corte Provincial de Zamora?</code> | <code>La Sala de Admisión de la Corte Constitucional inadmitió a trámite la acción extraordinaria de protección N°. 3090-19-EP, presentada por el señor José Antonio Guzñay, debido a que el accionante incumplió el requisito establecido en el artículo 62, numeral 1, de la Ley Orgánica de Garantías Jurisdiccionales y Control Constitucional. Este precepto exige que exista un argumento claro sobre el derecho violado y la relación directa e inmediata, por acción u omisión de la autoridad judicial, con la vulneración alegada. En el caso concreto, el señor Guzñay, si bien impugnaba la sentencia emitida por la Sala Única Multicompetente de la Corte Provincial de Justicia de Zamora del 02 de octubre de 2019, no expuso argumentos claros y directos sobre la actuación específica de los jueces de dicha Sala y cómo esta se relacionaba con la presunta vulneración de sus derechos a la tutela judicial efectiva, debido proceso y seguridad jurídica. En su lugar, la demanda se centró en argumentar que la decisió...</code> |
515
+ | <code>¿Cuál fue la controversia principal en el caso N°. 3090-19-EP y cómo evolucionaron las decisiones judiciales en las instancias inferiores antes de llegar a la Corte Constitucional?</code> | <code>La controversia principal en el caso N°. 3090-19-EP radicó en la terminación unilateral del contrato de trabajo indefinido del señor José Antonio Guzñay por parte del Gobierno Autónomo Descentralizado Municipal del cantón Centinela del Cóndor. El accionante alegó que esta decisión, notificada mediante oficio N° 109-SG-GADCCC-2019, vulneró sus derechos constitucionales al trabajo, a la seguridad jurídica y al debido proceso. Inicialmente, la Unidad Judicial Multicompetente con sede en Centinela del Cóndor, mediante sentencia del 29 de agosto de 2019, declaró la vulneración de estos derechos, ordenando la restitución inmediata del accionante a su labor y el pago de los haberes dejados de percibir. Sin embargo, esta decisión fue apelada por el Alcalde y Procurador Síndico del GAD Municipal. La Sala Única Multicompetente de la Corte Provincial de Justicia de Zamora, al conocer el recurso de apelación, revocó la sentencia de primera instancia y rechazó la acción de protección por improceden...</code> |
516
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
517
+ ```json
518
+ {
519
+ "scale": 20.0,
520
+ "similarity_fct": "cos_sim",
521
+ "mini_batch_size": 8,
522
+ "gather_across_devices": false
523
+ }
524
+ ```
525
+
526
+ ### Evaluation Dataset
527
+
528
+ #### rvzrtx600k20250828
529
+
530
+ * Dataset: [rvzrtx600k20250828](https://huggingface.co/datasets/wilfredomartel/rvzrtx600k20250828) at [2f52ccc](https://huggingface.co/datasets/wilfredomartel/rvzrtx600k20250828/tree/2f52ccc93b4911c67f4fb4dfadaeb3d6199156b5)
531
+ * Size: 10,000 evaluation samples
532
+ * Columns: <code>query</code> and <code>pos</code>
533
+ * Approximate statistics based on the first 1000 samples:
534
+ | | query | pos |
535
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
536
+ | type | string | string |
537
+ | details | <ul><li>min: 25 tokens</li><li>mean: 55.31 tokens</li><li>max: 94 tokens</li></ul> | <ul><li>min: 78 tokens</li><li>mean: 219.05 tokens</li><li>max: 472 tokens</li></ul> |
538
+ * Samples:
539
+ | query | pos |
540
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
541
+ | <code>¿Sobre qué inmueble se declaró el derecho de dominio a favor del Señor Diomedes Hernán Santana Delgado en el juicio ordinario de prescripción extraordinaria adquisitiva de dominio No. 892-2009, y qué instancia judicial confirmó esta decisión antes de llegar a la Corte Constitucional?</code> | <code>El derecho de dominio sobre el inmueble ubicado en la Urbanización Umiña II fue declarado a favor del Señor Diomedes Hernán Santana Delgado en el juicio ordinario de prescripción extraordinaria adquisitiva de dominio No. 892-2009. La sentencia dictada por el Juez de Primer Nivel, que acogió la demanda y declaró el derecho de dominio, fue posteriormente confirmada por la Sala de lo Civil de la Corte Provincial de Justicia de Manabí mediante sentencia de 4 de agosto de 2009. Esta decisión de la Corte Provincial fue la que, a su vez, la Sala de lo Civil, Mercantil y Familia de la Corte Nacional de Justicia resolvió no casar en su sentencia de 31 de mayo de 2011, dentro del mismo proceso.</code> |
542
+ | <code>¿Cuál fue la decisión de la Sala de Admisión de la Corte Constitucional respecto a la acción extraordinaria de protección No. 1224-11-EP presentada por Freddy Aníbal Bastidas Serrano en contra de una sentencia de la Corte Provincial de Sucumbíos?</code> | <code>La Sala de Admisión de la Corte Constitucional, conformada por los jueces Ruth Seni Pinoargote, Edgar Zarate Zarate y Hernando Morales Vinueza, avocó conocimiento de la causa No. 1224-11-EP. Esta acción extraordinaria de protección fue presentada por Freddy Aníbal Bastidas Serrano, actuando como Procurador Judicial de los Empleados del Gobierno Autónomo Descentralizado de la Provincia de Sucumbíos, contra una sentencia emitida por la Sala Única de la Corte Provincial de Justicia de Sucumbíos el 16 de junio de 2011. La sentencia de la Corte Provincial revocó la decisión de primera instancia que había aceptado una acción de protección, la cual beneficiaba a los empleados en relación con el pago de la diferencia de fondos de reserva de los años 2004, 2005, 2006 y 2007. El accionante alegaba la vulneración de sus derechos a la igualdad formal, material y no discriminatoria, a la tutela judicial efectiva, al debido proceso y a la seguridad jurídica, consagrados en los artículos 66 numeral 4...</code> |
543
+ | <code>¿Qué derechos fundamentales alegó Robin Marcelo Espinoza Salas que fueron vulnerados por el auto que inadmitió su recurso de casación, y cuál fue la pretensión principal inferida de su demanda?</code> | <code>Robin Marcelo Espinoza Salas, en su acción extraordinaria de protección N° 2933-18-EP, alegó la vulneración de sus derechos constitucionales a la tutela judicial efectiva, consagrado en el artículo 75 de la Constitución de la República del Ecuador, y al debido proceso, específicamente en la garantía de asegurar el cumplimiento de las normas y derechos de las partes, reconocido en el numeral 1 del artículo 76 de la misma Carta Magna. La pretensión principal, inferida de la lectura integral de su demanda, radicaba en que la Corte Constitucional declarara la existencia de dichas vulneraciones por parte del auto que inadmitió su recurso de casación, argumentando que la decisión se basó en cargas procesales y no en un análisis de fondo de las posibles infracciones legales.</code> |
544
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
545
+ ```json
546
+ {
547
+ "scale": 20.0,
548
+ "similarity_fct": "cos_sim",
549
+ "mini_batch_size": 8,
550
+ "gather_across_devices": false
551
+ }
552
+ ```
553
+
554
+ ### Training Hyperparameters
555
+ #### Non-Default Hyperparameters
556
+
557
+ - `eval_strategy`: steps
558
+ - `per_device_train_batch_size`: 128
559
+ - `per_device_eval_batch_size`: 128
560
+ - `learning_rate`: 2e-05
561
+ - `num_train_epochs`: 1
562
+ - `warmup_ratio`: 0.1
563
+ - `fp16`: True
564
+ - `prompts`: {'query': 'task: search result | query: ', 'pos': 'title: none | text: '}
565
+ - `batch_sampler`: no_duplicates
566
+
567
+ #### All Hyperparameters
568
+ <details><summary>Click to expand</summary>
569
+
570
+ - `overwrite_output_dir`: False
571
+ - `do_predict`: False
572
+ - `eval_strategy`: steps
573
+ - `prediction_loss_only`: True
574
+ - `per_device_train_batch_size`: 128
575
+ - `per_device_eval_batch_size`: 128
576
+ - `per_gpu_train_batch_size`: None
577
+ - `per_gpu_eval_batch_size`: None
578
+ - `gradient_accumulation_steps`: 1
579
+ - `eval_accumulation_steps`: None
580
+ - `torch_empty_cache_steps`: None
581
+ - `learning_rate`: 2e-05
582
+ - `weight_decay`: 0.0
583
+ - `adam_beta1`: 0.9
584
+ - `adam_beta2`: 0.999
585
+ - `adam_epsilon`: 1e-08
586
+ - `max_grad_norm`: 1.0
587
+ - `num_train_epochs`: 1
588
+ - `max_steps`: -1
589
+ - `lr_scheduler_type`: linear
590
+ - `lr_scheduler_kwargs`: {}
591
+ - `warmup_ratio`: 0.1
592
+ - `warmup_steps`: 0
593
+ - `log_level`: passive
594
+ - `log_level_replica`: warning
595
+ - `log_on_each_node`: True
596
+ - `logging_nan_inf_filter`: True
597
+ - `save_safetensors`: True
598
+ - `save_on_each_node`: False
599
+ - `save_only_model`: False
600
+ - `restore_callback_states_from_checkpoint`: False
601
+ - `no_cuda`: False
602
+ - `use_cpu`: False
603
+ - `use_mps_device`: False
604
+ - `seed`: 42
605
+ - `data_seed`: None
606
+ - `jit_mode_eval`: False
607
+ - `use_ipex`: False
608
+ - `bf16`: False
609
+ - `fp16`: True
610
+ - `fp16_opt_level`: O1
611
+ - `half_precision_backend`: auto
612
+ - `bf16_full_eval`: False
613
+ - `fp16_full_eval`: False
614
+ - `tf32`: None
615
+ - `local_rank`: 0
616
+ - `ddp_backend`: None
617
+ - `tpu_num_cores`: None
618
+ - `tpu_metrics_debug`: False
619
+ - `debug`: []
620
+ - `dataloader_drop_last`: False
621
+ - `dataloader_num_workers`: 0
622
+ - `dataloader_prefetch_factor`: None
623
+ - `past_index`: -1
624
+ - `disable_tqdm`: False
625
+ - `remove_unused_columns`: True
626
+ - `label_names`: None
627
+ - `load_best_model_at_end`: False
628
+ - `ignore_data_skip`: False
629
+ - `fsdp`: []
630
+ - `fsdp_min_num_params`: 0
631
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
632
+ - `fsdp_transformer_layer_cls_to_wrap`: None
633
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
634
+ - `parallelism_config`: None
635
+ - `deepspeed`: None
636
+ - `label_smoothing_factor`: 0.0
637
+ - `optim`: adamw_torch_fused
638
+ - `optim_args`: None
639
+ - `adafactor`: False
640
+ - `group_by_length`: False
641
+ - `length_column_name`: length
642
+ - `ddp_find_unused_parameters`: None
643
+ - `ddp_bucket_cap_mb`: None
644
+ - `ddp_broadcast_buffers`: False
645
+ - `dataloader_pin_memory`: True
646
+ - `dataloader_persistent_workers`: False
647
+ - `skip_memory_metrics`: True
648
+ - `use_legacy_prediction_loop`: False
649
+ - `push_to_hub`: False
650
+ - `resume_from_checkpoint`: None
651
+ - `hub_model_id`: None
652
+ - `hub_strategy`: every_save
653
+ - `hub_private_repo`: None
654
+ - `hub_always_push`: False
655
+ - `hub_revision`: None
656
+ - `gradient_checkpointing`: False
657
+ - `gradient_checkpointing_kwargs`: None
658
+ - `include_inputs_for_metrics`: False
659
+ - `include_for_metrics`: []
660
+ - `eval_do_concat_batches`: True
661
+ - `fp16_backend`: auto
662
+ - `push_to_hub_model_id`: None
663
+ - `push_to_hub_organization`: None
664
+ - `mp_parameters`:
665
+ - `auto_find_batch_size`: False
666
+ - `full_determinism`: False
667
+ - `torchdynamo`: None
668
+ - `ray_scope`: last
669
+ - `ddp_timeout`: 1800
670
+ - `torch_compile`: False
671
+ - `torch_compile_backend`: None
672
+ - `torch_compile_mode`: None
673
+ - `include_tokens_per_second`: False
674
+ - `include_num_input_tokens_seen`: False
675
+ - `neftune_noise_alpha`: None
676
+ - `optim_target_modules`: None
677
+ - `batch_eval_metrics`: False
678
+ - `eval_on_start`: False
679
+ - `use_liger_kernel`: False
680
+ - `liger_kernel_config`: None
681
+ - `eval_use_gather_object`: False
682
+ - `average_tokens_across_devices`: False
683
+ - `prompts`: {'query': 'task: search result | query: ', 'pos': 'title: none | text: '}
684
+ - `batch_sampler`: no_duplicates
685
+ - `multi_dataset_batch_sampler`: proportional
686
+ - `router_mapping`: {}
687
+ - `learning_rate_mapping`: {}
688
+
689
+ </details>
690
+
691
+ ### Training Logs
692
+ | Epoch | Step | Training Loss | Validation Loss | legal-spanish-eval-10kq-10kd_cosine_ndcg@10 |
693
+ |:------:|:----:|:-------------:|:---------------:|:-------------------------------------------:|
694
+ | -1 | -1 | - | - | 0.6634 |
695
+ | 0.0256 | 20 | 0.1561 | - | - |
696
+ | 0.0512 | 40 | 0.0312 | - | - |
697
+ | 0.0767 | 60 | 0.0189 | - | - |
698
+ | 0.1023 | 80 | 0.0245 | - | - |
699
+ | 0.1279 | 100 | 0.0375 | 0.0374 | 0.7689 |
700
+ | 0.1535 | 120 | 0.0236 | - | - |
701
+ | 0.1790 | 140 | 0.0356 | - | - |
702
+ | 0.2046 | 160 | 0.0227 | - | - |
703
+ | 0.2302 | 180 | 0.0261 | - | - |
704
+ | 0.2558 | 200 | 0.0146 | 0.0250 | 0.7733 |
705
+ | 0.2813 | 220 | 0.0264 | - | - |
706
+ | 0.3069 | 240 | 0.0249 | - | - |
707
+ | 0.3325 | 260 | 0.0202 | - | - |
708
+ | 0.3581 | 280 | 0.0268 | - | - |
709
+ | 0.3836 | 300 | 0.0126 | 0.0258 | 0.7711 |
710
+ | 0.4092 | 320 | 0.0217 | - | - |
711
+ | 0.4348 | 340 | 0.0217 | - | - |
712
+ | 0.4604 | 360 | 0.0246 | - | - |
713
+ | 0.4859 | 380 | 0.0211 | - | - |
714
+ | 0.5115 | 400 | 0.0164 | 0.0189 | 0.7796 |
715
+ | 0.5371 | 420 | 0.0172 | - | - |
716
+ | 0.5627 | 440 | 0.012 | - | - |
717
+ | 0.5882 | 460 | 0.0158 | - | - |
718
+ | 0.6138 | 480 | 0.0202 | - | - |
719
+ | 0.6394 | 500 | 0.0155 | 0.0168 | 0.7824 |
720
+ | 0.6650 | 520 | 0.0159 | - | - |
721
+ | 0.6905 | 540 | 0.0159 | - | - |
722
+ | 0.7161 | 560 | 0.0081 | - | - |
723
+ | 0.7417 | 580 | 0.0086 | - | - |
724
+ | 0.7673 | 600 | 0.0147 | 0.0128 | 0.7855 |
725
+ | 0.7928 | 620 | 0.0075 | - | - |
726
+ | 0.8184 | 640 | 0.0116 | - | - |
727
+ | 0.8440 | 660 | 0.0152 | - | - |
728
+ | 0.8696 | 680 | 0.0063 | - | - |
729
+ | 0.8951 | 700 | 0.0144 | 0.0093 | 0.7877 |
730
+ | 0.9207 | 720 | 0.0098 | - | - |
731
+ | 0.9463 | 740 | 0.0086 | - | - |
732
+ | 0.9719 | 760 | 0.0102 | - | - |
733
+ | 0.9974 | 780 | 0.0164 | - | - |
734
+ | -1 | -1 | - | - | 0.7879 |
735
+
736
+
737
+ ### Framework Versions
738
+ - Python: 3.12.11
739
+ - Sentence Transformers: 5.1.0
740
+ - Transformers: 4.57.0.dev0
741
+ - PyTorch: 2.8.0+cu126
742
+ - Accelerate: 1.10.1
743
+ - Datasets: 4.0.0
744
+ - Tokenizers: 0.22.0
745
+
746
+ ## Citation
747
+
748
+ ### BibTeX
749
+
750
+ #### Sentence Transformers
751
+ ```bibtex
752
+ @inproceedings{reimers-2019-sentence-bert,
753
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
754
+ author = "Reimers, Nils and Gurevych, Iryna",
755
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
756
+ month = "11",
757
+ year = "2019",
758
+ publisher = "Association for Computational Linguistics",
759
+ url = "https://arxiv.org/abs/1908.10084",
760
+ }
761
+ ```
762
+
763
+ #### CachedMultipleNegativesRankingLoss
764
+ ```bibtex
765
+ @misc{gao2021scaling,
766
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
767
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
768
+ year={2021},
769
+ eprint={2101.06983},
770
+ archivePrefix={arXiv},
771
+ primaryClass={cs.LG}
772
+ }
773
+ ```
774
+
775
+ <!--
776
+ ## Glossary
777
+
778
+ *Clearly define terms in order to be accessible across audiences.*
779
+ -->
780
+
781
+ <!--
782
+ ## Model Card Authors
783
+
784
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
785
+ -->
786
+
787
+ <!--
788
+ ## Model Card Contact
789
+
790
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
791
+ -->
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ {
2
+ "<image_soft_token>": 262144
3
+ }
config.json ADDED
@@ -0,0 +1,60 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_sliding_window_pattern": 6,
3
+ "architectures": [
4
+ "Gemma3TextModel"
5
+ ],
6
+ "attention_bias": false,
7
+ "attention_dropout": 0.0,
8
+ "attn_logit_softcapping": null,
9
+ "bos_token_id": 2,
10
+ "dtype": "float32",
11
+ "eos_token_id": 1,
12
+ "final_logit_softcapping": null,
13
+ "head_dim": 256,
14
+ "hidden_activation": "gelu_pytorch_tanh",
15
+ "hidden_size": 768,
16
+ "initializer_range": 0.02,
17
+ "intermediate_size": 1152,
18
+ "layer_types": [
19
+ "sliding_attention",
20
+ "sliding_attention",
21
+ "sliding_attention",
22
+ "sliding_attention",
23
+ "sliding_attention",
24
+ "full_attention",
25
+ "sliding_attention",
26
+ "sliding_attention",
27
+ "sliding_attention",
28
+ "sliding_attention",
29
+ "sliding_attention",
30
+ "full_attention",
31
+ "sliding_attention",
32
+ "sliding_attention",
33
+ "sliding_attention",
34
+ "sliding_attention",
35
+ "sliding_attention",
36
+ "full_attention",
37
+ "sliding_attention",
38
+ "sliding_attention",
39
+ "sliding_attention",
40
+ "sliding_attention",
41
+ "sliding_attention",
42
+ "full_attention"
43
+ ],
44
+ "max_position_embeddings": 2048,
45
+ "model_type": "gemma3_text",
46
+ "num_attention_heads": 3,
47
+ "num_hidden_layers": 24,
48
+ "num_key_value_heads": 1,
49
+ "pad_token_id": 0,
50
+ "query_pre_attn_scalar": 256,
51
+ "rms_norm_eps": 1e-06,
52
+ "rope_local_base_freq": 10000.0,
53
+ "rope_scaling": null,
54
+ "rope_theta": 1000000.0,
55
+ "sliding_window": 257,
56
+ "transformers_version": "4.57.0.dev0",
57
+ "use_bidirectional_attention": true,
58
+ "use_cache": true,
59
+ "vocab_size": 262144
60
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "model_type": "SentenceTransformer",
3
+ "__version__": {
4
+ "sentence_transformers": "5.1.0",
5
+ "transformers": "4.57.0.dev0",
6
+ "pytorch": "2.8.0+cu126"
7
+ },
8
+ "prompts": {
9
+ "query": "task: search result | query: ",
10
+ "document": "title: none | text: ",
11
+ "BitextMining": "task: search result | query: ",
12
+ "Clustering": "task: clustering | query: ",
13
+ "Classification": "task: classification | query: ",
14
+ "InstructionRetrieval": "task: code retrieval | query: ",
15
+ "MultilabelClassification": "task: classification | query: ",
16
+ "PairClassification": "task: sentence similarity | query: ",
17
+ "Reranking": "task: search result | query: ",
18
+ "Retrieval": "task: search result | query: ",
19
+ "Retrieval-query": "task: search result | query: ",
20
+ "Retrieval-document": "title: none | text: ",
21
+ "STS": "task: sentence similarity | query: ",
22
+ "Summarization": "task: summarization | query: "
23
+ },
24
+ "default_prompt_name": null,
25
+ "similarity_fn_name": "cosine"
26
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fb4ac8bca8536d643077060a1871858ab0bcb2a281984328ca44d7a4f52e7629
3
+ size 1211486072
modules.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Dense",
18
+ "type": "sentence_transformers.models.Dense"
19
+ },
20
+ {
21
+ "idx": 3,
22
+ "name": "3",
23
+ "path": "3_Dense",
24
+ "type": "sentence_transformers.models.Dense"
25
+ },
26
+ {
27
+ "idx": 4,
28
+ "name": "4",
29
+ "path": "4_Normalize",
30
+ "type": "sentence_transformers.models.Normalize"
31
+ }
32
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,33 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "boi_token": "<start_of_image>",
3
+ "bos_token": {
4
+ "content": "<bos>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false
9
+ },
10
+ "eoi_token": "<end_of_image>",
11
+ "eos_token": {
12
+ "content": "<eos>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false
17
+ },
18
+ "image_token": "<image_soft_token>",
19
+ "pad_token": {
20
+ "content": "<pad>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false
25
+ },
26
+ "unk_token": {
27
+ "content": "<unk>",
28
+ "lstrip": false,
29
+ "normalized": false,
30
+ "rstrip": false,
31
+ "single_word": false
32
+ }
33
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:216e2a79606fe879c9f17c529c71cd241338407fd5646b595ffd3c4b9ea1d503
3
+ size 33385262
tokenizer.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1299c11d7cf632ef3b4e11937501358ada021bbdf7c47638d13c0ee982f2e79c
3
+ size 4689074
tokenizer_config.json ADDED
The diff for this file is too large to render. See raw diff