DERL_Group

non-profit

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

sitao authored a paper 4 days ago

From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning

sitao updated a model 8 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L2-Qwen2.5-1.5B

sitao updated a model 8 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L1-Qwen2.5-1.5B

View all activity

Papers

Differentiable Evolutionary Reinforcement Learning

View all Papers

sitao

authored a paper 4 days ago

From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning

Paper • 2512.01970 • Published Dec 1, 2025 • 1

sitao

updated 6 models 8 days ago

L3133625978

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L2-Qwen2.5-1.5B

2B • Updated 8 days ago • 14

L3133625978

published a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L2-Qwen2.5-1.5B

2B • Updated 8 days ago • 14

L3133625978

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L1-Qwen2.5-1.5B

2B • Updated 8 days ago • 17

L3133625978

published a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L1-Qwen2.5-1.5B

2B • Updated 8 days ago • 17

L3133625978

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L0-Qwen2.5-1.5B

2B • Updated 8 days ago • 14

L3133625978

published a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ScienceWorld-L0-Qwen2.5-1.5B

2B • Updated 8 days ago • 14

L3133625978

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L2-Qwen2.5-1.5B

2B • Updated 8 days ago • 34 • 1

L3133625978

published a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L2-Qwen2.5-1.5B

2B • Updated 8 days ago • 34 • 1

L3133625978

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L1-Qwen2.5-1.5B

2B • Updated 8 days ago • 20

L3133625978

published a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L1-Qwen2.5-1.5B

2B • Updated 8 days ago • 20

sitao

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-Meta-Optimizer-Init-Qwen2.5-0.5B-Instruct

Text Generation • 0.5B • Updated 12 days ago • 16

L3133625978

updated a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L0-Qwen2.5-1.5B

2B • Updated 8 days ago • 40 • 1

L3133625978

published a model 12 days ago

DifferentiableEvolutionaryRL/DERL-ALFWorld-L0-Qwen2.5-1.5B

2B • Updated 8 days ago • 40 • 1

AI & ML interests

Recent Activity

Papers

Team members 2

DifferentiableEvolutionaryRL's activity