Edit Models filters

Multimodal

Audio-Text-to-Text

Image-Text-to-Text

Visual Question Answering

Document Question Answering

Video-Text-to-Text

Visual Document Retrieval

Computer Vision

Depth Estimation

Image Classification

Object Detection

Image Segmentation

Unconditional Image Generation

Video Classification

Zero-Shot Image Classification

Mask Generation

Zero-Shot Object Detection

Image Feature Extraction

Keypoint Detection

Natural Language Processing

Text Classification

Token Classification

Table Question Answering

Question Answering

Zero-Shot Classification

Feature Extraction

Text Generation

Sentence Similarity

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Tabular Regression

Time Series Forecasting

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

62,072

Full-text search

Active filters: reinforcement-learning

Galeros/dqn-mountaincar-v0-zoo-mimick

Reinforcement Learning • Updated Jun 11, 2022 • 5

tjscollins/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 11, 2022 • 1

tjscollins/q-FrozenLake-v1-4x4-slippery

Reinforcement Learning • Updated Jun 11, 2022

tjscollins/q-Taxi-v3

Reinforcement Learning • Updated Jun 11, 2022

tjscollins/q-Taxi-v3-broken-eval-seed

Reinforcement Learning • Updated Jun 11, 2022

745H1N/LunarLander-v2-PPO-optuna

Reinforcement Learning • Updated Jun 11, 2022 • 5

745H1N/LunarLander-v2-DQN-optuna

Reinforcement Learning • Updated Jun 11, 2022 • 5

DLWCMD/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2022 • 6

bguan/SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 10

bguan/SpaceInvadersNoFrameskip-v4-2Msteps

Reinforcement Learning • Updated Jun 12, 2022 • 12

ironbar/dqn-SpaceInvadersNoFrameskip-v4-1M-steps

Reinforcement Learning • Updated Jun 12, 2022 • 12

DavidCollier/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Dec 29, 2023 • 9

mgfrantz/dql-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 13

jianyang/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 12, 2022

jianyang/q-Taxi-v3

Reinforcement Learning • Updated Jun 12, 2022

jianyang/q-FrozenLake-v1-4x4-Slippery

Reinforcement Learning • Updated Jun 13, 2022

comodoro/SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 12

sdpetrides/q-FrozenLake-v1-8x8-noSlippery

Reinforcement Learning • Updated Jun 12, 2022

damianr13/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 12, 2022

damianr13/q-Taxi-v3

Reinforcement Learning • Updated Jun 12, 2022

rhuang/PPO-LunarLander-v2-baseline

Reinforcement Learning • Updated Jun 12, 2022 • 5

Forkits/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 12

rhuang/PPO-LunarLander-v2-mlp-10epoch

Reinforcement Learning • Updated Jun 12, 2022 • 4

NikitaErmolaev/ppo_1M-LunarLander-v2

Reinforcement Learning • Updated Jun 12, 2022 • 5

NikitaErmolaev/ppo_2M-LunarLander-v2

Reinforcement Learning • Updated Jun 12, 2022 • 4

kalmufti/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 12

antonioricciardi/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jun 13, 2022

0xrushi/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 13, 2022 • 11

antonioricciardi/q-Taxi-v3

Reinforcement Learning • Updated Jun 13, 2022

thulasiram/q-Taxi-v3

Reinforcement Learning • Updated Jun 13, 2022