SaminYeasar

Follow

Samin Yeasar Arnob SaminYeasar

Follow

PhD student at Computer Science McGill University Canada

18 followers · 2 following

Achievements

Achievements

Highlights

Pro

Pinned Loading

unpaired_rlhf unpaired_rlhf Public

Forked from sahandrez/unpaired_rlhf

Reinforcement Learning from Human Feedback (RLHF) with Unpaired Preferences

Python
llm_alignment llm_alignment Public

Python
DAPD DAPD Public

Official Implementation of Data Adaptive Pathway Discovery (DAPD) for Online RL

Python 1
Offline-Reinforcement-Learning-Algorithms Offline-Reinforcement-Learning-Algorithms Public

PyTorch Implementation of Offline Reinforcement Learning algorithms

Python 5 1
Off_Policy_Adversarial_Inverse_Reinforcement_Learning Off_Policy_Adversarial_Inverse_Reinforcement_Learning Public

Implementation of Off Policy Adversarial Inverse Reinforcement Learning

Python 22 3
PyTorch-implementation-DICE-algorithms PyTorch-implementation-DICE-algorithms Public

PyTorch-implementation-DICE-algorithms

Python 2 1