liziniu

Follow

Ziniu Li liziniu

Follow

Ph.D. student at The Chinese University of Hong Kong, Shenzhen.

84 followers · 42 following

The Chinese University of Hong Kong, Shenzhen
Shenzhen
www.liziniu.org
@ziniuli

Achievements

Achievements

Highlights

Pro

Pinned Loading

ReMax ReMax Public

Code for Paper (ReMax: A Simple, Efficient and Effective Reinforcement Learning Method for Aligning Large Language Models)

Python 175 13
policy_optimization policy_optimization Public

Code for Paper (Policy Optimization in RLHF: The Impact of Out-of-preference Data)

Python 27 5
HyperDQN HyperDQN Public

Code for ICLR 2022 Paper (HyperDQN: A Randomized Exploration Method for Deep Reinforcement Learning)

Python 12 1
ISWBC ISWBC Public

Code for NeurIPS 2023 Paper (Imitation Learning from Imperfection: Theoretical Justifications and Algorithms)

Python 7
GEM GEM Public

Code for Paper (Preserving Diversity in Supervised Fine-tuning of Large Language Models)

Python 13
cold_start_rl cold_start_rl Public

Code for Blog Post: Can Better Cold-Start Strategies Improve RL Training for LLMs?

Python 13