1 11 4

chenzehao

chhao

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

upvoted a paper 6 days ago

Qwen3-Coder-Next Technical Report

upvoted a paper 9 days ago

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

View all activity

Organizations

None yet

upvoted a paper 5 days ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published 7 days ago • 151

upvoted a paper 6 days ago

Qwen3-Coder-Next Technical Report

Paper • 2603.00729 • Published 9 days ago • 43

upvoted a paper 9 days ago

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Paper • 2602.23008 • Published 11 days ago • 35

upvoted 2 papers 12 days ago

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published 14 days ago • 509

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Paper • 2602.10693 • Published 26 days ago • 216

upvoted a paper 15 days ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 29 days ago • 260

upvoted 2 papers 23 days ago

TermiGen: High-Fidelity Environment and Robust Trajectory Synthesis for Terminal Agents

Paper • 2602.07274 • Published about 1 month ago • 206

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Paper • 2602.10388 • Published 27 days ago • 240

New activity in chhao/Weak-Driven-Learning 24 days ago

Create README.md

#1 opened 25 days ago by

AlexGeek

liked a model 24 days ago

DMindAI/DMind-3-nano

Text Generation • Updated 5 days ago • 6 • 57

liked 2 datasets 24 days ago

TeichAI/Pony-Alpha-15k

Viewer • Updated 21 days ago • 14.9k • 632 • 60

openbmb/UltraData-Math

Viewer • Updated 17 days ago • 181M • 86.9k • 259

liked a model 27 days ago

chhao/Weak-Driven-Learning

Text Generation • Updated 24 days ago • 61 • 6

updated a model 27 days ago

chhao/Weak-Driven-Learning

Text Generation • Updated 24 days ago • 61 • 6

published a model 27 days ago

chhao/Weak-Driven-Learning

Text Generation • Updated 24 days ago • 61 • 6

upvoted a paper 27 days ago

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

Paper • 2506.17252 • Published Jun 8, 2025 • 2

authored 2 papers 27 days ago

Improving Viewpoint Consistency in 3D Generation via Structure Feature and CLIP Guidance

Paper • 2412.02287 • Published Dec 3, 2024 • 1

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 29 days ago • 278

upvoted 2 papers 28 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published Jan 30 • 15

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 29 days ago • 278

chenzehao

AI & ML interests

Recent Activity

Organizations

chhao's activity

Create README.md