Zijie Chen's picture

2 12

Zijie Chen

ZC-czj

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 16 days ago

Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models

upvoted a collection 16 days ago

Nemotron-Cascade

new activity 17 days ago

nvidia/Nemotron-Cascade-SFT-Stage-2:Missing Science Domain Stage 2 SFT data.

View all activity

Organizations

None yet

upvoted a paper 16 days ago

Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models

Paper • 2512.13607 • Published 18 days ago • 27

upvoted a collection 16 days ago

Nemotron-Cascade

Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models • 18 items • Updated 1 day ago • 40

New activity in nvidia/Nemotron-Cascade-SFT-Stage-2 17 days ago

Missing Science Domain Stage 2 SFT data.

#2 opened 17 days ago by

New activity in huggingface/InferenceSupport 19 days ago

Nanbeige/Nanbeige4-3B-Thinking-2510

#6828 opened 19 days ago by

upvoted 5 papers about 1 month ago

DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

Paper • 2511.22570 • Published Nov 27, 2025 • 85

Stabilizing Reinforcement Learning with LLMs: Formulation and Practices

Paper • 2512.01374 • Published Dec 1, 2025 • 94

DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models

Paper • 2512.02556 • Published Dec 2, 2025 • 244

Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models

Paper • 2511.23319 • Published Nov 28, 2025 • 22

GigaEvo: An Open Source Optimization Framework Powered By LLMs And Evolution Algorithms

Paper • 2511.17592 • Published Nov 17, 2025 • 118

upvoted a paper about 2 months ago

Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds

Paper • 2511.08892 • Published Nov 12, 2025 • 201

upvoted a paper 2 months ago

Knocking-Heads Attention

Paper • 2510.23052 • Published Oct 27, 2025 • 29

upvoted 2 papers 4 months ago

Reverse-Engineered Reasoning for Open-Ended Generation

Paper • 2509.06160 • Published Sep 7, 2025 • 150

Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR

Paper • 2508.14029 • Published Aug 19, 2025 • 118

upvoted a paper 5 months ago

Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning

Paper • 2508.08221 • Published Aug 11, 2025 • 50