1 8 66

Vadim Smolyakov

vsmolyakov

https://vsmolyakov.github.io/

AI & ML interests

Machine Learning Engineer @ Microsoft

Recent Activity

liked a dataset about 2 hours ago

Agent-Ark/Toucan-1.5M

upvoted a paper about 5 hours ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

liked a model 2 months ago

moonshotai/Kimi-K2-Thinking

View all activity

Organizations

None yet

liked a dataset about 2 hours ago

Agent-Ark/Toucan-1.5M

Viewer • Updated Oct 4, 2025 • 1.65M • 3.81k • 192

upvoted a paper about 5 hours ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 12 days ago • 200

liked a model 2 months ago

moonshotai/Kimi-K2-Thinking

Text Generation • Updated Nov 8, 2025 • 224k • • 1.63k

liked 2 models 3 months ago

MiniMaxAI/MiniMax-M2

Text Generation • 229B • Updated 29 days ago • 123k • • 1.45k

zeroentropy/zerank-1

Text Ranking • 4B • Updated Nov 19, 2025 • 2.53k • 73

liked a model 4 months ago

zai-org/GLM-4.5

Text Generation • 358B • Updated Aug 11, 2025 • 20.1k • • 1.39k

liked a dataset 4 months ago

openai/gdpval

Viewer • Updated Sep 25, 2025 • 220 • 22.9k • 448

liked 2 models 5 months ago

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 3.08M • • 4.36k

gghfez/Mistral-Small-3.2-24B-Instruct-hf-AWQ

Text Generation • 24B • Updated Jun 25, 2025 • 252 • 4

liked a dataset 6 months ago

Salesforce/CRMArenaPro

Viewer • Updated Jul 9, 2025 • 8.61k • 397 • 15

liked a dataset 7 months ago

Salesforce/CRMArena

Viewer • Updated Jun 18, 2025 • 1.19k • 227 • 8

upvoted an article 8 months ago

Article

The Large Language Model Course

Jan 16, 2025

•

218

liked 3 models 9 months ago

liked a dataset 9 months ago

allenai/reward-bench

Viewer • Updated Sep 9, 2024 • 8.11k • 5.26k • 104

liked 3 models 10 months ago

weqweasdas/RM-Mistral-7B

Text Classification • 7B • Updated Mar 31, 2024 • 2.49k • 24

RLHFlow/ArmoRM-Llama3-8B-v0.1

Text Classification • 8B • Updated Sep 23, 2024 • 9.69k • 184

mistralai/Mistral-Small-3.1-24B-Instruct-2503

24B • Updated 30 days ago • 74k • 1.34k

liked a model 11 months ago

Qwen/QwQ-32B

Text Generation • 33B • Updated Mar 11, 2025 • 86.3k • • 2.88k

Vadim Smolyakov

AI & ML interests

Recent Activity

Organizations

vsmolyakov's activity

The Large Language Model Course