15 3 2

Kyle Sayers

kylesayrs

https://github.com/kylesayrs

AI & ML interests

Accelerating ML inference @ Red Hat

Recent Activity

updated a model about 13 hours ago

inference-optimization/DeepSeek-V4-Flash-5layers-nvfp4moe

published a model about 13 hours ago

inference-optimization/DeepSeek-V4-Flash-5layers-nvfp4moe

updated a model about 18 hours ago

inference-optimization/DeepSeek-V4-Flash-bf16-dequantized-5layers

View all activity

Organizations

updated a model about 13 hours ago

inference-optimization/DeepSeek-V4-Flash-5layers-nvfp4moe

20B • Updated about 13 hours ago

published a model about 13 hours ago

inference-optimization/DeepSeek-V4-Flash-5layers-nvfp4moe

20B • Updated about 13 hours ago

updated a model about 18 hours ago

inference-optimization/DeepSeek-V4-Flash-bf16-dequantized-5layers

Updated about 18 hours ago

published a model about 18 hours ago

inference-optimization/DeepSeek-V4-Flash-bf16-dequantized-5layers

Updated about 18 hours ago

updated a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

2B • Updated 7 days ago • 72

published a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

2B • Updated 7 days ago • 72

updated a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-qmod

2B • Updated 7 days ago • 18

published a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-qmod

2B • Updated 7 days ago • 18

updated a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-qmod

5B • Updated 7 days ago • 21

published a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-qmod

5B • Updated 7 days ago • 21

updated a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-gptq

5B • Updated 7 days ago • 22

published a model 7 days ago

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-gptq

5B • Updated 7 days ago • 22

updated a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-gptq

2B • Updated 7 days ago • 20

published a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-gptq

2B • Updated 7 days ago • 20

updated a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-qmod

2B • Updated 7 days ago • 21

published a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-qmod

2B • Updated 7 days ago • 21

updated a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-qmod

5B • Updated 7 days ago • 17

published a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-qmod

5B • Updated 7 days ago • 17

updated a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-gptq

5B • Updated 7 days ago • 16

published a model 7 days ago

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-gptq

5B • Updated 7 days ago • 16

Kyle Sayers

AI & ML interests

Recent Activity

Organizations

kylesayrs's activity