RedHatAI
/

Qwen3-30B-A3B-NVFP4

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions

nm-research commited on 7 days ago

Commit

a4df9f0

·

verified ·

1 Parent(s): 833c3df

Update README.md

Files changed (1) hide show

README.md +0 -51

README.md CHANGED Viewed

@@ -297,31 +297,6 @@ This model was evaluated on the well-known OpenLLM v1, OpenLLM v2 and HumanEval_
       <td>91.13</td>
       <td>97.34</td>
     </tr>
-    <tr>
-      <td rowspan="4"><b>Reasoning</b></td>
-      <td>AIME24 (0-shot)</td>
-      <td>—</td>
-      <td>—</td>
-      <td>—</td>
-    </tr>
-    <tr>
-      <td>AIME25 (0-shot)</td>
-      <td>—</td>
-      <td>—</td>
-      <td>—</td>
-    </tr>
-    <tr>
-      <td>GPQA (Diamond, 0-shot)</td>
-      <td>—</td>
-      <td>—</td>
-      <td>—</td>
-    </tr>
-    <tr>
-      <td><b>Average</b></td>
-      <td><b>—</b></td>
-      <td><b>—</b></td>
-      <td><b>—</b></td>
-    </tr>
   </tbody>
 </table>
@@ -366,30 +341,4 @@ lm_eval \
   --tasks humaneval_64_instruct \
   --batch_size auto
 ```
-#### LightEval
-```
-# --- model_args.yaml ---
-cat > model_args.yaml <<'YAML'
-model_parameters:
-  model_name: "RedHatAI/Qwen3-30B-A3B-NVFP4"
-  dtype: auto
-  gpu_memory_utilization: 0.9
-  tensor_parallel_size: 2
-  max_model_length: 40960
-  generation_parameters:
-    seed: 42
-    temperature: 0.6
-    top_k: 20
-    top_p: 0.95
-    min_p: 0.0
-    max_new_tokens: 32768
-YAML
-lighteval vllm model_args.yaml \
-  "lighteval|aime24|0,lighteval|aime25|0,lighteval|gpqa:diamond|0" \
-  --max-samples -1 \
-  --output-dir out_dir
-```
 </details>

       <td>91.13</td>
       <td>97.34</td>
     </tr>
   </tbody>
 </table>
   --tasks humaneval_64_instruct \
   --batch_size auto
 ```
 </details>