diff --git a/ggml/src/ggml-cuda.cu b/ggml/src/ggml-cuda.cu
index 3814e181..db8e3520 100644
--- a/ggml/src/ggml-cuda.cu
+++ b/ggml/src/ggml-cuda.cu
@@ -2538,12 +2538,11 @@ static int ggml_cuda_moe_up_gate_unary(ggml_backend_cuda_context & ctx, ggml_ten
 
             auto unary_op = (ggml_unary_op)dst->op_params[0];
             if (src0_2) {
-            auto gate_bias = dst->src[4] && src0_2 ? dst->src[5] : nullptr;
-            ggml_cuda_op_fused_mul_mat_vec_q_id(ctx, src0_1, &local_src1, ids, &local_dst,
-                    dst->src[4], dst->src[5],
-                    (const char *)src0_1->data, src0_2 ? (const char *)src0_2->data : nullptr,
-                    (const float *)src1->data, src1_quantized.get(),
-                    (float *)local_dst.data, 0, src0_1->ne[1], 1, src1_padded_col_size, unary_op, stream);
+                ggml_cuda_op_fused_mul_mat_vec_q_id(ctx, src0_1, &local_src1, ids, &local_dst,
+                        dst->src[4], dst->src[5],
+                        (const char *)src0_1->data, src0_2 ? (const char *)src0_2->data : nullptr,
+                        (const float *)src1->data, src1_quantized.get(),
+                        (float *)local_dst.data, 0, src0_1->ne[1], 1, src1_padded_col_size, unary_op, stream);
             } else {
                 auto local_src0_1 = *src0_1;
                 local_src0_1.ne[1] /= 2;