diff --git a/doc/zh/DeepseekR1_V3_tutorial_zh_for_Ascend_NPU.md b/doc/zh/DeepseekR1_V3_tutorial_zh_for_Ascend_NPU.md index e9222e5..10acb4a 100644 --- a/doc/zh/DeepseekR1_V3_tutorial_zh_for_Ascend_NPU.md +++ b/doc/zh/DeepseekR1_V3_tutorial_zh_for_Ascend_NPU.md @@ -1,5 +1,7 @@ # 基准测试结果 +在 Batchsize=4、输出长度为 1024 的条件下,性能测试结果如下: + | Prompt length | 1K | 2K | 4K | | --------------------------------- | ------ | ------ | ------ | | KTrans Prefill token/s | 174.68 | 169.52 | 167.15 | @@ -8,7 +10,7 @@ ## 先决条件 我们在以下配置下进行了Deepseek-R1最佳性能测试: - 服务器型号:Atlas 2UP -- NPU:300I A2 +- NPU:Atlas 300I A2 - CPU: HUAWEI Kunpeng 920 7270Z - 内存: DDR5服务器内存(1TB)