mirror of
https://github.com/kvcache-ai/ktransformers.git
synced 2026-04-20 14:29:22 +00:00
Update DeepseekR1_V3_tutorial_zh_for_Ascend_NPU.md
This commit is contained in:
@@ -6,7 +6,7 @@
|
||||
| KTrans Decode token/s | 16.07 | 16.12 | 16.48 |
|
||||
|
||||
## 先决条件
|
||||
我们在以下配置下进行了最佳性能测试:
|
||||
我们在以下配置下进行了Deepseek-R1最佳性能测试:
|
||||
- 服务器型号:Atlas 2UP
|
||||
- NPU:300I A2
|
||||
- CPU: HUAWEI Kunpeng 920 7270Z
|
||||
@@ -16,7 +16,7 @@
|
||||
|
||||
## 物理机安装
|
||||
|
||||
部署满血版Deepseek-R1,需要机器物理内存能够存放下全部路由专家的权重,约400GB。
|
||||
部署满血版Deepseek-R1/V3,需要机器物理内存能够存放下全部路由专家的权重,约400GB。
|
||||
|
||||
目前支持的NPU型号:**300I A2**。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user