摘要:8 月 10 日消息,据《科创板日报》报道,推理性能,完善中国 AI 推理生态的关键部分。1AI注意到,华为在 AI 推理领域的技术突破已有先例。2025 年 3 月,北京大学联...
8 月 10 日消息,据《科创板日报》报道,推理性能,完善中国 AI 推理生态的关键部分。
1AI注意到,华为在 AI 推理领域的技术突破已有先例。2025 年 3 月,北京大学联合华为发布了 DeepSeek 全栈开源推理方案,该方案基于北大自研 SCOW 算力平台系统和鹤思调度系统,整合了 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现了华为昇腾上的 DeepSeek 高效推理。
在性能方面,华为昇腾已实现多项突破。例如 CloudMatrix 384 超节点部署 DeepSeek V3 / R1 时,在 50ms 时延约束下单卡 Decode 吞吐突破 1920 Tokens / s;Atlas 800I A2 推理服务器在 100ms 时延约束下单卡吞吐达到 808 Tokens / s。
科大讯飞与华为的合作也取得了显著成果,双方率先实现了国产算力上 MoE 模型的大规模跨节点专家并行集群推理,使推理吞吐提升 3.2 倍,端到端时延降低 50%。
声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
上一篇:阿里云通义千问 Qwen Code 宣布每日可免费运行 2000 次:仅限中国大陆用户,一行命令即可安装
下一篇:人形机器人商业化元年爆发!优必选、智元亿元订单落地,工业场景开启“30%劳动力替代”新纪元