AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 消息称华为即将发布 AI 推理领域突破性成果:降低对 HBM 依赖,提升国内大模型性能

消息称华为即将发布 AI 推理领域突破性成果:降低对 HBM 依赖,提升国内大模型性能

管理员 2025-08-10 12:55:20

摘要:8 月 10 日消息,据《科创板日报》报道,推理性能,完善中国 AI 推理生态的关键部分。1AI注意到,华为在 AI 推理领域的技术突破已有先例。2025 年 3 月,北京大学联...

8 月 10 日消息,据《科创板日报》报道,推理性能,完善中国 AI 推理生态的关键部分。

1AI注意到,华为在 AI 推理领域的技术突破已有先例。2025 年 3 月,北京大学联合华为发布了 DeepSeek 全栈开源推理方案,该方案基于北大自研 SCOW 算力平台系统和鹤思调度系统,整合了 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现了华为昇腾上的 DeepSeek 高效推理。

在性能方面,华为昇腾已实现多项突破。例如 CloudMatrix 384 超节点部署 DeepSeek V3 / R1 时,在 50ms 时延约束下单卡 Decode 吞吐突破 1920 Tokens / s;Atlas 800I A2 推理服务器在 100ms 时延约束下单卡吞吐达到 808 Tokens / s。

科大讯飞与华为的合作也取得了显著成果,双方率先实现了国产算力上 MoE 模型的大规模跨节点专家并行集群推理,使推理吞吐提升 3.2 倍,端到端时延降低 50%。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:阿里云通义千问 Qwen Code 宣布每日可免费运行 2000 次:仅限中国大陆用户,一行命令即可安装
下一篇:人形机器人商业化元年爆发!优必选、智元亿元订单落地,工业场景开启“30%劳动力替代”新纪元
猜你喜欢
  • 前淘宝直播业务负责人道放再创业,要用AI做消费者的“赛博闺蜜”
  • OpenAI 推出“ChatGPT Go”低价套餐:仅限特定地区,每月 399 印度卢比
  • MIT联手斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘
  • 挪威卑尔根大学发明"烘焙师"神经网络:让AI学会处理旋转轮廓就像制作完美曲奇
  • 蚂蚁集团提出GRAO:让AI模型在"模仿-探索-超越"中实现自我优化的统一对齐框架
  • 清华大学团队揭秘:AI能否摆脱搜索引擎,靠"内功"回答一切问题?
  • 商汤日日新为 Claude API 用户提供“搬家”服务:可获 5000 万 Tokens 体验包
  • 人工智能如何用1公里模糊图像精确推算出10米高清地面温度图?法国奥尔良大学团队的突破性发现
  • OREAL算法:从7B模型首破91分到32B新纪录,上海AI实验室如何用强化学习让AI数学推理超越OpenAI o1?
  • 每日数字经济资讯:数字经济领域最新热点资讯汇总(2025年9月5日)
09 09, 2025
2025外滩大会“AI十问世界”引爆全球科技伦理思辨:人机共生时代的责任与边界
Str Tom
站长
Str Tom 网络工作室
423
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客