AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 Transformer 作者:我们可能走错了 AI 发展的路

Transformer 作者:我们可能走错了 AI 发展的路

管理员 2025-09-11 11:55:08

摘要:日前,论文《Attention is All You Need》(提出了 发展模式,可能正在扼杀真正的技术突破。Vaswani 认为,AI 领域巨大的商业利益,导致 Google、OpenAI 等少数公...

日前,论文《Attention is All You Need》(提出了 发展模式,可能正在扼杀真正的技术突破。

Vaswani 认为,AI 领域巨大的商业利益,导致 Google、OpenAI 等少数公司将巨额资金投入到对现有 Transformer 模型的渐进式改良上,而非探索全新的、可能带来革命性突破的路径。这种「军备竞赛」的本质是商业竞争,而非纯粹的科学探索。

业界曾普遍信奉「规模定律」(Scaling Laws)—— 即投入更多数据和算力,模型就会变得更强。然而,备受期待的 GPT-5 发布后,其「挤牙膏式」的提升被许多专家视为该定律回报递减的信号。

但 Vaswani 认为,现在下结论说 AI 的进步已经停滞还为时过早。但他也表示,GPT-5 发布后的讨论加强了他对人工智能开发方式的担忧。

同时,他认为在教育和医疗保健等领域应用人工智能确实有真正的科学可以追求,「我们不能让封闭式的 AI 开发阻止我们探索这些新的前沿领域。」


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:西湖大学团队用"看图说话"训练AI画师:不用文字描述也能生成精美图像
下一篇:支付宝发布 AI 就业助手「晓叶」
猜你喜欢
  • 希腊金融界的AI新突破:雅典研究团队打造专门为希腊语量身定制的金融大模型
  • OpenAI CEO 奥尔特曼:GPT-6 将更快到来,会更懂用户
  • 苹果公司新突破:让AI学会像人类一样"想象"和推理
  • IBM Research推出VAREX:让AI读懂政府表格的新基准测试
  • 新华三“算力×联接”战略落地:以全栈协同创新开启AI普惠新纪元
  • 1200 亿条工程建造数据支撑,我国首个隧道与地下空间领域垂直大模型发布
  • Tencent最新发布:一键生成代码评测"神器",让AI编程测试不再依赖人工标注
  • Meta首次破解AI推理模型的"幻觉"难题:让机器既会思考又能说真话
  • 字节豆包研发 3D 模型 AI 生成工具“3D Model Generator”
  • 阿里云团队突破客服新纪元:让AI也能像金牌客服一样温暖贴心地解决问题
11 09, 2025
3000 亿美元历史级大单:消息称 OpenAI 与 Oracle 甲骨文达成重磅云计算交易
Str Tom
站长
Str Tom 网络工作室
464
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客