AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

管理员 2025-08-11 11:28:43

摘要:中, GPT-5 创下了模型中最差的记录:GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。GPT-5 得分 118,线下测试得分 70。但上述测试并不是门萨官...

中, GPT-5 创下了模型中最差的记录:

GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。

GPT-5 得分 118,线下测试得分 70。

但上述测试并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。

据悉,该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。

不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。

值得一提的是,从最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。

而在日前 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:大语言模型智能体成本降低28%!OPPO团队首次揭秘高效Agent系统设计
下一篇:1200 亿条工程建造数据支撑,我国首个隧道与地下空间领域垂直大模型发布
猜你喜欢
  • 1600万美元押注传统行业AI化,这家公司发现了被硅谷忽视的万亿市场
  • 新加坡国立大学团队突破性成果:让AI从几十张图片就能学会艺术家的"涂鸦"技巧
  • 谷歌DeepMind首次实现AI"闻香识分子":用机器学习破解人类嗅觉奥秘
  • 大语言模型的"注意力盆地"现象:中山大学揭秘AI为何会"遗忘"中间信息
  • 傅利叶发布人形机器人 GR-3,主打陪伴康养,定义"有爱的"交互新范式
  • 西安交通大学与蚂蚁集团联合发布:AI如何真正理解人类情感并给出贴心回应
  • 新加坡大学团队突破:让多个AI"专家"携手解决复杂文档难题,小模型也能超越大模型
  • 美国一男子向 ChatGPT 寻求饮食建议,却被“误诊”导致罹患溴中毒
  • 宾州大学团队发明AI"追根溯源神器",让大模型无处藏身
  • 速递|Meta的AI音频竞赛再落子,双月连购PlayAI+WaveForms,补全AI情感语音拼图
09 09, 2025
2025外滩大会“AI十问世界”引爆全球科技伦理思辨:人机共生时代的责任与边界
Str Tom
站长
Str Tom 网络工作室
423
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客