AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

管理员 2025-08-11 11:28:43

摘要:中, GPT-5 创下了模型中最差的记录:GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。GPT-5 得分 118,线下测试得分 70。但上述测试并不是门萨官...

中, GPT-5 创下了模型中最差的记录:

GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。

GPT-5 得分 118,线下测试得分 70。

但上述测试并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。

据悉,该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。

不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。

值得一提的是,从最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。

而在日前 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:大语言模型智能体成本降低28%!OPPO团队首次揭秘高效Agent系统设计
下一篇:1200 亿条工程建造数据支撑,我国首个隧道与地下空间领域垂直大模型发布
猜你喜欢
  • OPPO AI团队突破性推出EcoGym:让AI智能体在虚拟经济世界中接受商业能力终极考验
  • USC团队新突破:用文本就能轻松检测AI模型的隐私泄露,颠覆传统方法
  • 稀疏自编码器真的能解码AI大脑吗?斯坦福等机构发现这项热门技术可能只是"空中楼阁"
  • UCLA等六大机构联手破解AI训练难题:让机器"学生"不再中途"罢课"
  • 每日AI必读资讯:AI人工智能领域最新热点资讯汇总(2025年8月4日)
  • 腾讯元宝接入 DeepSeek V3.1 最新版,电脑 / 网页版可体验
  • 斯坦福与英伟达联合研究:AI训练为什么"炒冷饭"比"吃新鲜"更有效?
  • 机器人终于学会在现实世界中自主学习:清华大学团队打造的"万能学徒"系统能让机器人像人类一样边做边学
  • 全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换
  • 机器人不再机械:上海交通大学联合多机构破解机器人动作不连贯难题
27 02, 2026
东京理工学院团队革命性突破:让虚拟人像真人一样会聊天互动
Str Tom
站长
Str Tom 网络工作室
663
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客