AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

管理员 2025-08-11 11:28:43

摘要:中, GPT-5 创下了模型中最差的记录:GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。GPT-5 得分 118,线下测试得分 70。但上述测试并不是门萨官...

中, GPT-5 创下了模型中最差的记录:

GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。

GPT-5 得分 118,线下测试得分 70。

但上述测试并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。

据悉,该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。

不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。

值得一提的是,从最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。

而在日前 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:大语言模型智能体成本降低28%!OPPO团队首次揭秘高效Agent系统设计
下一篇:1200 亿条工程建造数据支撑,我国首个隧道与地下空间领域垂直大模型发布
猜你喜欢
  • 挤不动的世界机器人大会上,自变量秀出了真·通用具身智能
  • 人工智能界的"评委"进阶记:中国人民大学等机构如何让AI重新学会"看懂"文本的含金量
  • 哥本哈根大学最新研究:如何让AI模型"忘掉"刻板印象——BiasGym框架让机器学习更公平
  • 当AI聊天助手遇上挑剔用户:Salesforce如何让机器真正理解你的心思
  • 当照片"有洞有残缺"时,AI也能巧手补天:北京大学团队让3D重建告别"马赛克"困扰
  • 每日AI必读资讯:AI人工智能领域最新热点资讯汇总(2025年8月7日)
  • Tencent最新发布:一键生成代码评测"神器",让AI编程测试不再依赖人工标注
  • 人工智能大模型推理速度大提升!阿姆斯特丹大学与Salesforce联手开发"聪明导游"技术
  • 阿里巴巴推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台
  • 微软 AI CEO 苏莱曼:“看似有意识”的 AI 即将到来,恐导致严重后果
21 08, 2025
大型语言模型也能"节食减肥":ISTA研究团队突破1位量化训练极限
Str Tom
站长
Str Tom 网络工作室
276
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客