AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

管理员 2025-08-11 11:28:43

摘要:中, GPT-5 创下了模型中最差的记录:GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。GPT-5 得分 118,线下测试得分 70。但上述测试并不是门萨官...

中, GPT-5 创下了模型中最差的记录:

GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。

GPT-5 得分 118,线下测试得分 70。

但上述测试并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。

据悉,该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。

不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。

值得一提的是,从最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。

而在日前 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:大语言模型智能体成本降低28%!OPPO团队首次揭秘高效Agent系统设计
下一篇:1200 亿条工程建造数据支撑,我国首个隧道与地下空间领域垂直大模型发布
猜你喜欢
  • 新加坡国立大学团队揭示:让AI既能看又能做的视觉强化学习新突破
  • 哈工大团队发现AI学新技能不忘老本事的秘诀:用一千个通用样本就够了!
  • 哈佛大学团队破解数字时代的"失忆症":为什么我们越来越忘不掉糟糕记忆?
  • OpenAI发布百万美元软件工程挑战:前沿AI模型能否在真实自由职业市场中赚取百万美元
  • 每日AI必读资讯:AI人工智能领域最新热点资讯汇总(2025年8月30日)
  • 微软 AI CEO 苏莱曼:“看似有意识”的 AI 即将到来,恐导致严重后果
  • 厦门AI赋能千行百业:医疗先行,开启产业变革新征程
  • 低资源语言的AI也要会"看图说话":上海AI实验室破解多语言视觉AI文化盲区难题
  • 单个GPU就能处理300万词汇:KAIST团队让大模型记忆力暴涨3倍的神奇方法
  • 斯坦福大学团队揭秘:AI如何像人类一样"看懂"物理世界的运动规律
11 09, 2025
3000 亿美元历史级大单:消息称 OpenAI 与 Oracle 甲骨文达成重磅云计算交易
Str Tom
站长
Str Tom 网络工作室
464
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客