AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

GPT-5 智商测试 57 分垫底再次引爆全网,创下了模型中最差的记录

管理员 2025-08-11 11:28:43

摘要:中, GPT-5 创下了模型中最差的记录:GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。GPT-5 得分 118,线下测试得分 70。但上述测试并不是门萨官...

中, GPT-5 创下了模型中最差的记录:

GPT-5 Thinking 在测试中得分 85,在离线测试中得分 57,直接垫底。

GPT-5 得分 118,线下测试得分 70。

但上述测试并不是门萨官方给 AI 做的测试,而是有人把挪威门萨向公众免费公开的 35 道图形推理题(test.mensa.no)直接拿去给大模型做,然后按人类常模换算出一个「IQ 分数」。

据悉,该测试可一定程度衡量 AI 的逻辑推理、抽象思维与问题解决能力,帮助了解 AI 在这些方面的发展水平,还能标准化对比不同 AI 模型的智能水平。

不过,依据智商测试分数并不能准确判断 AI 的综合智能水平。既不能直接类比成人格化的「比人类聪明」,也不代表 AI 具备与人类相同的抽象智能。

值得一提的是,从最近的反馈来看,GPT-5 的确出现了不小的问题,至少对比官方公布的各种霸榜的参数,在实际体验上有着明显的差距。

而在日前 OpenAI 在社区的 AMA 中,奥特曼也承认 GPT-5的「智能路由」坏了,导致 GPT-5 变笨,并进行了修复和调整。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:大语言模型智能体成本降低28%!OPPO团队首次揭秘高效Agent系统设计
下一篇:1200 亿条工程建造数据支撑,我国首个隧道与地下空间领域垂直大模型发布
猜你喜欢
  • 香港大学团队首创针对AI事实核查系统的"真相反转"攻击法
  • 今年我国人形机器人销量将超万台,同比增长 125%
  • 华为发布AI推理“存算一体”突破:打破HBM垄断,金融AI落地再提速
  • 华为突破5G网络故障诊断难题:让AI像老工程师一样"看透"网络问题根源
  • 哈佛大学团队突破性发现:AI如何像人类一样从少量例子中快速学会新技能
  • 速递|Meta的AI音频竞赛再落子,双月连购PlayAI+WaveForms,补全AI情感语音拼图
  • 北京大学研究团队让AI像资深程序员一样找bug:ToolTrain智能代码定位系统横空出世
  • 美国一男子向 ChatGPT 寻求饮食建议,却被“误诊”导致罹患溴中毒
  • 3 分钟可成片,B站测试 AI 视频创作工具“花生 AI”
  • 上海AI实验室让AI学会玩转全新软件,不再需要人类手把手教学
11 09, 2025
3000 亿美元历史级大单:消息称 OpenAI 与 Oracle 甲骨文达成重磅云计算交易
Str Tom
站长
Str Tom 网络工作室
464
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客