人工智能视觉推理的新突破:让机器像人类一样解释图像后再回答问题
这项由蒙纳士大学的柯福财教授与包括斯坦福大学、华盛顿大学在内的多所知名院校研究团队共同完成的大型综述研究,发表于2025年8月。这项研究系统性地回顾了2023年至2025年间26... ...
上海交通大学团队突破:让AI轻松读懂复杂表格,像人类一样理解数据关系!
这项由上海交通大学计算机科学与工程学院周轩贺教授团队主导的研究发表于2025年8月,题目为《ST-Raptor: LLM-Powered Semi-Structured Table Question Answering》。研究... ...
李飞飞团队新突破:让AI突破"探索瓶颈",小模型也能超越GPT-4!
这项由浙江大学宋明理教授团队与李想汽车等机构合作完成的研究发表于2025年8月,论文标题为《打破探索瓶颈:面向通用大语言模型推理的基于评分准则的脚手架强化学习》。有兴趣... ...
港大团队首次提出推理能力评估基准,让AI画图不再"按字面意思理解"
说到AI绘图,你可能觉得它们已经很厉害了——输入一句话就能生成精美的图片。但实际上,现在的AI画图工具还停留在"按字面意思理解"的阶段。这项由香港大学刘锡辉教授团队联合... ...
阿里巴巴推出Visual-CoG:AI绘画终于学会"分步思考"了
这项由阿里巴巴集团的李亚琪、陈鹏、韩明阳等研究团队开发的Visual-CoG(视觉引导链)技术发表于2025年8月,论文题为《Visual-CoG: Stage-Aware Reinforcement Learning w... ...
InternVL3.5:上海AI实验室的多模态AI新突破,让机器像人一样理解图文世界
这项由上海AI实验室InternVL团队开展的研究发表于2024年8月,论文作者包括王维云、高张伟、顾立新等众多研究人员。完整论文可通过GitHub代码库(https://github.com/OpenGVLab... ...
人工智能的"注意力"竟然有极限?卢森堡大学团队揭示AI模型的隐藏困境
在人工智能快速发展的今天,有一个看似简单却至关重要的问题一直困扰着研究者:当AI模型需要处理越来越长的文本时,为什么它们的表现会急剧下降?这就像一个学生在考试时,题... ...
波斯语AI视觉模型的教育大考:卡塔尔和伊朗研究团队推出首个波斯语多模态评估基准
这项由卡塔尔计算研究所的Omid Ghahroodi领导、联合伊朗谢里夫科技大学等多家机构的国际研究团队发表于2025年8月的预印本论文,为我们带来了一个全新的研究成果。研究团队开... ...
德国人这样改写文章,效果竟比ChatGPT还好!慕尼黑工业大学发布首个德语多层次文本改写数据集
这项由慕尼黑工业大学的Miriam Anschütz和Georg Groh团队领导的研究发表于2025年8月的国际计算语言学大会(COLING),论文名为《German4All – A Dataset and... ...
首次实现真正意义上的"图像记忆":希伯来大学突破3D生成技术瓶颈
这项由希伯来大学的Yosef Dayani、Omer Benishu和Sagie Benaim团队开展的研究发表于2025年8月的arxiv预印本平台,论文编号为arXiv:2508.16577v1。感兴趣的读者可以通过项目... ...