新京报客户端

好新闻 无止境

立即打开
大模型测评报告:深度思考能力有待提升,近五成受访者认为一般
新京报 记者 韦英姿 韦博雅 编辑 王进雨
2025-07-10 19:22

新京报贝壳财经讯(记者韦英姿 韦博雅)7月10日,在2025贝壳财经年会主题论坛“建设‘开源’之都:智AI未来,生态共澎湃”上,新京报AI研究院联合中国经济传媒协会发布第二期《中国AI大模型测评报告——大模型赋能传媒行业使用与满足研究》(下称:报告)。报告显示,对于大模型深度思考能力在媒体工作上的表现,受访者持中等偏上态度(即:一般、较为满意、非常满意)。


其中,46.41%的受访者认为大模型深度思考能力一般,41.18%的受访者较为满意,仅有5.23%的受访者表示非常满意。此外,7.19%的受访者满意程度处于偏下(即:不太满意、很不满意)。



对于大模型解答专业领域知识的能力,受访者们基本满意,认为其“完全无法回答”的人数占比已不足1%。与去年相比,认为大模型“完全无法回答”“大部分时间不能准确回答专业知识提问,事实或逻辑错误出现频率高”“偶尔能够回答专业知识提问”的受访者比例均有所下降。其中,认为“完全无法回答”的受访者比例降幅最大,与去年相比减少7.57个百分点。



编辑 王进雨


校对 卢茜

来阅读我的更多文章吧
韦英姿
新京报记者
记者主页
韦博雅
新京报记者
记者主页
相关推荐
中国AI大模型测评报告出炉,8款大模型首测伦理判断能力
科技
大模型如何赋能传媒业?权威测评报告来啦
科技
AI大模型、具身智能机器人…黄奇帆李萌王鹤等论道“智能”未来
科技
《中国企业家人工智能应用调研报告(2025)》全文发布
财经
年轻人生活方式报告②|五成受访者为AI付费 效率工具成新基建
财经
《2025年轻人生活方式报告》全文发布
财经
AI热下百万年薪“抢人”:投机者涌入,企业“掐尖”
科技
“AI幻觉”:一场人机之间的认知博弈
时事
游戏防沉迷,进入下半场
财经
中小学探索AI创意寒假作业,如何避免AI“帮手”变“枪手”?
教育

新京报报料邮箱:67106710@bjnews.com.cn