大模型测评报告：深度思考能力有待提升，近五成受访者认为一般

新京报记者韦英姿韦博雅编辑王进雨

2025-07-10 19:22

新京报贝壳财经讯（记者韦英姿韦博雅）7月10日，在2025贝壳财经年会主题论坛“建设‘开源’之都：智AI未来，生态共澎湃”上，新京报AI研究院联合中国经济传媒协会发布第二期《中国AI大模型测评报告——大模型赋能传媒行业使用与满足研究》（下称：报告）。报告显示，对于大模型深度思考能力在媒体工作上的表现，受访者持中等偏上态度（即：一般、较为满意、非常满意）。

其中，46.41%的受访者认为大模型深度思考能力一般，41.18%的受访者较为满意，仅有5.23%的受访者表示非常满意。此外，7.19%的受访者满意程度处于偏下（即：不太满意、很不满意）。

对于大模型解答专业领域知识的能力，受访者们基本满意，认为其“完全无法回答”的人数占比已不足1%。与去年相比，认为大模型“完全无法回答”“大部分时间不能准确回答专业知识提问，事实或逻辑错误出现频率高”“偶尔能够回答专业知识提问”的受访者比例均有所下降。其中，认为“完全无法回答”的受访者比例降幅最大，与去年相比减少7.57个百分点。

编辑王进雨

校对卢茜

来阅读我的更多文章吧

韦英姿

新京报记者

记者主页

韦博雅

新京报记者

记者主页