新京报客户端

好新闻 无止境

立即打开
我国首部大模型国家标准实施,填补技术评价体系空白
新京报 编辑 张磊
2025-12-26 17:38

新京报讯 据市场监管总局消息,近日,GB/T 45288《人工智能 大模型》系列国家标准正式实施,标志着我国大模型产业进入“科学权威、统一规范”新阶段。作为首部聚焦通用大模型的国家标准,该系列填补了技术评价体系空白,明确性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会(CNAS)认可。

 

基于此构建的“求索”-LMBench评测基准,整合方法、数据集与自动化平台,成为行业公认的“能力标尺”。评测体系已形成主流大模型白名单,为央企、国企选型提供依据,并支撑中石化、南方电网等建设行业大模型,完成对华为盘古、讯飞星火、中国移动九天等模型的场景验证。

 

截至目前,标准工具完成千余项评测任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成“研发—评测—应用—升级”闭环。

 

标准国际化同步推进。面向东盟编制英语、老挝语、高棉语版本,填补区域空白;我国开源模型架构已被新加坡等国项目采用,彰显标准引领下的全球影响力。

 

编辑 张磊


相关推荐
人工智能终端迎来“体检表”
新京号
哲学社会科学期刊评价体系不断完善,今年新增“伯乐指数”等指标
教育
AI来了,高校如何带学生“突围”
新京号
维护产业链供应链安全,让发展不“掉链”
新京号
首个牙膏强制性国家标准征求意见,儿童牙膏获得专项管理
消费
一周碳要闻:钙钛矿电池在中国空间站迎来“大考”(碳报第197期)
财经
创新驱动竹产业拔节登高
新京号
一周碳要闻:AI涌入电力系统(碳报第194期)
财经
洗面奶新国标出炉:覆盖类型扩大至6种,儿童产品需标“小金盾”
消费
一周碳要闻:“反内卷”迎来刚性执法(碳报第189期)
财经

新京报报料邮箱:82708677@bjnews.com.cn