新京报客户端

好新闻 无止境

立即打开
前瞻人工智能安全评估体系与基座平台入列北京人工智能前沿成果
新京报 记者 罗亦丹 编辑 杨娟娟
2026-01-05 12:34

新京报贝壳财经讯(记者罗亦丹)2026北京人工智能创新高地建设推进会于1月5日举办,会上发布北京人工智能8大前沿成果。其中,由北京前瞻人工智能安全与治理研究院发布的“前瞻人工智能安全评估体系与基座平台”在列。


作为人工智能安全与治理的代表性北京创新成果,“前瞻人工智能安全评估体系与基座平台”探讨如何以安全为基石,引领人工智能的稳健发展。该体系打破传统安全评估的单一维度局限,形成了全领域、多层次的评估框架。从覆盖范围来看,它根植基础安全,延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度,覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等多个关键领域。从评估重点来看,特别聚焦隐私与数据保护、滥用恶用、身心伤害、虚假信息防范、自主人工智能高阶风险等核心痛点,进行体系化设计与评估。

前瞻院通过测试发现了一个关键问题:近年来的大模型在安全性方面并未明显提升,部分新近模型的攻击成功率甚至更高。但同时前瞻院也验证了一个重要结论:人工智能模型防御并不必然需要重新训练模型,在在线推理阶段通过部署安全护栏,就能显著提升模型安全水平。针对前瞻安全基准中的各类风险,前瞻院打造了 “前瞻・灵御”AI安全攻防平台,可为企业提供标准化评估流程、全面系统的安全分析,帮助企业准确识别模型安全水平,并提供针对性的防御方案与加固建议。

此外,前瞻院还构建了 “前瞻・灵度”AI 伦理评估平台,专注于AI伦理的智能评估与价值校准。平台能够对上百个大模型进行实时动态监控与并行测试,评估其在六大维度、90 个细分类别的伦理合乎度。其集成了以中国价值观为核心的大规模中文价值语料库,覆盖3个层面、12个核心价值、50个衍生价值,累计25万余条规则;收录了全球 200 余项伦理原则与规范,以及40余项中英文法律法规与国际公约,提供精准的合规指引。可以对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物质、核物质、自动驾驶等领域进行自动化伦理评估辅助。

前瞻院认为,人工智能安全应成为 “第一性原理”,是不可删除、无法违背的底线要求。安全治理能力基座的构建是北京引领人工智能稳健发展的基础,让我们更有把握地将AI安全地应用于现代化建设,与全世界共享人工智能发展的机遇与成果。


编辑 杨娟娟

校对 陈荻雁


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
从“挖煤”到“挖数据、挖算力、挖智能”,门头沟向“新”而行
新京号
「书目推荐」长安街读书会第20260601期干部学习书目博览
新京号
将AI融入极端天气预报场景,人工智能青年科学家论坛发布成果
北京
北京全力建设人工智能第一城,“科幻场景已成为市民生活日常”
北京
“智汇未来,青年引领——人工智能青年科学家论坛”在京举办
新京号
北京全力建设人工智能第一城 “科幻场景已成为市民生活日常”
新京号
天津智能科技“军团”以硬核实力赋能民生
新京号
全球数字教育十大研究热点、十大创新案例发布
教育
首都高校凸显基础研究主力军作用
新京号
今日开幕!门头沟展区携三大产业创新成果,亮相北京科博会
新京号

新京报报料邮箱:82708677@bjnews.com.cn