前瞻人工智能安全评估体系与基座平台入列北京人工智能前沿成果

新京报记者罗亦丹编辑杨娟娟

2026-01-05 12:34

新京报贝壳财经讯（记者罗亦丹）2026北京人工智能创新高地建设推进会于1月5日举办，会上发布北京人工智能8大前沿成果。其中，由北京前瞻人工智能安全与治理研究院发布的“前瞻人工智能安全评估体系与基座平台”在列。

作为人工智能安全与治理的代表性北京创新成果，“前瞻人工智能安全评估体系与基座平台”探讨如何以安全为基石，引领人工智能的稳健发展。该体系打破传统安全评估的单一维度局限，形成了全领域、多层次的评估框架。从覆盖范围来看，它根植基础安全，延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度，覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等多个关键领域。从评估重点来看，特别聚焦隐私与数据保护、滥用恶用、身心伤害、虚假信息防范、自主人工智能高阶风险等核心痛点，进行体系化设计与评估。

前瞻院通过测试发现了一个关键问题：近年来的大模型在安全性方面并未明显提升，部分新近模型的攻击成功率甚至更高。但同时前瞻院也验证了一个重要结论：人工智能模型防御并不必然需要重新训练模型，在在线推理阶段通过部署安全护栏，就能显著提升模型安全水平。针对前瞻安全基准中的各类风险，前瞻院打造了 “前瞻・灵御”AI安全攻防平台，可为企业提供标准化评估流程、全面系统的安全分析，帮助企业准确识别模型安全水平，并提供针对性的防御方案与加固建议。

此外，前瞻院还构建了 “前瞻・灵度”AI 伦理评估平台，专注于AI伦理的智能评估与价值校准。平台能够对上百个大模型进行实时动态监控与并行测试，评估其在六大维度、90 个细分类别的伦理合乎度。其集成了以中国价值观为核心的大规模中文价值语料库，覆盖3个层面、12个核心价值、50个衍生价值，累计25万余条规则；收录了全球 200 余项伦理原则与规范，以及40余项中英文法律法规与国际公约，提供精准的合规指引。可以对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物质、核物质、自动驾驶等领域进行自动化伦理评估辅助。

前瞻院认为，人工智能安全应成为 “第一性原理”，是不可删除、无法违背的底线要求。安全治理能力基座的构建是北京引领人工智能稳健发展的基础，让我们更有把握地将AI安全地应用于现代化建设，与全世界共享人工智能发展的机遇与成果。

编辑杨娟娟

校对陈荻雁

来阅读我的更多文章吧

罗亦丹

新京报记者

记者主页