蚂蚁数科、上海人工智能行业协会等发布大模型金融应用评测基准

新京报记者罗亦丹编辑陈莉

2025-07-28 14:30

新京报贝壳财经讯（记者罗亦丹）为了考察大模型在实际金融场景中部署的能力，7月28日，在世界人工智能大会论坛上，蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构推出Finova大模型金融应用评测基准，深度考察智能体能力、复杂推理以及安全合规能力。目前，Finova已经全面开源，推动行业共同提升大模型在金融领域的应用水平。

蚂蚁数科还在会上正式发布金融推理大模型Agentar-Fin-R1，为金融AI应用打造“可靠、可控、可优化”的智能中枢。Agentar-Fin-R1基于Qwen3研发，在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型。

Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MOE架构模型，获得更优推理速度。此外，还有非推理版本的14B和72B参数大模型，以满足金融机构在多样化场景下的部署需求。

蚂蚁数科CEO赵闻飙表示，“通用大模型距离产业实际应用存在‘知识鸿沟’。构建专业的金融大模型是推进金融与AI深度融合的必然路径，未来，金融大模型的应用深度将成为金融机构竞争力的关键要素。”

编辑陈莉校对刘军

来阅读我的更多文章吧

罗亦丹

新京报记者

记者主页