新京报客户端

好新闻 无止境

立即打开
蚂蚁数科、上海人工智能行业协会等发布大模型金融应用评测基准
新京报 记者 罗亦丹 编辑 陈莉
2025-07-28 14:30

新京报贝壳财经讯(记者罗亦丹)为了考察大模型在实际金融场景中部署的能力,7月28日,在世界人工智能大会论坛上,蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。目前,Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。


蚂蚁数科还在会上正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造“可靠、可控、可优化”的智能中枢。Agentar-Fin-R1基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型。


Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。


蚂蚁数科CEO赵闻飙表示,“通用大模型距离产业实际应用存在‘知识鸿沟’。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。”


编辑 陈莉 校对 刘军

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
全球首个AI智能体安全测试标准发布
科技
贝壳财经年会闭幕,在开放与韧性共生长中锚定中国经济“下一站”
财经
在网上得的病,是时候在网上医了?
新京号
WAIC观察:大模型在落地,机器人在风口
科技
王凌航:AI将重塑医疗生态,让医疗资源普惠可及
智库
AQ对医院意义或不输DeepSeek
智库
金山办公发布原生Office智能体WPS灵犀,以AI智能体引领中国办公迈入助理时代
企业资讯
MedBench最新榜单出炉!深兰科技医疗大模型综合测评第一
企业资讯
2025贝壳财经年会即将启幕,聚焦中国经济开放与韧性共生长
财经
交流合作结硕果,创新驱动启新程:第十九届鄂尔多斯煤博会圆满落下帷幕!
企业资讯

新京报报料邮箱:67106710@bjnews.com.cn