火山引擎发布深度思考模型豆包1.5

新京报记者罗亦丹编辑黄鑫宇

2025-04-17 20:09

新京报贝壳财经讯（记者罗亦丹）当腾讯和百度选择在C端产品接入DeepSeek获得大量关注时，4月17日，字节跳动迈出了自己在推理模型领域的关键一步——正式发布豆包1.5・深度思考模型。

字节跳动旗下火山引擎总裁谭待以“效果好、延迟低、支持多模态”来描述这一模型。他表示，“深度思考模型是构建Agent的基础，模型要有能力做好思考、计划和反思，并且一定要支持多模态，就像人类具备视觉和听觉一样，Agent才能更好地处理复杂任务。”

在关键的技术性能方面，火山引擎方面披露豆包1.5在通用任务中的人类评估表现超DeepSeek R18%，覆盖多场景需求。而单位推理成本相比DeepSeek R1降低50%。

技术报告显示，豆包深度思考模型采用MoE架构，总参数为200B，激活参数仅20B，基于高效算法和高性能推理系统，豆包模型API服务在保障高并发的同时，延迟低至20毫秒。

豆包深度思考模型还具备视觉推理能力，能像人类一样对看到的事物进行联想和思考，谭待举例说明，“模型可以看懂复杂的企业项目管理流程图表，快速定位到关键信息，并以强大的指令遵循能力，严格按照流程图，回答客户的问题；分析航拍图时，能结合地貌特征判断区域开发可行性。有多模态能力的加持，豆包深度思考模型可以助力企业在更多场景实现智能化升级。”

据火山引擎披露，截至2025年3月底，豆包大模型日均tokens调用量已达到12.7万亿，较去年5月发布时增长上百倍。谭待表示，Agent智能体应用发展将带动大模型进一步普及。

此外，火山引擎还同步升级了文生图模型3.0、视觉理解模型，并推出OS Agent解决方案及AI云原生推理套件。

编辑黄鑫宇

校对王心

来阅读我的更多文章吧

罗亦丹

新京报记者

记者主页