新京报客户端

好新闻 无止境

立即打开
火山引擎发布深度思考模型豆包1.5
新京报 记者 罗亦丹 编辑 黄鑫宇
2025-04-17 20:09

新京报贝壳财经讯(记者罗亦丹)当腾讯和百度选择在C端产品接入DeepSeek获得大量关注时,4月17日,字节跳动迈出了自己在推理模型领域的关键一步——正式发布豆包1.5・深度思考模型。


字节跳动旗下火山引擎总裁谭待以“效果好、延迟低、支持多模态”来描述这一模型。他表示,“深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。”


在关键的技术性能方面,火山引擎方面披露豆包1.5在通用任务中的人类评估表现超DeepSeek R18%,覆盖多场景需求。而单位推理成本相比DeepSeek R1降低50%。


技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数仅20B,基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。


豆包深度思考模型还具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,谭待举例说明,“模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并以强大的指令遵循能力,严格按照流程图,回答客户的问题;分析航拍图时,能结合地貌特征判断区域开发可行性。有多模态能力的加持,豆包深度思考模型可以助力企业在更多场景实现智能化升级。”


据火山引擎披露,截至2025年3月底,豆包大模型日均tokens调用量已达到12.7万亿,较去年5月发布时增长上百倍。谭待表示,Agent智能体应用发展将带动大模型进一步普及。


此外,火山引擎还同步升级了文生图模型3.0、视觉理解模型,并推出OS Agent解决方案及AI云原生推理套件。


编辑 黄鑫宇

校对 王心

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
火山引擎发布豆包·视觉理解模型,1块钱能处理284张图片
科技
边想边搜!豆包测试新版深度思考功能
科技
2025中国科幻大会——科幻游戏产业发展大会成功举办
新京号
中关村论坛年会“科技办会”:在机械星辰里寻找未来坐标
科技
谭待:豆包1.5Pro模型的预训练、推理成本均低于国内模型
科技
大模型震荡时刻:DeepSeek掀桌百度开源 免费成必答题
科技
豆包大模型1.5Pro版面世:用户端已开始灰测,开发者可调用
科技
上汽集团打出“三套拳”,与华为合作采取“智选车”模式
汽车
生成式人工智能赋能基础教育高质量发展论坛在北京市广渠门中学召开
新京号
四维度实测更新后Manus:任务成功率上升,复杂任务仍难胜任
科技

新京报报料邮箱:67106710@bjnews.com.cn