新京报客户端

好新闻 无止境

立即打开
成本最高降九成 百度发布首个端到端语音语言大模型
新京报 记者 罗亦丹 编辑 寇德娜
2025-03-31 21:20

新京报贝壳财经讯(记者罗亦丹)3月31日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。当日,文小言宣布率先接入该模型。


接入全新的端到端语音语言大模型后,文小言能支持更拟真的语聊效果,并覆盖重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,推理响应速度极快,可将语音交互用户等待时长从行业常见的3-5秒降低至1秒左右。


更新后的文小言还支持“多模型融合调度”,通过整合百度自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优模型组合,或可根据需求灵活选择单一模型完成特定任务。


编辑 寇德娜

校对 穆祥桐

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
智元发布首个通用具身基座大模型,“天才少年”稚晖君的AI棋局
科技
大模型震荡时刻:DeepSeek掀桌百度开源 免费成必答题
科技
AI变局中的数据标注:从价格战迈向技术竞争
科技
智源研究院发布2025十大AI技术趋势:具身智能元年到来
科技
万字专访谭待:火山引擎从不赔钱换市场,给豆包大模型打80分
财经
回顾2024:AI和新硬件,开始改变我们的生活方式
新京号
未来产业为新质生产力发展提供新赛道新领域
科技
未来产业图谱①|中国无人驾驶出租车全球领先 北京测试规模领跑
财经
何小鹏:端到端大模型加速智驾发展,改变行业规则
汽车
中国AI大模型测评报告:公众及传媒行业大模型使用与满足研究
科技

新京报报料邮箱:67106710@bjnews.com.cn