新京报客户端

好新闻 无止境

立即打开
阿里开源首个全模态大模型Qwen2.5-Omni 可识别情绪
新京报 记者 罗亦丹 编辑 岳彩周
2025-03-28 09:55

新京报贝壳财经讯(记者罗亦丹)3月27日,阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。


在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度超越Google的Gemini-1.5-Pro等同类模型。Qwen2.5-Omni以接近人类的多感官方式“立体”认知世界并与之实时交互,还能通过音视频识别情绪。目前开发者和企业可免费下载商用Qwen2.5-Omni,手机等终端智能硬件也可部署运行。


编辑 岳彩周

校对 杨许丽


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
脑电大模型、脑机协同演进……2025脑机接口十大创新成果发布
时事
图解|全球首个人形机器人半程马拉松20支参赛队伍阵容全揭秘
科技
阿里云通义开源首个多模态推理模型QVQ
科技
新闻多一度 |教学、摘水果、送快递……人形机器人有多聪明?
时事
中国AI大模型测评报告:公众及传媒行业大模型使用与满足研究
科技
全球资产配置新视野 2024中国财富管理服务报告
财经
智源推出大模型全家桶及全栈开源技术基座新版图
科技

新京报报料邮箱:67106710@bjnews.com.cn