阿里开源首个全模态大模型Qwen2.5-Omni 可识别情绪

新京报记者罗亦丹编辑岳彩周

2025-03-28 09:55

新京报贝壳财经讯（记者罗亦丹）3月27日，阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B，可同时处理文本、图像、音频和视频等多种输入，并实时生成文本与自然语音合成输出。

在权威的多模态融合任务OmniBench等测评中，Qwen2.5-Omni刷新业界纪录，全维度超越Google的Gemini-1.5-Pro等同类模型。Qwen2.5-Omni以接近人类的多感官方式“立体”认知世界并与之实时交互，还能通过音视频识别情绪。目前开发者和企业可免费下载商用Qwen2.5-Omni，手机等终端智能硬件也可部署运行。

编辑岳彩周

校对杨许丽

来阅读我的更多文章吧

罗亦丹

新京报记者

记者主页