新京报客户端

好新闻 无止境

立即打开
可实现离线环境AI对话 通义千问大模型落地手机芯片
新京报 记者 罗亦丹 编辑 陈莉
2024-03-28 12:04

新京报贝壳财经讯(记者罗亦丹)想要使用大模型,但必须联网?未来可能一部手机便能支撑起AI对话的进行。3月28日,贝壳财经记者获悉,全球最大的智能手机芯片厂商MediaTek联发科,已成功在天玑9300等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。


具体来看,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线运行即时多轮AI对话应用,连续推理功耗增量不到3W,这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有AI推理性能及功耗表现,标志着Model-on-Chip(芯片上模型)的探索正式从验证走向商业化落地新阶段。


端侧AI是大模型落地的极具潜力的场景之一。利用终端算力进行AI推理,可大幅降低推理成本、保证数据安全并提升AI响应速度,让大模型可以更好地为用户提供个性化体验。然而,要将大模型部署并运行在终端,需完成从底层芯片到上层操作系统及应用开发的软硬一体深度适配,存在技术未打通、算子不支持、开发待完善等诸多挑战。


阿里巴巴通义实验室业务负责人徐栋介绍称,阿里云与MediaTek在模型瘦身、工具链优化、推理优化、内存优化、算子优化等多个维度展开合作,实现了基于AI处理器的高效异构加速,真正把大模型“装进”并运行在手机芯片中,给业界成功打样端侧AI的Model-on-Chip部署新模式。


基于天玑9300芯片,通义千问18亿参数大模型在推理时CPU占有率为30%左右,RAM占用少于2GB,推理速度超过20tokens/秒,可在离线环境下流畅实现多轮AI对话。据了解,相关成果将以SDK(软件开发工具包)的形式提供给手机厂商和开发者。


此外,双方团队也已完成了通义千问40亿参数大模型与天玑9300的适配,未来还将基于天玑适配70亿等更多尺寸大模型,“打样”并支持开发更多AI智能体及应用。


MediaTek无线通信事业部副总经理李彦辑博士表示,期待通过双方的合作可以为应用开发者和终端客户提供更强大的硬件和软件解决方案,同时促进生成式AI的端侧部署以及AI应用、AI智能体生态的快速发展。


编辑 陈莉 校对 赵琳


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
WAIC观察:大模型在落地,机器人在风口
科技
云知声携全栈AGI成果亮相WAIC 2025,让AI照进千万种可能
企业资讯
2025WAIC,这家“AI 新国企”六大行业落地样本引围观
企业资讯
趣丸科技与华为云签署全面合作协议,推动AI业务高质量发展
企业资讯
金山办公发布原生Office智能体WPS灵犀,以AI智能体引领中国办公迈入助理时代
企业资讯
阿里云发布通义灵码AI IDE,新增编程智能体
财经
金融壹账通智能客服机器人实现7×24小时在线,重塑运营成本结构
企业资讯
三周年,新紫光集团“交卷”!
企业资讯
银河通用王鹤最新演讲:要善于运用合成数据,加速推动人形机器人新质生产力的大规模应用
科技
未来生活全景图 500余项创新技术亮相雄安
新京号

新京报报料邮箱:67106710@bjnews.com.cn