新京报客户端

好新闻 无止境

立即打开
众智FlagOS完成9芯片Day0适配国产大模型,首次实现云到端生态覆盖
新京报 记者 张晓慧 编辑 杨娟娟
2026-05-28 15:46

新京报贝壳财经讯(记者张晓慧)近日,面壁智能正式发布并开源新一代端侧文本基座大模型MiniCPM5-1B,INT4(量化技术)量化后权重仅0.5GB,可在手机、浏览器等90%以上终端设备运行。新京报贝壳财经记者获悉,众智FlagOS社区基于统一多芯片软件栈,通过vLLM-plugin-FL推理插件完成MiniCPM5-1B的跨芯片适配与推理部署Day-0发布。


据悉,此次适配覆盖英伟达、华为昇腾、平头哥、摩尔线程、海光、昆仑芯、沐曦、天数智芯等8类数据中心AI加速芯片。


此外,针对MiniCPM5面向端侧部署的特点,此次跨芯片适配首次将Day-0适配延伸至 ARM端侧平台。ARM架构广泛存在于手机、AIPC、机器人、车载终端、边缘网关和各类嵌入式设备中,是端侧AI部署中数量最大、覆盖最广的计算平台之一。随着MiniCPM5-1B这类小尺寸高密度模型的发展,越来越多推理任务有机会从云端GPU下沉到端侧设备。


据了解,FlagOS支持MiniCPM5-1B在ARM上以int8、bf16、fp32三种精度运行,实现从数据中心多款AI芯片到端侧ARM的“一套代码、跨架构运行”。


编辑 杨娟娟

校对 王心






来阅读我的更多文章吧
张晓慧
新京报记者
记者主页
相关推荐
众智FlagOS 2.0发布,中关村人工智能开源联盟正式成立
北京
北京亦庄展区携40家企业、76款产品亮相北京科博会
北京
透视年报|营收增超2.4倍,为何“国产GPU第一股”还是亏?
财经
IPO新观察|燧原科技三年亏40亿上市,腾讯既当“股东”又当“金主”
财经
北京邮电大学具身智能专业今年首次招生,将培养“实战派”
教育
21项重大科技成果集中发布
新京号
这里有怀柔!面向四大领域,多项成果集中发布
新京号
英伟达豪掷200亿美金押注的新赛道,中国的解题人是个华为老兵
新京号
圆满收官!21项重大创新成果发布
新京号
中国茶产业发展“破圈”报告(2026)
消费

新京报报料邮箱:82708677@bjnews.com.cn