新京报客户端

好新闻 无止境

立即打开
解决传统架构记忆瓶颈 MiniMax发布新一代模型
新京报 记者 罗亦丹 编辑 岳彩周
2025-01-15 23:19

新京报贝壳财经讯(记者罗亦丹)1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。


未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。


技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。


值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”


编辑 岳彩周

校对 穆祥桐

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
“北京队”推动AI迈向“物理觉醒”
新京号
火山引擎发布新一代汽车AI解决方案,一个AI大脑深度联动整车
新京号
苹果花2.5亿美元和解Siri相关诉讼案,单台设备最高获赔95美元
新京号
英伟达豪掷200亿美金押注的新赛道,中国的解题人是个华为老兵
新京号
透视年报|营收增超2.4倍,为何“国产GPU第一股”还是亏?
财经
“90后”的他半月内两上《新闻联播》,现在又交新作业
科技
机器人“投身”家庭保洁 具身智能迈向家庭“终极考场”
新京号
百度:文库网盘既是“起点”又是“终点”,所以要做好中间桥梁
科技
地平线发布智能体芯片和操作系统 余凯:将以整车智能为核心
科技
火箭研发按周算 电镜装上AI大脑 北京智能科研平台成企业创新加速器
新京号

新京报报料邮箱:82708677@bjnews.com.cn