新京报客户端

好新闻 无止境

立即打开
美团发布并开源视频生成模型 将融入自动驾驶、具身智能等场景中
新京报 记者 陈维城 编辑 杨娟娟
2025-10-27 11:29

新京报贝壳财经讯(记者陈维城)10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平),并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性。


LongCat-Video的模型评估围绕内部基准测试和公开基准测试展开,覆盖 Text-to-Video(文本生成视频)、Image-to-Video(图像生成视频)两大核心任务。依托视频续写任务预训练,新模型可稳定输出5分钟级别的长视频,视频推理速度提升至10.1倍。


美团LongCat团队认为,此次发布的视频生成模型,是为探索“世界模型”迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中。


编辑 杨娟娟

校对 陈荻雁


来阅读我的更多文章吧
陈维城
新京报记者
记者主页
相关推荐
京东开源图像模型,实测AI如何能真正“看懂”空间
科技
巨头混战!阿里、京东、百度集体押注,具身智能赛道全面开战
科技
小米补课AI
新京号
具身智能困于数据孤岛,京东为何入局第一视角数据赛道?
科技
中传程皓楠:AI鉴伪要场景适配,未来学科边界将不断淡化
科技
朝气蓬勃的年轻人投身火热的年轻事业!一年来,申城大模型生态加快成势
新京号
AI+游戏白皮书:63.6%游戏从业者“每天都会使用”AI工具
科技
落地应用、网络安全和治理挑战
新京号
奇瑞官宣:与NVIDIA合作!
新京号
一季度,北京工信领域对全市经济增长贡献率超五成
北京

新京报报料邮箱:82708677@bjnews.com.cn