快手发布大模型产品“可图”，使用扩散模型以提升画质

新京报记者白金蕾

2024-05-31 20:57

据官方介绍，“可图”大模型的参数规模达十亿级，这些数据来自于开源社区、快手内部构建和自研AI技术合成。在画质提升方面，可图模型通过优化扩散模型的加噪去噪理论，以实现对高质量、细节丰富的图像生成的训练和推理的精准适配。

新京报贝壳财经讯（记者白金蕾）5月31日消息，快手自研大模型产品“可图”（Kolors）正式对外开放，支持文生图和图生图两类功能，已上线20余种AI图像玩法。目前，用户可以通过“可图大模型”官方网站和微信小程序，免费使用各项AI图像功能。值得注意的是，可图只需一张图片和几秒钟时间，便可生成一套AI图像。

在2024年一季度财报电话会上，快手首席执行官程一笑介绍，今年一季度，快手稳步推进自研大模型各项性能的迭代提升，并且加快大模型在各业务场景的应用。

从具体功能上看，一方面，可图提供AI形象定制功能，即图生图功能，通过人像保持技术，可保留人像的自然特征，一键生成各种风格的人像作品。目前，可图已上线10余种AI形象定制风格玩法。另一方面，快手可图大模型也提供AI创作功能，即文生图，支持用户自由输入文本，生成风格多样、创意十足的绘画作品。用户也可以上传参考图，可图将根据参考图像的风格、主题和细节等内容，生成既符合创意描述又与参考图相关的图像作品。

可图文生图作品。图|受访者供图

快手大模型团队的技术能力为产品提供了支撑。据官方介绍，“可图”大模型的参数规模达十亿级，这些数据来自于开源社区、快手内部构建和自研AI技术合成，覆盖了常见的千万级中文实体概念，还引入强化学习和奖励模型技术（RLHF），解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

在画质提升方面，可图模型通过优化扩散模型的加噪去噪理论，以实现对高质量、细节丰富的图像生成的训练和推理的精准适配，引入了经过优质专家标注的图文数据集，以提升模型性能表现。

去年9月，“可图”大模型平台已在快手开启内测，快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法，集合了文生图、图生图、扩图等功能，也是基于可图大模型能力。

编辑孙文轩

校对柳宝庆