新京报客户端

好新闻 无止境

立即打开
快手发布大模型产品“可图”,使用扩散模型以提升画质
新京报 记者 白金蕾
2024-05-31 20:57
据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成。在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配。

新京报贝壳财经讯(记者 白金蕾)5月31日消息,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。目前,用户可以通过“可图大模型”官方网站和微信小程序,免费使用各项AI图像功能。值得注意的是,可图只需一张图片和几秒钟时间,便可生成一套AI图像。


在2024年一季度财报电话会上,快手首席执行官程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。


从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可保留人像的自然特征,一键生成各种风格的人像作品。目前,可图已上线10余种AI形象定制风格玩法。另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、创意十足的绘画作品。用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。


可图文生图作品。图|受访者供图


快手大模型团队的技术能力为产品提供了支撑。据官方介绍,“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。


在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,引入了经过优质专家标注的图文数据集,以提升模型性能表现。


去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。


编辑 孙文轩

校对 柳宝庆

相关推荐
AI变现叠加全球化突破,“中厂”美图去年盈利近10亿
科技
​AWE观察|“智能经济”之下,家电产业争夺智能终端入口
科技
记者实测AI“魔改”明星:1分钟报价数百元,平台审核存盲区,多明星同陷骗局
科技
存储芯片超级景气周期延续
新京号
回望2025|大厂入场斗法,“AI六小龙”变“四小强”
科技
调查|一门“洗稿”生意:AI抄袭“神韵”,爆款文章遭批量魔改
科技
10月全媒介之星中国AI应用榜发布:前二十强中“大厂”占八成
科技
AI成广电项目必答题后如何加速应用,听听这场沙龙嘉宾怎么说?
科技
实测|AI“玩坏”追星:亲密照合成失控,未成年明星被“擦边”
科技
从企业级到 C 端爆发,“双节”消费热潮下的AI新战场
科技

新京报报料邮箱:82708677@bjnews.com.cn