新京报客户端

好新闻 无止境

立即打开
智谱发布“开源年”首个模型CogView4 可生成带汉字图片
新京报 记者 罗亦丹 编辑 王进雨
2025-03-04 18:48

新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。


CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。


CogView4生成的图片


校对 穆祥桐


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
智谱获北京市人工智能产业投资基金追加投资2亿元
科技
记者实测|智能体按下“加速键” 大厂争当MCP“应用商店”
科技
北京市去年数字经济增加值突破2.2万亿元,同比增长7.7%
北京
人工智能群星闪耀时——探访北京“人工智能第一城”
北京
​实探|一夜爆火的Manus,背后团队是什么来头
科技
AI变声制造“明星代言”:克隆刘晓庆声音悄悄带货
科技
大模型传媒能力如何?新京报AI研究院报告:存幻觉,写作待提高
科技
国产AI音乐崛起,趣丸科技领跑AI声音赛道
财经
北京文化新质生产力领跑全国
北京
北京大学多项成果荣获2023年度北京市科学技术奖
新京号

新京报报料邮箱:67106710@bjnews.com.cn