新京报客户端

好新闻 无止境

立即打开
智谱发布“开源年”首个模型CogView4 可生成带汉字图片
新京报 记者 罗亦丹 编辑 王进雨
2025-03-04 18:48

新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。


CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。


CogView4生成的图片


校对 穆祥桐


来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
中国AI大模型测评报告出炉,8款大模型首测伦理判断能力
科技
奥运冠军带货土鸡蛋?总台曝光AI克隆声音乱象
新京号
银河通用王鹤最新演讲:要善于运用合成数据,加速推动人形机器人新质生产力的大规模应用
科技
活力中国调研行丨“人工智能第一城”是如何炼成的?
北京
智源发布“悟界”系列大模型 重塑AI交互边界
科技
全球数字经济标杆城市怎么建?——看北京如何“点数成金”
北京
北京引领数字经济迈向数智经济
北京
智谱获北京市人工智能产业投资基金追加投资2亿元
科技
2025实验室自动化行研报告:国产化率逆势提升,出海创收火热
企业资讯
记者实测|智能体按下“加速键” 大厂争当MCP“应用商店”
科技

新京报报料邮箱:67106710@bjnews.com.cn