新京报客户端

好新闻 无止境

立即打开
豆包文生图能力升级 支持一键生成含指定文字的图片
新京报 记者 白金蕾 编辑 岳彩周
2024-12-06 12:19

新京报贝壳财经讯(记者 白金蕾)12月5日消息,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如“一张带有‘新年快乐’的图”,即可生成带有指定文字的图片。目前该功能已经在豆包APP开启测试,即梦也已小范围测试,豆包网页及电脑版也将在近期上线该能力。


对文生图模型而言,如何在图像中精准生成文本一直是难题,尤其是中文文字,经常出现乱码。原因是相比英文字母,汉字字符结构更复杂,且字符数量要多两个数量级。豆包大模型团队相关负责人表示,豆包文生图模型通过打通LLM(大语言模型)和DIT(扩散模型)构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。


豆包负责人表示,该能力刚刚推出,仍在完善和优化中。目前绝大多数情况下豆包能够准确生成指定文字,但仍存在少部分错字、漏字或小字乱码等情况。“不管文字、图片还是音乐生成功能,豆包都希望能够降低创作门槛,帮助人们更好地表达和创造。”


编辑 岳彩周

校对 卢茜

相关推荐
实测|AI“玩坏”追星:亲密照合成失控,未成年明星被“擦边”
科技
商汤「日日新6.5」全新升级,让AI完成从“工具”到“人”的跃迁
企业资讯
头条 | 明天报名!2026年军队文职招考公告、报考指南、岗位计划来了!
新京号
《 “临”听民声 “泉”心解答》 第九期(公安业务类专题),来啦
新京号
原子化创作时代:Vidu Q1 把叙事拆解为“人/景/物”三原色
企业资讯
从140字发帖到一键生视频!微博联手Vidu开放平台引全民创作新风潮
企业资讯
Google 这款免费 AI,连 OpenAI 都在夸
新京号
字节跳动发布2024企业社会责任报告,扣子、即创、豆包等AI技术成亮点
企业资讯
卓特视觉 AI 绘图全新升级:三步出图 + 中文直出海报,供稿平台内测同步开启
企业资讯
腾讯元宝文生图升级 混元和DeepSeek支持一句话生图
科技

新京报报料邮箱:67106710@bjnews.com.cn