AI在线 AI在线

豆包支持带有指定文字的图片生成,App已开启测试

近日,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。 用户可以在生图提示词中加入文本要求,如“一张带有「新年快乐」的图”,即可生成带有指定文字的图片。 目前该功能已经在豆包APP开启测试,即梦也已小范围测试。

近日,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如“一张带有「新年快乐」的图”,即可生成带有指定文字的图片。目前该功能已经在豆包APP开启测试,即梦也已小范围测试。

豆包支持带有指定文字的图片生成,App已开启测试

(用豆包生成带有文字的图片)

对文生图模型而言,如何在图像中精准生成文本一直是难题,尤其是中文文字,经常出现乱码。据介绍,相比英文字母,汉字字符结构更复杂,且字符数量要多两个数量级。豆包大模型团队相关负责人表示,豆包文生图模型通过打通LLM和DIT构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。

据观察,已有不少用户尝试使用该能力制作表情包、梗图漫画,或辅助生成海报,并在社交媒体平台发布。据介绍,当前该功能仅支持文生图时添加文字,暂不支持上传图片生成文字。

豆包支持带有指定文字的图片生成,App已开启测试

(即梦内测用户在社交媒体发布的图片)

豆包负责人表示,该能力刚刚推出,仍在完善和优化中。目前绝大多数情况下豆包能够准确生成指定文字,但仍存在少部分错字、漏字或小字乱码等情况。“不管文字、图片、还是音乐生成功能,豆包都希望能够降低创作门槛,帮助人们更好地表达和创造。”

据悉,豆包网页及电脑版也将在近期上线该能力。

相关资讯

极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别

极空间 NAS 官方宣布,全新 AI 功能 ——【AI 实验室】已正式上线,功能包括:自然语言搜索、相似图片搜索和图片文字识别。据介绍,【AI 实验室】可以帮助用户快速找出极相册中需要的图片,IT之家附内容如下:自然语言搜索智能搜图,开启后,可以使用自然语言搜索图片。点击智能 AI,开启智能搜图,在搜索框中输入文字“狗”,通过 AI 计算后,稍等片刻,就会把极相册中带“狗”的照片展示出来。相似图片搜索以图搜图,开启后,可以通过一张照片找到相似内容或是风格的其他图片。点击智能 AI,开启以图搜图,在极相册中找到一张你
3/7/2024 1:43:07 PM
汪淼

快手 CEO 程一笑放出豪言:自研大模型有信心在半年内达 GPT4.0 水平

在今晚的快手业绩电话会上,快手创始人兼 CEO 程一笑披露了公司在生成式 AI 领域的进展。程一笑表示,公司在去年启动 AI 战略后,一步步扎实推进自研大模型的研发训练。程一笑还放出豪言,声称有信心在未来半年内,使大模型的综合性能达到 GPT4.0 的水平。同时,他还称快手文生图大模型“可图”综合性能已超过 Midjourney V5 的水平。至于目前大热的文生视频领域,程一笑透露称公司已于去年底推进专项研发。“这对短视频生态来说,是巨大的机会。未来,快手会把生成模型和生产者工具结合起来,不断帮助创作者降低创作门槛
3/20/2024 8:54:57 PM
清源

腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用

感谢腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在 Hugging Face 及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲ 混元文生图效果▲ 混元长文生图效果升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,腾讯表示,混元 DiT 是首个中英双语 DiT 架构。混元 DiT 是一个基于 Diffusion transformer 的文本到图像生成模型,此模型具有中英文细粒度理解能力,混元 DiT 能够与用户进行多轮对话,根据上下文生
5/14/2024 5:01:24 PM
沛霖(实习)
  • 1