测了 2 天豆包新上线的超能创意 Agent,今天正式写一篇评测文章 #豆包 #超能创意#Agent。
看我的公众号的老粉都知道,我很少用标题党,过去 278 篇原创文章,我只盛赞了可灵 AI 和 Deepseek,这两个国产 AI 工具。
豆包灰度上线了超能创意 Agent,灰度用户可体验全新的生图能力,测了几十个豆包超能创意 Agent,我惊艳了,然后毫不客气地把我的美赞,给了豆包。

GPT-4o 好是好,但是他的使用门槛高,20 美刀的订阅费,需要魔法,养肥了各种镜像站。但是最致命的是 GPT-4o 在降智,所以一开始出来的时候 ComfyUI 工作流玩家瑟瑟发抖。
实测亮点
2 天实测,豆包超能创意已经完美了平替了 GPT-4o,并且在某种程度上更胜 GPT-4o,比如对中国语义和文化环境的理解,比如对汉字的兼容,以及半自动工作流。
体验完最大的亮点:
1.言出随行:一句话改图,扩图,换衣服,换背景,换 XX
2.自动化设计:海报、古诗词、短剧创作
3.创意源泉:不需要太专业的提示词,AI 可以生成各种创意、风格图片
本次评测内容:
1.一句生成电影分镜
2.风格转绘和风格迁移
3.一句话改图
4.三视图和表情包
5.海报设计
实测案例
电影分镜
豆包这个版本最大的一个亮点是一句话生成电影分镜,我使用了经典的王家卫电影风格来进行测试:
采用王家卫电影风格,生成 8 张电影插图,展现一对男女在美国相识相知相恋的过程。需要保持人物形象一致,每个分镜场景搭配文案,比例 「9:16」
下图是我截图的前 5 个分镜的示意图:

输入我们的指令,豆包 1-2 分钟就生成了 10 个完整的分镜,我们可以看到人物的一致性保持的很好,分镜也很有故事情节。

古诗词分镜
我们再来测试一下古诗词分镜,使用我 2 月份大爆的花木兰古诗词。
输入指令:
根据《木兰诗》古诗的内容意思,以及要表达的意境画面,生成古诗所有的分镜图片,画面风格是卡通风格,3d 皮克斯风格,每个画面都要出现一个穿粉色唐装服饰的女孩,并且保持人物一致,风格一致,着装一致。「16:9」
豆包:为你按照《木兰诗》的内容生成分镜图片,故事中的主角是一个穿着粉色唐装服饰的女孩。以下是分镜设计:
- 女孩坐在织布机前,愁容满面,心事重重。
- 女孩在集市上购置骏马、鞍鞯、辔头和长鞭,准备替父从军。
- 女孩告别父母,奔赴战场,一路上风餐露宿。
- 女孩在战场上奋勇杀敌,英姿飒爽,立下赫赫战功。
- 战争结束,女孩拒绝了赏赐,回到家乡与家人团聚。
- 女孩回到家中,恢复女儿装,与战友相见,战友们惊讶不已。

这是一个缩小版的花木兰分镜图,最后一张图的风格串了。
风格转绘
接下来测试下 GPT-4o 最火的吉卜力风格转绘。
参考这张图片,将它分别转绘成吉卜力,皮克斯,乐高,简画风格


我最喜欢第四张,你们呢。
风格迁移
ComfyUI 工作流中使用最广的是 Redux 和 Redux 图像风格迁移。
刚好前篇文章写了剑与美女 COS,我拿原图来进行测试下:
请根据这张图片的风格和人物姿势,生成类似的 5 张图,图中的主角是动漫的知名女性 IP


AI 是懂二次元的,秒换娜美几个知名 IP,构图也是可用的。
再来一组:生成类似风格的漫画,至少 5 张以上。


虽然缺少了真人 3D 效果,但是这画风也是爱了。
一句话改图
一句话改图,是 Gemini 2.0、 GPT-4o 主打点,我们试下豆包能不能听懂。
把图片的风格修改为真实摄影风格:

去除图片背景:

换成 JK 制服:

三视图
生成人物的三视图,以往是使用 ComfyUI 工作流或者 MJ 来完成。


豆包,做三视图真心香。
表情包
再来生成一组表情包:
帮我生成 4 张宫崎骏风格的表情包,表情要丰富,干净背景

根据现有人物,比如情侣合照,妥妥的社交利器。
生成梗图
梗图也可以玩起来,直接给了不同风格的套图。
请帮我生成八张表情包图片,主题为“不想上班”。要求如下:
人物形象:女性,风格统一,符合年轻人审美,职场风格。每张图片配幽默文字,融入城市牛马元素,背景为纯色。

海报设计(城市地标)
最后一个案例是海报设计,即梦的海报是出名了强。
请以无人机航拍视角生成 20 张中国著名旅游景点的图片,画质高清。图片上方需标注景点所在城市及景点名称,比例 「9:16」

接下来将生成四张深圳的城市海报,海报上带有深圳的地标建筑。画面风格为大气、现代的设计风格,色彩鲜明,突出城市的活力与科技感。

这 2 个案例的效果来说,比不过设计师的专业产出,但是对于非设计人员,不懂 AI 绘画的,一句话能出这种效果的海报,还是蛮有吸引力的。
体验入口:

体验入口
网址:https://www.doubao.com/chat/create-image
打开豆包网页版,左侧菜单栏—图像生成,如果有显示【超能创意 1.0】,那就是被灰度到了。
官方宣传:超能创意 1.0 版本不稳定,建议在【图像生成】技能下使用。
如果没被灰度到,点击这个链接申请,一般一天内通过。
https://bytedance.larkoffice.com/share/base/form/shrcnEjn2nIEZrQkWOiMfP1VxEc
操作说明:

最后,附上官方知识库,我的一些测试案例就是从官方知识库里面找的:
网址:https://bytedance.larkoffice.com/docx/OWpHdkNoYoBjHVxntQPcZa5Qndb
写在最后
以前有门槛的编程,设计,都在去中心化了。
先是 Gemini 2.0,后是 GPT-4o,再是各种平替吉卜力风格转绘的 AI 工具,AI 改图正在不断的平权设计,原本需要懂复杂提示词的 AI 作图,现在已经变成了“人人都是设计师”。如果说 AI 编码带来了程序员的哥们,那么 AI 设计(Agent)工具,也正在对设计这个领域带来深刻的影响。
AI 在平权,设计的天花板被打破了,未来更是比拼创意的时代了。AI 工具的进化,普通人进入 AI 领域,成长“AI 专家”的周期更短了。
豆包,让人人都可以用得起,免费,国产,简单,值得推荐。