机哥愈发觉得,分辨互联网真实图片和 AI 图片的难度,已经不可同日而语了。
事情是这样的。
昨天 OpenAI 发布了新的生图模型—— GPT-image-2。
本以为它的能力,只是略优于谷歌的 nano Banana,但看了网友们用它生成的图、整出的活儿。
真的,哥们有点分不清真假了。

首先是在大模型基准测试中,GPT-image-2 没啥意外,取得了断档的领先。

然后咱们再来看看实际效果。
硅谷两大科技公司的话事人,马斯克和奥特曼,在网友轻描淡写的提示词下。
跑去了直播间卖瑜伽裤。

再输入 "Elon Musk 发了条微信朋友圈 "。
GPT-image-2 也哼哧哼哧干活,整了张像模像样的截图。
底下还有特斯拉、星链点赞,以及张一鸣、马化腾等大佬评论。

做个奎爷打 BOSS 的战神游戏截图,愣是看不出啥大破绽。

甚至说,一句话让它生成某个产品的详细配置一图流。
GPT-image-2 生成出来的文字、配图和介绍,都很条理清晰、排版舒适。

好奇心拉满的机哥,看了网友们整的活后,也是没忍住去实测了一波。
只能说,这新模型的语言理解能力、联网搜索能力和图像升成能力,都太特么变态了。
就好比这张「新一代 SU7 产品配置图」。
即便是手法娴熟的设计师,也得花很多心思去排版和设计。
但在 GPT-image-2 上,机哥给它的提示词只有短短一句——
" 生成一张新一代小米 SU7 的宣传海报和详细配置产品图。"
接着不到一分钟的时间,它就把结果扔给我了。

我看完最大的感受是啥呢。
如果不纠结小细节的话,它几乎就是一张,能直接拿给用户了解产品的海报。
除了汽车和手机这类产品。
机哥还让 GPT-image-2 生成瑞幸生椰拿铁的宣传图。
这回不仅是饮料本身发挥稳定,连文字的细节都处理得很好,完全没有以往图像模型那种粗糙感。
提示词:做一张瑞幸生椰拿铁的宣传图,让用户看了都想喝
让它跟雪王的橙汁来个组合联名。
不是哥们,违和感呢?
提示词:用生椰拿铁跟蜜雪冰城的橙汁做个联名款。
而且不知道发现了没。
这 GPT-image-2 除了审美和中文细节到位,它还有了很强的理解能力。
之前好几个主流生图模型,包括被称为「最强」的谷歌 " 香蕉 ",想要生成一张质量高的图片,往往要输入很多提示词。
比如图片左边要怎么样啊,右下角要放个什么玩意啊。
但现在,真就是一句话的事儿。
它会理解你的需求,然后自己把产品对应的外观、配置找全,然后配图。

这图也是 AI 生成的
这么看下来,各家大模型的领先时间,真的非常短。
要知道上一个被吹上天的 Nano Bnana 2,发布时间是 2 月 27 日。

现在都没过去三个月呢。
一个把我十年 PS 功底按在地上摩擦的新模型,冷不丁地发布了。
天知道下半年的大模型,还会掏出啥狠活。
图片来自网络


登录后才可以发布评论哦
打开小程序可以发布评论哦