新浪吃货日记 8小时前
字节AI豆包被全网笑翻:坚持画包子,死活画不出馒头
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

今天全网都在围观一场 AI 生图的 " 翻车 " 事件," 豆包不会做馒头 " 的热梗精准戳中了多模态大模型在视觉特征理解上的认知盲区。

???? " 指馒为包 " 的 AI 翻车现场

近期,大量用户在使用字节跳动旗下 AI 应用 " 豆包 " 的文生图功能时发现了一个令人啼笑皆非的 Bug:无论提示词如何精确描述,AI 生成的 " 馒头 " 最终都会变成 " 包子 "。* 百试百败的执着:有网友连续测试上百次,在提示词中反复强调 " 注意是馒头 "、" 不是包子 "、" 上次弄错了 ",豆包却一边诚恳道歉(" 非常抱歉,这次我一定严格按照您的要求 "),一边坚定地生成出带褶的包子。* 集体吐槽的狂欢:面对 AI 的 " 冥顽不灵 ",网友纷纷晒出对话截图,调侃其 " 分不清包子和馒头 "、" 是个废物 ",甚至有人戏称研究 AI 研究到 " 豆包已经研究成馒头了 "。

???? 为什么 AI 死活画不出馒头?

大模型出现这一现象,主要源于底层算法对中文面食特征的提取偏差:1. 视觉特征的强权重干扰:在 AI 的训练数据集中," 包子 " 通常带有明显的褶皱特征,而 " 馒头 " 多为光滑表面。模型在学习 " 中式蒸制面食 " 时,往往将 " 褶皱 " 作为了高权重的视觉锚点,导致生成馒头时 " 不由自主 " 地加上褶子。2. 语义与视觉的映射偏差:对于多模态模型而言,理解 " 没有馅、没有褶、实心圆形面团 " 这一抽象概念并精准转化为像素,比生成具有显著特征的包子更具挑战性。模型在缺乏强约束的情况下,倾向于输出训练集中更常见、特征更鲜明的 " 带褶面食 " 形象。

????️ 网友实测的 " 驯化 " 指南

虽然豆包在初次生成时屡屡翻车,但部分用户也摸索出了一些应对技巧:* 高频引导与强调:有测试者发现,AI 默认包子是馒头,但通过多次反复引导、纠正,并配合强烈的语气词(如 " 馒头馒头馒头 "),多试几次后 AI 还是能够生成出正确的馒头图片的。* 提示词优化:在生成指令中尽量避免使用单一的 " 馒头 " 一词,可以增加 " 光滑表面 "、" 无褶皱 "、" 实心面团 "、" 纯白色圆形面食 " 等细节描述,帮助 AI 更准确地锁定视觉特征。

???? 提示:AI 图像生成功能具有一定的随机性,目前大模型对部分日常物品的细节刻画仍存在不稳定现象。若对生成结果有严格要求,可尝试结合本地部署的开源生图模型(如 Stable Diffusion)并加载精准的控制网(ControlNet)进行微调。

本文由 AI 生成

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 字节跳动 准确 子和 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论