
教人用 AI 做绘本,一门新生意。
文|白棉
编|园长
2024 年 8 月,一本标注为 AI 绘制的绘本《卡皮巴拉的自我修养》上架微信读书,一度排到新书榜第 5 名。AI 发展到今天,使用文生图技术和人工智能协同创作绘本,不是一件值得惊讶的事。
但近期,人们可以使用自然语言描述自己想要的故事,AI 可以在一分钟内迅速完成绘本。
今年夏天,Gemini 推出 Nano banana 模型,凭借着出色的角色一致性能力,引发了众多网友对 AI 图像生成的探索和关注。在该模型曝光不久前,Gemini AI 上线了 Storybook 故事创作功能,用户仅需输入几句话描述情节,AI 将自动生成 10 页图文内容的电子书。
图像模型的完善使得人们逐渐开始探索 AI 绘本功能的妙用。在短视频平台上有大量 AI 绘本视频,很多视频附上英文字幕和配音,tag 标注为英语绘本、英语磨耳朵等,平均点赞量大几千,有的视频数据则近百万。点开这些博主的主页,往往挂着启蒙绘本、英语绘本视频合集等购买链接。
AI 一键生成的绘本能读吗?为什么这些略显抽象的幻灯片放映似的视频能迅速走红?为了找到答案,我开始着手调研和试用产品。
成为绘本创作者,只要一分钟
为了直观体验目前 AI 绘本技术的能力,我在 Google Gemini 里进行了一次测试。 点开 AI 绘本功能,界面上出现了几个创作建议。

我随手点击了第三个关于 " 小蜜蜂 " 的创意概述。等待时间不到一分钟,一个可以翻页的电子绘本呈现在我面前。

绘本总共有十页,讲述了一个名叫巴奇的小蜜蜂的故事。尽管提示词只有一个故事模糊的轮廓,但 AI 生成的故事逻辑是自洽的。讲的是巴奇出门采蜜,遇到一个无精打采的小花,小蜜蜂采蜜后花儿重新抬起了头,顺畅地表明了蜜蜂活动有益。不过不得不承认,AI 生成的故事吸引力和趣味性不高,结构的 " 起承转合 " 也不明显,称作 " 小故事大道理 " 更为合适。
之后我关注了一下 " 角色一致性 " 的问题,这是过去 AI 绘本制作的最大痛点。
在 Gemini 生成的故事里,主角巴奇的造型整体保持得不错。虽然偶尔蜜蜂的造型和手的颜色会有些许出入,但完全没有出现 " 角色突变 " 那种让人诧异的硬伤。 如果对画风不满意,操作也很简单。
现在漫画的 " 大眼萌 " 风格略有恐怖谷风格,于是我接着要求 Gemini 更改风格,新的绘本很快也出炉了,整体画风变为宫崎骏动漫风。

图|新的风格
除了点击推荐的指令生成故事绘本,我们也可以 " 先文后图 "。我用 Gemini 的文字 AI 功能生成了一个全新的故事脚本,再点开 Storybook 功能进行创作。
经我人工鉴别,AI 生成的图画与脚本内容还是非常一致的。

图|新的绘本
在 " 一站式绘本 " 的功能上新之前,我也尝试过使用多个大模型制作 AI 绘本,只能说需要一定的耐心。
AI 创作绘本的核心是文生图能力。从 ChatGPT、DeepSeek 等模型里拿到脚本,仅仅是第一步,最难的环节,是将其 " 喂 " 给文生图 AI。
如果一次性投喂长脚本,AI 的多图能力不足,角色一致性较差,会发生 " 一人千面 ",所以创作者需要将故事拆解成一页一页,反复修改提示词,祈祷 AI 能稳定发挥。如果还想要流畅的配音,更要多工具协同,调取一个音频 AI。
目前的模型 " 画 " 得越来越快,并且正在解决一次性生成连续故事的问题。
当然," 卷 " 故事绘本的不止谷歌。国内文生图模型也陆续升级,改善多图生成的一致性问题,在生成连续故事的功能上有所完善。例如,字节跳动近期发布的 AI 图像生成模型 Seedream 4.0,称其性能超越了谷歌的 Gemini 2.5 Flash Image,能一口气免费输出最多 20 张差异化图像。这对批量生成 AI 绘本、视频分镜头脚本等场景至关重要。
我用相同的 prompt 进行了测试。该模型可以直接在豆包上使用,出图质量和图像稳定性也有所保证,只是在部分复杂图像中,角色形象不稳定,人像和动物摇摆不定。

在这些 " 一站式平台 " 出现之前,不少 AI 自媒体博主将该场景拆分,兜售 "AI 绘本制作教程 "。他们教人如何结合 Midjourney 等图像模型,再搭配 ChatGPT、剪映,拼凑出一个完整的绘本。但这个模式软件切换繁琐、流程冗长、出图效果不稳定、使用成本高昂,创作依旧复杂,想要拥有自己的绘本故事仍然困难。
现在,只要给 AI 一个概述、大纲或脚本,它基本都能生成一个逻辑自洽的故事,并配上高度符合场景的图片,这使得 AI 绘本领域出现了越来越多新的创意。
这个生意,卖的不是绘本
AI 绘本的生意不止一种,但其初始形式和所有新兴 AI 技术一样,源自于一种焦虑。
在社交平台,大量自媒体博主打出 "AI 学习 " 的标签,将 AI 绘本等技术作为 " 副业 " 的一部分。他们利用信息差,将精美的 AI 图片发帖 " 引流 " 吸引关注,再转化关注者为消费者,以 19.9 元的价格售卖文生图 AI 的插画提示词或教程等。

此外,部分博主直接将 "AI 绘本生意 " 作为宣传亮点,走的是 AI 卖课路线。
我尝试联系了一个社交媒体账号,他们宣传称正在招募想要以 AI 绘本为副业的人。后来我加到一个企业微信号,对方自称 "AI XX 老师 ",发来链接和海报,当晚就需要上线听 AI 绘画技巧公开直播课。
在 AI 绘本的应用中,人们除了最初的尝试,往往还有更具实用性的需求。例如短视频平台很火的英语绘本系列,主打的就是通过图文结合的方式帮助孩子更快地记住特定单词。
另外,孤独症等特殊需求群体也值得关注。2024 世界人工智能大会上,阿里通义展示了关照孤独症儿童的 AI 绘本工具 " 追星星的 AI"。该工具可以生成常识认知、社交礼仪、心智解读和趣味故事这四类内容的绘本,并可设置 3 个层级的认知水平。
在儿童教育领域,AI 绘本同样是一项有力工具。图文并茂的绘本可以激发小朋友的创造力和想象力,但目前市场上的传统绘本在主题上相对趋同,难以满足每一个家庭的需求。
在社交媒体上,很多帖子在求助给孩子看的绘本推荐,也有批判绘本价值观充斥着刻板印象的避雷贴。一些家长希望孩子接触性别平等等更广阔的议题,担忧市面上 " 总在赞美妈妈勤劳,夸奖爸爸勇敢 " 的绘本难以起到正确引导和教育作用。
AI 绘本产品出现后,许多不会画插画的普通人能将自己的想象力和创造力落地,创作出属于自己孩子的定制绘本。
这一定制需求,自然成为目前 AI 绘本的重要发展方向。在某平台,二十元一份的 "AI 十页绘本代做 " 卖出超 200 份。AI 播客生成平台 Listenhub 也开发了 AI 绘本产品,该产品的诞生来源于公司 CTO 自己的需求。孩子太喜欢听故事,他便想到结合公司的 AI 音频能力,加上各大前沿图像模型,能够一键演绎故事,制作出有声绘本把想象传递给孩子。
AI+ 绘本产品童语故事开发者则是在一次和女儿去乐园游玩的经历后,突发奇想将游玩的记录变成了绘本。女儿很喜欢,还送给了同学读,他之后便开发了这一绘本故事生成工具,提供给非专业内容创作者使用。
随着一站式技术的完善,AI 绘本的生成更加便捷,人们的需求开始更加复杂和丰富。例如,Listenhub 支持电子翻页绘本一键生成视频绘本;在童语故事小程序创作绘本时,家长能够在首页看到其他创作者的作品,在流程中可以选择孩子的年龄段,故事概要能使用 AI 推荐,画面风格和角色也都有很多选项。如果家长的思考并不完善,相关功能可以给予提示和帮助。
这些产品被投射的关注,来自于人们对定制儿童绘本的需求,而不是绘本本身。家长想要看到 " 自己讲述的故事 "" 孩子自己的故事 ",在和 AI 的交互之中,那些独一无二的绘本故事得以诞生。
这种需求也在揭示一个事实,AI 绘本的商业变现会开拓一种新的模式,和传统绘本出版这条路并不相交。
专业插画师 Dream 告诉刺猬公社,AI 生成的绘本目前是达不到出版社要求的。一本传统绘本基础页数要求是 32 页,制作周期一般要一到两年。AI 绘本很精致,创作速度很快,但却缺乏真实的表达;传统绘本可能会在故事开头的画面适当留白,在高潮时配合丰富的画面。绘本不只是文字与配图放在一起,两种表达会相互配合,带给读者童趣抑或是多元的感受,这背后的复杂创作是 AI 难以复制和展现的。
事实上,在纸媒下行的今天,绘本本身就不是一门 " 好生意 ",许多插画师都需依靠副业才能坚持创作。因此,AI 绘本生意的出现对传统绘本行业反而冲击较少。
多重因素叠加下,现在市场上用 AI 画绘本不赚钱,真正赚钱的是 " 教人画 " 以及 " 提供工具 "。无论是卖 19.9 元的提示词,还是收取会员费的一站式生成平台,本质都是在售卖一种 " 能力 " ——一种在 AI 时代 " 人人皆可成为创作者 " 的能力,是家长们希望深度参与孩子成长的需求。
不过,作为 " 定制的艺术 ",AI 绘本功能仍有待完善。
目前市场上的文生图模型已经可以做到对单个图进行修改,保持一定的稳定性。但无法对 10 页的绘本里单独的页面进行删改,必须重新从文字脚本和画面描述进行修改。
我在实际操作中进行了尝试。当我让 Gemini 去掉第三页的文本时,它干脆地拒绝了我,我又让它修改封面时,它答应得爽快,但实际显示的画面并没有改变。
除此之外,AI 绘本的核心使用场景是 " 儿童成长 ",而它最大的风险,在于大模型的 " 黑盒问题 "。和大模型合作创作内容时,模型背后的价值判断很难察觉,这些 AI 不是全然正确和没有偏见的。
大模型是基于海量数据训练的结果,数据中固有的不道德与偏见已经在训练里自动形成。已有研究发现,未经过规范的语言模型存在道德感缺失,在面临简单的日常情境伦理判断问题时准确率仅有 60.2%,这对儿童教育来说无疑存在风险。
每一个故事背后都暗含表达,无论是 AI 还是人类,叙述者的思考无法在故事里躲藏。在人机合作过程中,人类能否及时辨认不合理之处,也是一项不小的挑战。
参考资料:
1.《ListenHub 视频绘本,把每个人的想象都变成视频故事》,有机大橘子。2025.9
2.《3 秒出标题,15 秒出简介,30 秒出一整本少儿绘本|专访 ImageStory》,视智未来,2023.9
3.《Can machines learn morality?The Delphi Experiment》,JIANG L W,HWANG J D,BHAGAVATULA C,2022:2110.

媒介合作联系微信号 |ciweimeijiejun
商务合作联系微信号 |yunlugong
如需和我们交流可后台回复 " 进群 " 加社群
 
    


登录后才可以发布评论哦
打开小程序可以发布评论哦