创业邦-原创 04-22
90后二次元北大校友做出AI漫画创作工具,融资千万
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者丨博雯

编辑丨海腰

题图丨 Midjourney

AI 绘画已经火了两年,但仍有一群人并不满意。

对于他们,仅仅是一张极尽精致的图片还不够,他们希望为画中的人物赋予更完善的性格、好恶、身世、人际关系、世界观,让 Ta 有血有肉,仿佛真实存在。

" 这就是为什么我们的产品叫做‘ AI 驱动的角色幻想创作平台’,而非 AI 绘画这种描述。" 胡修涵说。

90 后的胡修涵在 2022 年 12 月,AI 绘画正引发大规模讨论,ChatGPT 刚刚发布的时候创立了 " 看见概念 " 团队,近期刚刚完成天使轮和 Pre-A 轮融资,总额超千万元,投资方包括源码资本和奇绩创坛等。

他们的产品 " 捏 Ta" 则在今年 4 月刚刚上线,分为微信小程序和 APP 两种体验渠道。

今天凌晨,他们还推出了自研的开源二次元大模型,捏 Ta 艺术大模型(Neta Art XL)。

图示:Neta Art XL 模型生成效果展示

作为真 · 老二次元,胡修涵对同人创作生态了如指掌,他提出,不管是基于已有 IP 的二次创作,还是自己原创故事和角色,本身都是爱好者们内心创作欲的一种体现。

只是产出二创的人毕竟还是少数,大多数人的创作能力(尤其是在图像上)是不足的。

这时,就需要一种工具来填充这种创作能力上的不足。

近千个可选标签,创作故事而非单张图片

相比创作单张图像,捏 Ta 的 " 创作角色故事 " 的能力直观体现在两个方面。

第一,平台征集了大量已经成熟的 IP 形象,游戏如原神、明日方舟、重返未来 1999,动画如咒术回战、排球少年、Fate 系列等等,共计近 500 个已有形象。

基于这些形象,用户可以轻松进行改变服饰、表情、动作,更换场景等方面的二次创作。

可供选择的图像风格共有近百个,如具体的艺术家风格、厚涂、赛璐璐、像素小人等等。

而涉及到具体细节,如人物形象的表情动作和服饰、画面的光照和镜头、场景特点等等,共有近千个可选择的标签。

除了最经典的文字 prompt 之外,捏 Ta 也提供了 " 图片捏 ",即可以上传手机相册里已有的图片,或此前生成的图片进行二次创作。

同时,"CP 图 " 则需要分别描述两个角色,再套用平台提供的 CP 模版(如证件照、下腰抱、亲亲等),就能直接看自家 CP 结婚。

在图片完成后,平台也有添加字幕、台词、图像拼接的功能,可以直接制作漫画,讲述故事。

一般情况下,生成图像的时间约为 10-30 秒。

第二个特点则是捏 Ta 的核心功能," 奇旅 "。

平台提供了一种类似橙光游戏的玩法,当前有校园、异世界、娱乐圈等几个故事模版,用户可以带着已有 IP 角色或自己的原创角色进入这种故事里,面临不同需要做出选择的场景。

遇到这些场景时,用户就需要根据自己的选择,输入 prompt,创作出相应的场景。

这个功能对于普通人来说或许有些费解,但在养 OC(Original Character,原创角色)的同人创作者来看却刚刚好。

养 OC 其实就是完善原创角色设定,并且是除了外表服饰性格喜好之外,更具体,更深入地构建这个角色的童年、人际交往圈、性格缺陷、魅力来源、生长世界观等等。最终或是拓展成一个完整的小说或漫画故事,亦或用于在网络社群里与其他养 OC 人进行社交。

要完善原创角色设定,创作者们常用的一个做法,就是将角色放入一个场景,想象 Ta 在面临某个具体的剧情时,会做什么样的选择。

在此之前,OC 养到后期要么自己动手,创作图像或小说,要么就需要在圈内花钱找人约文、约稿、约角色曲。

但现在,基于捏 Ta 平台就可以做到。正如 " 奇旅 " 玩法开展之时页面上的那句 " 探索角色的更多面 "。

目前社区的产出有六到七成为有字幕和多幅图像的类漫画作品。胡修涵也透露,他们的平台现在有近 50 万用户,其中女生占七成,也大都比较年轻。

" 她们的一个共同标签就是很多都写过小说,或者说搞过同人创作。她们内心其实有一个很强烈的心理,就是把自己内心的想法做一个更图像化的表达,让更多人看到,这样才能建立起内心的正反馈。" 他说。

不过,当前捏 Ta 平台并没有明显的付费点,在生成图像时所消耗的 " 电量 " 类似游戏中的 " 体力值 ",可以随着时间慢慢恢复,也可以通过社区点赞分享等行为获取。

在 " 电量值 " 上是否会做类似游戏的 " 月卡买体力 " 玩法,胡修涵不置可否。不过他分享了当前平台已有的两种方式。

第一,得益于国内繁荣的周边物流供应链,捏 Ta 也提供一个把用户的原创角色定制成亚克力吊牌或吧唧(二次元宅圈的周边徽章)等周边道具的渠道。

第二,从长远来看,用户捏的角色也有可能成为自身就具有内容价值的产品,可以向第三方出租或售卖。

" 就像是 openai 的 GPT 商店,开发者可以把自己定制的 GPT 挂出来给其他用户使用,从中收取佣金。但现在 GPTs 没有跑通,可能意味着只有 prompt 的价值不高,或者至少建立不起某种经济循环。所以核心的点在于售卖的资产本身。" 胡修涵说。

15 人团队创立两年,全网曝光 2.5 亿

刚过 30 岁的胡修涵,在 2014 年毕业于北京大学,获得了智能科学和经济学双学位,并在此后的美国哥伦比亚大学取得了硕士学位。

他最早进入了 Meta 的视频战略组,担任一个 30 人左右团队的技术主管,主要负责 Facebook、WhatsApp、Instagram 三个平台的视频相关全套技术方案。

也就是在做短视频、短剧类内容、新闻、游戏直播时,负责内容管理、视频中插广告的系统对接、版权数据分析等工作。

在那时,他遇到了现在 " 看见概念 " 团队的合伙人兼 CPO 宋禹君,清华大学本科,硕士则毕业于卡内基梅隆大学的人机交互专业。

胡修涵表示,由于最初做的都是内容方面的工作,在 Meta 时能以 7% 占比的头部内容获取平台 90% 的观看量,因此他们对于不同市场、不同内容类型的需求变化较为敏感。

2018 年,胡修涵回国进入阿里巴巴,带领团队先后参与了 2019 双十一大规模数据可视化的高性能渲染工作。

2020 年,他又进入了一家上海的 B 轮独角兽特赞,担任技术 VP,从零搭建了这家公司的内容资产管理产品线。

当特赞的新产品线收入从十几万上涨到上亿级,时间来到了 2022 年 12 月份。

在这时,Stable Diffusion 已经发布有 4 个月,它的开源是 AI 绘画爆火的直接原因,也正是基于 SD 其开发的无数图像生成模型将这一话题不断发酵,一齐将 AI 绘画推向了舆论热潮的高峰。

而颠覆 AI 圈的 ChatGPT 也在 11 月 30 日刚刚推出。

这些都让胡修涵觉得,C 端的内容生态创作端或许会因此而发生大的变革。

于是当月,胡修涵出走创业,正式创立了 " 看见概念 " 公司,他瞄准了二次元社区。

2023 年一年,团队主要基于 SD 框架进行技术研发,但原模型风格不够二次元审美,风格上也比较难符合多样化的镜头。而部分风格优良的模型则人物肢体稳定性欠佳。

因此,在生成人物的表情、动作、镜头、风格表达多样性,风格易调用性,以及多人画面的稳定性等方面,团队进行了大量的研发。

2024 年 4 月,团队正式上线了 " 捏 Ta" 微信小程序。

这个名字来源于日语 " 梗 "(Neta)的读音,在 ACG 圈中常被用作玩梗、致敬使用。在同人二创圈里,又和 " 养 OC"" 养娃 "" 捏角色 " 等概念相似。

捏 Ta 的社交媒体曝光量已达到约 2.5 亿次,位列视频号动漫游戏日榜前十,日均用户使用时长可达 40 分钟。

令胡修涵印象最深的,是一名用户在 200 天内,用 AI 工具生成了 500 多个原创角色。

刚刚推出的 Neta Art XL 模型,则覆盖了超过 1.3 万个角色,近千个不同风格的艺术家,在部分二次元专属名词的识别和生成上,也进行了优化。

目前,整个 " 看见概念 " 团队共有 15 人,其中大部分都是产品研发。

团队的核心技术成员来自 Meta、字节跳动、B 站、小马智行(Pony.ai)等企业,也曾深度参与二次元开源模型 AIDXL 以及视频生成模型开源项目 AnimateDiff 的开发。

面向群体:" 当年在办公室摸鱼写网文 " 的人

事实上,AI 绘画应用产品在国内早已有过一波井喷期。

2021 年年初,OpenAI 推出了里程碑式的 DALL · E 模型和 CLIP 框架,前者被称为 2021 年第一个令人兴奋的 AI 技术突破,后者则是一种能将文本与图像联系起来的特殊的 " 图像识别 "。

自此之后,AI 绘画就开始飞速发展。直到 2022 年 8 月,Stable Diffusion 开源,短时间内产生了一大批低门槛的 AI 绘画工具。

捏 Ta 为什么出现在现在?它与已有的 AI 绘画式工具又有哪些不同?

胡修涵认为,当图像生成领域开始出现技术革新,产品慢慢涌现时,一开始或许会比较倾向于引入成熟的工作流程中,去快速解决已有的问题,并快速获取一个正面反馈。

而一开始跟进新技术的人,大多也是对技术敏感,对 AI 本身感兴趣的人。这个群体会倾向于更专业的工具,也会自然希望把工具尽快集成自己的生产流程。

就像是游戏影视行业的部分公司,他们引入 AI 绘画搭建了新的工作流程,达成了更高效或者更便宜的效果,这时候新技术就被内部消化掉了,也就没有什么产品流出来。

AI 绘画生成的游戏道具图

但捏 Ta 并非是一个创作力工具被应用于工作能效,它本身就是基于具体的创作目的设计的,是一个泛娱乐化产品。

与那些喜欢尝鲜的 AI 爱好者不同,胡修涵提到,他们的用户群体是泛 C 端,也就是 " 当年做卡点音乐视频,在办公室摸鱼写网文的一群人 "。

这个群体是为了好玩,为了自我表达而创作,而不是为了解决某个工作问题,为了越做越快越做越好。

在胡修涵看来,他们带来的通常是一种长期的内容创作,或许短期内看似无法产生直接变现,但长期则会形成一种有价值的消费社区生态。

" 所以专业的用户其实是不屑于用我们这类工具的,因为我们有意识地把复杂度全藏起来了。但我觉得一个大众性的好的产品,他针对的肯定不是先锋用户。就像我们的用户,他们不是被 AI 打动的,而是因为对二次元的兴趣才来玩我们的产品的。" 胡修涵说。

因此,在多次采访中,胡修涵都强调,他们希望捏 Ta 能成为一个创作平台,有足够多的内容创作者在产出,也能形成社区进行交流。

当然,现在几乎所有的内容创作平台都面临着一个长期的困境:内容产出不够怎么办?在胡修涵看来,最好的方法就是让越来越多的人都能参与创作

而到更远的时候,基于更加成熟的生成技术,以及更大更优质的用户,社区中诞生的原创优质角色和围绕其展开的故事越来越多,其中最头部的可能就会成为新一代的大热偶像 IP。

AI 绘画:拼凑、融合、还是未来?

不过,对于同人二创圈,AI 的参与一直是一件相当微妙的事。

对于很多创作者来说,图像是自我表达的一种方式,而由冰冷机器生成的图像难免欠缺灵魂,甚至有 "AI 绘画是拼凑尸块 " 的言论。

作为技术开发者,胡修涵先解释了 AI 绘画的大致流程:多层神经网络模型会学习图像和与图像对应的一系列文本描述,然后将图片中的内容翻译成一个 " 高维文本向量 ",也就是 " 理解图像 "。

当这种翻译足够合理,理解足够深刻时,模型就能反过来,将一系列的文本描述变回相应的画面。

所以,AI 绘画并非是很多人想象的像素重组或元素拼接,而是在概念上做了一个融合创新。

" 我会觉得 AI 绘画很像是去追哈利波特世界里的金色飞贼。在使用内容创作模型时,你实际上就是要用尽可能多的文字限制,把你最想要的那个镜头画面逼到一个角落。" 胡修涵说。

而对于这种论调带来的对整个 AI 绘画的消极甚至反对态度,胡修涵也十分冷静。

作为老二次元,胡修涵非常肯定,整个泛二次元群体中有大量 " 沉默的大多数 ",他们对于 AI 绘画的抵触心理不强,对于画师和绘圈也没有那么高的忠诚度——没有足够的绘画技巧、没有时间精力,或者没有金钱去约稿,所以无法开始自我创作和表达,这才是这群人的核心需求。

并且,在胡修涵看来,跳出这个群体,AI 绘画也是一种无法阻挡的趋势。

他提到,今年两会上,央视就用 AI 生成了一系列海报,这就代表了一种非常具有倾向性的鼓励和引导。

此外,他们的平台在没有投流推广下实现了 2.5 亿次以上的流量曝光,这也说明总有人喜欢这些内容。而随着技术的不断迭代,人们的思想也不不断改变,未来参与进来的人或许会有更多。

至于 AI 绘画带来的版权问题,胡修涵认为,某个内容创作需要人的劳动成本,这是一个前 AI 时代的经济理论逻辑。

随着 AI 的发展,单个内容的生产和传播成本发生了极大的改变,这时候就需要重新考虑相关问题。

比如,对于 AI 绘画的定义,未来可能会发展到需要画师的 " 开光 "。

" 画师可以认证那些 AI 生成的东西,说这几张图掌握了我的精髓,那可能这些图的收益就要分他一部分;没有经过认证或授权的 AI 图像的价值就极低……总之,未来应该会有一套新的版权价值体系。" 胡修涵说。

本文为创业邦原创,未经授权不得转载,否则创业邦将保留向其追究法律责任的权利。如需转载或有任何疑问,请联系 editor@cyzone.cn。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

ai 二次元 融资 绘画 90后
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论