大模型如何落地?怎么落地?成为今年科技领域的头号主题。
在一个不为大多数人所知道的造字赛道中,这家清华创业公司——「图形起源」悄然实现商业变现:
帮助字体公司降低 80% 成本,提速 10 倍以上。Canva 可画上最受欢迎的前 100 套中文字体,大部分都是用他们的算法生成的。
这个赛道足够小也确实刚需,设计公司、字体公司苦版权费用久矣。
而他们凭借原本积累的图形学与 AI 的技术优势,实现了人工所不能及的效率和精度。
来看看他们是如何发现以及靠 AI 造字来赚钱的。
靠 AI 造字赚钱,提速 10 倍以上
首先来了解一下什么是字体生产?
传统的字体生产流程,往往需要设计师用手写的方式来完成整套字体的制作,(一套字体最多近 3 万字)并且在初稿完成后,还需要人工团队进行逐字校对。
因为纯人工操作,这样一套流程下来不仅周期长,往往需要一个季度。对于字体公司来说,这是一笔不小的成本支出。
与此同时,也正因为人工,单个字体字形质量风格等细节上不好把控。
对于设计公司来说,制作过程中的高成本,也导致了商用版权字体采买费用的高昂。
正是在同客户交流时,图形起源团队发现了这一行业痛点,耗时数月打造了一套字体生产线。
这不是简单应用一个大模型就能直接生成的。字体设计最大的区别在于它是矢量图,可以无限放大而不失真。而目前 AI 生成的图通常是位图,有像素限制。
如何让 AI 生成矢量图,理解字体的锚点和矢量曲线的含义,成为核心的技术难点。
创始人史海天分享了他们的解决思路,整个流程分为四个阶段:
首先,用一个传统的Diffusion 模型会生成位图;
其次,用第二个超分辨率模型,把字体位图的分辨率提到最高;
然后,用一种独特的算法,让 AI 能够理解什么是 " 好的矢量设计 ",设计第三个模型,以这种 " 好 " 的审美作为优化目标,用训练后的模型把位图转化成矢量图;
最后,训练一个专门检查错别字和字形结构的模型。
除此之外,他们还计划开发笔画拆分模型。
基于这样的模型,他们能实现人类所不能达到高效和高质量。
比如基于 AI 超分技术和 AI 矢量化,像各种笔画、偏旁部首的边缘细节处理,能禁得起任意放大维度,设计师能在海报等场景中使用。
客户只需要完成前 199 个字的操作,AI 就能在两天内训练并生成数万字。并且也不限于简体,像繁体字、生僻字,日文韩文拉丁这样的多语种也 OK。
在准确率上,简单字形(笔画 <15)单次生成的平均生成错字率小于 1%,复杂字形(笔画≥ 15)单次生成的平均生成错字率小于 5%,已经远高于人工审校的准确度。
现在他们还打造了一个 SaaS 平台,整个交付过程都可以在线上进行。客户能随时查看进度,或自己完成全部生产过程,不用图形起源的人工干预。
据透露,目前他们已经生成了346 套字体,累计 4680244 个字。
来自图形起源
图形起源成立于 2020 年底,是由当时清华大学车辆学院毕业生史海天,读硕士休学时候创办。
在此之前,他们主要做 3D 创作引擎,并完成了三轮融资,受到像五源资本、真格基金等机构的青睐。当时他们的愿景是,希望在未来建立一个大众化的 3D 内容创作工具,以及一个普通人愿意在其中生活的社交世界。
不过现在史海天回忆当时没有找到很好的变现场景,如今大模型的到来,带给他们全新的机遇。
当时他们花了很长时间和资金来验证这件事情。史海天透露,他们当时训了两个大模型,一个用来识别,一个用来生成,训练目标是 AI 生成的字体让 AI 分辨不出。
不过这个行业的优点在于,字体数据是比较全的,比如一套字能喂给 AI 一半字,让 AI 可以生成剩下一半字。
最后他们也实现了交付级别的生成效果,目前一周能完成超过 40 套字体的交付,相当于效率提升了几百倍。
目前公司主要有两个主营业务。
中文字库扩写,也就是客户给参考字体文件,图形起源 AI 先进行一波学习,然后生成风格统一的字形。
整个流程都是在 SaaS 平台上进行,平台上支持人工校对、二次学习、批量生成、人工二次筛选等工作,以进一步降低生成字体的错字率。
跨语种风格迁移。顾名思义,就是根据任意语种任意字体,来生成同种风格的任意语种任意字形。
目前他们能够稳定生成中日韩拉丁字母、希腊字母、西里尔字母,常见符号数字等,并且已经在小米应用商店有售卖。
而像藏文、阿拉伯文等小语种文字还在内测阶段。
最后想说,虽然现在看各个大厂都在卷生产力场景,市场很卷。但是具体到各个细分场景下,大企业也许就没有那么多的资金精力去投入。
那些场景看上去需求有限,但确实同样也是强刚需,也能实现商业变现。比如字体,比如排版。
对于创业公司来说,就是个不错的切入点。图形起源就是一个。
如今大模型应用如火如荼,到底还是看能不能解决实际问题。这条真理已经是再明确不过了。
登录后才可以发布评论哦
打开小程序可以发布评论哦