智东西
编译 | 程茜
编辑 | 云鹏
智东西 10 月 21 日报道,今天,据 The Information 援引知情人士报道,OpenAI 的日本竞对 Sakana AI 被曝将以 25 亿美元(折合人民币约 178 亿元)估值筹集 1 亿美元(折合人民币约 7 亿元),相比去年 9 月的 15 亿美元(折合人民币约 107 亿元)估值增长 66%。
知情人士透露,Sakana AI 正在与美国和日本投资者进行谈判,筹集这笔 1 亿美元新资金后,Sakana AI 的估值将达到 26 亿美元(折合人民币约 185 亿元),该公司计划利用新资金扩大其工程、销售和分销的员工团队,它现在有大约 70 名员工。
Sakana AI 成立于 2023 年 7 月,其创始团队来头不小。David Ha 是前谷歌大脑高级科学家,还曾领导图像生成模型独角兽 Stability AI 的研究部门,另一位创始人 Llion Jones 是 Transformer 论文作者之一、前谷歌 AI 研究员。今年 8 月,David Ha 还登上了《时代》发布的 2025 年百大 AI 人物榜单。
Sakana AI 创始人 Llion Jones(左)、David Ha(右)
这家创企与 OpenAI、Anthropic 等企业所选择的路线不同,其希望抛弃 Transformer 架构,以自然进化为灵感降低模型计算成本并提升模型性能。在产品进展方面,该公司已经发布三款日语模型、江户古风聊天机器人 Karamaru 以及开源框架 ShinkaEvolve。
目前,Sakana AI 共计拿下了将近 2.3 亿美元(折合人民币约 16 亿元)融资。2024 年 1 月,Sakana AI 获得 45 亿日元(折合人民币约 2 亿元)融资,Lux Capital、Khosla Ventures、日本电信公司 NTT 以及索尼集团参投;去年 9 月,Sakana AI 完成 2.14 亿美元(折合人民币约 15 亿元)A 轮融资,英伟达参投成为大股东,使其成立一年估值达到约 15 亿美元(折合人民币约 107 亿元),迅速跃升为独角兽。
此外,据 The Information 报道,该公司还获得了日本政府的拨款,用于购买 AI 训练的计算资源。
Sakana AI 在日语中意为鱼,Ha 此前告诉 The Information,他打算建立一个 " 日本的 DeepMind"。
Ha 透露,其算法可以帮助企业自动创建处理语言或图像的大模型,实现方法是在组合、测试和丢弃数据时模仿自然选择的规律,从而减少所需的人工输入量。这是因为训练大模型所需的电力或资源量消耗巨大的,他希望将这段时间缩短到几天或几周。
具体来看,Sakana AI 采用的算法是将三种开源原始 AI 模型作为 " 父母 ",通过不同方式 " 养育 " 超百名 " 子女 ",接着选出表现最优的模型,然后再生成下一代,然后不断重复这一过程,创造出数百代模型后选出佼佼者。
今年 3 月,SakanaAI 发布三款日语模型,分别是大语言模型 EvoLLM-JP、视觉语言模型 EvoVLM-JP 和图像生成模型 EvoSDXL-JP。
时隔一月,Sakana AI 发布江户古风聊天机器人 Karamaru,这个聊天机器人可以用江户时代的世界观和当时的古代文献来回答用户,其训练数据来自该公司从江户时代书籍中建立的包含约 2500 万个字符的数据集。
今年 9 月,Sakana AI 开源了 ShinkaEvolve,该框架将大模型与一种算法相结合,帮助其针对各种潜在问题提出解决方案,并缩小到最相近的问题。该公司声称,与 Transformer 架构相比,这种方法更高效,更能提出创造性的解决方案。
ShinkaEvolve 框架概述
截至目前,Sakana AI 已经与多个日本大公司签订业务协议。
今年 5 月,它宣布与三菱日联金融集团建立多年合作伙伴关系,为日本最大的银行开发定制 AI 模型。这笔交易达成后,Ha 告诉外媒,这将使 Sakana AI 在一年内实现盈利;本月早些时候,Sakana AI 宣布与日本最大的券商之一大和证券集团建立类似的合作伙伴关系。
Ha 提到,日本每家想要拥有自己的基础模式的公司都可以与 Sakana AI 或其他像 Sakana AI 这样的公司合作开发自己的模式,日本还有成为创新者的空间。
此外,在日本,Sakana AI 还面临诸多美国大模型开发商的竞争。
今年 2 月,OpenAI 宣布与软银建立合作伙伴关系,软银同意每年为自己及其子公司花费 30 亿美元(折合人民币约 214 亿元)购买 OpenAI 的技术,软银和 OpenAI 还将成立一家合资企业,专门向日本公司销售 OpenAI 工具套件;Anthropic 在今年 8 月任命了日本国家负责人,并准备在日本东京开设办事处;今年 8 月,加拿大大模型创企 Cohere 聘请了一名日本国家经理。
结语:Sakana AI 押注日本本土大模型
Sakana AI 与法国大模型创企 Mistral AI、印度大模型创企 Krutrim 类似,其希望通过开发自己的大模型并让模型更好掌握自己地区的语言和文化,以减少对其他 AI 技术的依赖。Ha 认为,对于日本的公司来说,可以选择拥有自己的基础模型是有意义的,即使它不是一个超高性能的模型。
但相比于 OpenAI、Anthropic、谷歌等大模型核心玩家,Sakana AI 这类创企在资金、人才实力上都相对较弱,其需要通过算法等的创新找到突破路径。
登录后才可以发布评论哦
打开小程序可以发布评论哦