作者 | 铅笔道 松格
大数据与大模型结合,会擦出哪些火花?
最近,上海跑出一个超级独角兽:星环信息,向港交所发起 IPO 冲刺。2022 年,星环科技已在科创板上市。
它的主攻方向是:大数据基础软件。
星环科技主要解决几大痛点
按照 2024 年的数据,它是国内最大的纯 AI 基础设施软件提供商。同年,星环信入选了上海市重点服务已上市独角兽企业榜单。
通过其在 AI 方向的实践,我们可以总结大数据与 AI 的几大机会。
1、用大模型降低开发成本。
例如,用户可通过自然语言指令,构建数据处理流程,无需复杂编码。
2、用大模型增加检索功能。
例如,某金融机构利用 TKH 构建专属问答系统,通过自然语言即可检索历史交易规则。
用大模型训练垂直大模型。
例如,在医疗行业,客户可基于 Sophon 对病历文本、医学影像等辅助疾病诊断。
用大模型赋能客户业务。
在金融领域,基于大模型技术升级的解决方案可处理海量非结构化数据。
01
星环科技创始人为孙元浩,1977 年出生于江苏常州,自幼便对编程展现出浓厚兴趣。在南京大学计算机系完成了本科与研究生学习。2003 年,26 岁的孙元浩入职英特尔。
初入英特尔,孙元浩从技术人员做起,直到升职为数据中心软件部亚太区 CTO,成为英特尔 Hadoop 发行版的创始人。
2013 年,他辞去英特尔的高薪职位创业(星环科技),瞄准自主可控的大数据基础软件。
创业初期,团队规模不足 10 人,早期产品基于开源 Hadoop 产品构建,随后推出了核心产品 TDH(Transwarp Data Hub),类似大数据管理和处理的超级工具箱。
星环科技也积极布局人工智能领域。2018 年推出一站式人工智能平台 Sophon,该平台集成了数据接入、清洗、标注、模型训练、管理及应用部署等功能。
2022 年 10 月 18 日,星环科技正式登陆上海证券交易所科创板,成为 " 国产大数据基础软件第一股 "。
02
大数据软件行业发展可划分为几个阶段:
传统数据库时代:大致从 20 世纪 70 年代到 20 世纪末,以关系型数据库与传统数据仓库为主体,偏向结构化分析。
大数据时代:大约从 2000 年到 2012 年左右,伴随云计算与海量数据兴起,涌现大数据平台、分布式计算框架与 NoSQL 系统。
AI 基础设施时代:一般认为从 2010 年代中后期开始,2022 年加速火热(大模型)。
AI、机器学习与大语言模型兴起,推动行业向 " 数据→模型→应用 " 闭环演进,强调底层 AI 运维平台、知识图谱与统一数据处理能力。
而这,也是星环科技正尝试抓住的新机会:从 " 数据基础设施 " 迈向 "AI 基础设施 "。通过它在 AI 方向的实践,我们或许可以看出,AI 正与大数据擦出哪些火花?
03
星环在 AI 方向的探索,可以总结为几个方面。
以前处理数据像组装家具,得一步步按固定步骤拼(写代码),现在有了大模型,你可以跟 " 智能顾问 " 说句话(组装一个怎样的家具),顾问就能帮你把书架拼好。
例如,在医疗行业,客户可基于 Sophon 对病历文本、医学影像等非结构化数据进行联合分析,辅助疾病诊断,突破了传统机器学习模型仅能处理结构化数据的局限。
例如,某银行利用其分析新闻舆情、研报文本等数据,通过大模型提取关键信息并生成风险预警,辅助信贷决策。
04
根据沙利文数据,中国大数据软件市场规模预计在 2024 年达到 492 亿元,2019 - 2024 年复合增长率为 27.5%。
在竞争格局上,国际上甲骨文(Oracle)、微软 Azure、AWS 等提供成熟的 AI 与数据库服务;相较而言,国内企业在 AI 基础设施领域起步较晚但成长迅速,与国际巨头仍有差距。
国内 AI 基础设施软件尚未形成绝对 CR5 垄断格局,市场集中度较低,但领先企业如华为云、阿里云、大厂平台提供底层服务。初创企业在细分市场(如知识图谱、大模型运维)等展开竞争。
据弗若斯特沙利文数据,2024 年在中国 AI 基础设施软件市场,星环科技排名第五,同时是最大的纯软件服务商。
财务数据显示,2022 年营收 3.73 亿元,亏损 2.72 亿元;2023 年营收增至 4.91 亿元,亏损收窄至 2.89 亿元;2024 年营收回落至 3.71 亿元,亏损扩大至 3.44 亿元。
登录后才可以发布评论哦
打开小程序可以发布评论哦