当前,企业全面拥抱 AI 浪潮,Data for AI(为 AI 而生的大数据技术)已成为驱动业务增长的核心引擎。据权威机构报告,非结构化数据正以每年 60% 的速度急剧增长,在企业数据总量中占比已超八成。如何从海量、多模态的数据中高效挖掘价值,已成为企业在 AI 时代必须攻克的关键挑战。
近日,火山引擎与 NVIDIA 在中国新疆伊宁联合举办 "2025 火山引擎 Data+AI 行业领航者智创沙龙 ",汇聚行业专家与技术领袖,共同探讨大模型时代下数据与智能的协同发展之路。会上,火山引擎重磅分享了其在 Data Agent 领域的商业化思考以及面向未来的多模态数据新基建解决方案,旨在为千行百业的智能化转型注入全新动力。
Data Agent:超越"工具",打造懂业务的AI数据专家
" 我们需要更聪明的 AI,还是更懂业务的 Agent?" 火山引擎 Data Agent 项目负责人海书山在演讲开篇便提出了一个引人深思的问题。他指出,当前许多大模型应用陷入了 " 模型军备竞赛 " 的悖论,即过度追求模型的技术指标,而忽略了其与业务场景的深度融合。真正的商业价值缺口,并非源于模型不够智能,而是缺乏将 AI 能力有效映射到具体业务逻辑中的创新思路。
为此,火山引擎推出 Data Agent,致力于打造超越传统工具的下一代 " 企业级 AI 数据专家 "。它不仅能理解自然语言,更能洞悉业务背后的复杂逻辑,主动发现潜在问题。
火山引擎 Data Agent 的核心价值在于 " 分析 + 营销 " 能力的深度整合,打通了从数据洞察到业务行动的 " 最后一公里 "。
· 重塑洞察效率边界:在复杂的流量归因场景中,业务人员只需通过自然语言提问,Data Agent 即可自动整合多渠道数据,进行智能归因分析,并生成可视化图表与结论报告。这一变革将传统模式下需要数天甚至数周的分析工作,效率提升高达96.9%,真正实现了分析门槛的 " 清零 "。
· 构建个性化增长引擎:在智能销售场景中,Data Agent 能够深度融合用户实时行为与历史偏好,依托 AI 自主学习知识库,为每一位客户生成个性化的推荐策略。方案已在超过 10 个核心业务场景中深度应用,场景召回成功率达到94.4%,显著提升了用户点击率与转化率。
海书山强调,评估 Agent 的价值需要建立一个超越 " 准确性 " 的立体框架,即在保证准确性(Accuracy)和鲁棒性(Robustness)的基础上,更要追求洞察性(Insightfulness)——不仅要回答 " 是什么 ",更要揭示 " 为什么 " 并提出 " 怎么做 ",从而创造真正的商业价值。
多模态数据新基建:为AI应用铺设坚实的数据之路
随着 AI 应用向更高级的具身智能、自动驾驶等领域迈进,数据基础设施面临着前所未有的挑战:数据异构性、时空对齐难、高质量数据获取成本高等问题日益凸显。
火山引擎数智平台产品总监王彦辉对此提出了下一代数据基建的建设思路,即通过构建 " 数据 - 模型协同飞轮 ",实现从多模态兼容、计算溯源、高效清洗到自我进化的完整闭环。
基于此,火山引擎正式推出多模态数据湖解决方案。该方案是专为 AI 时代设计的新一代数据基础设施,其核心优势在于:
· AI友好的一站式平台:方案无缝对接 PyTorch、TensorFlow 等主流 AI 框架,支持火山方舟 / 机器学习平台的推理数据回流,提供从数据处理、查询、清洗到模型训练的一站式服务,打通 AI 全链路。
· 强大的多模态数据处理能力:采用新兴的多模态湖格式,能够统一存储图像、音视频等非结构化数据与元数据,并对文件读写速度进行深度优化。方案整合了 NVIDIA NeMo Curator 等先进的数据处理流水线技术,可将 PB 级视频数据的处理周期从数年缩短至数天。
· 开放架构与极致降本:方案全面拥抱开源,并与火山引擎统一基础平台(GPU/CPU/TOS)及 veOmniverse、火山引擎 Isaac Sim 等仿真平台深度协同。
在与国内某头部智驾企业的合作案例中,火山引擎基于 LAS 的多模态数据湖解决方案,帮助客户解决了 PB 级数据处理效率低下、GPU 资源利用率不足 30% 的痛点。最终实现了模型训练提速1.5倍、资源利用率提升至95%、综合成本降低至1/4的显著成效,加速了智驾模型的落地迭代。
此次智创沙龙不仅展示了火山引擎在 Data+AI 领域的最新技术成果与落地实践,更彰显了其与 NVIDIA 等顶尖技术伙伴深化合作的决心。未来,随着火山引擎领先的数据平台能力与 NVIDIA 卓越的加速计算技术更紧密地结合,双方将共同推动高性能 AI 计算在更多产业的应用落地,为企业构建坚实的数据底座,驱动业务实现更高质量的智能增长。
登录后才可以发布评论哦
打开小程序可以发布评论哦