科技快讯网 前天
火山引擎“Data+AI”双轮驱动,构筑企业智能转型新基建
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

当前,随着企业 AI 转型的深入,Data for AI 已成为关键刚需。据 IDC 预测,据 IDC 预测,到 2029 年非结构化数据在企业数据中占比将超过 80%,且仍将高速增长。如何从海量的文本、图像、音视频等多模态数据中高效挖掘价值,已成为企业智能化转型的核心挑战。

近日,火山引擎与 NVIDIA 在联合举办的 "2025 火山引擎 Data+AI 行业领航者智创沙龙 " 在广西成功召开。会上,火山引擎深入剖析了 AI 时代的数据处理挑战,并展示了以 Data Agent 和多模态数据湖为核心的 "Data+AI" 解决方案,旨在为企业智能化转型提供全新动力。

Data Agent:告别价值陷阱,寻找 AI 落地务实路径

企业在 AI 投入翻倍的同时,往往面临业务价值难以衡量的困境。火山引擎 Data Agent 项目负责人海书山指出,企业易陷入 " 追求 100% 准确 "、" 迷信大模型全知全能 " 和 " 技术 Demo= 业务价值 " 三大 " 隐形陷阱 "。

他强调,Data Agent 的务实路径是 "80% 准确 + 快速迭代 ",并推动企业数据应用从 BI(确定性保障)、ChatBI(效率提升)向 Data Agent(洞察创造)演进。火山引擎 Data Agent 构建了从 L1(响应式执行)到 L4(自主式决策)的能力阶梯,其核心价值公式在于融合 " 模型能力、工程可靠性与领域知识密度 "。

海书山分享了 Data Agent 在多个场景的实践:在快消品行业,智能归因 Agent 帮助营销团队解决了跨渠道数据割裂、人工整合效率低下的痛点;在家电行业,智能营销 Agent 通过构建 " 需求预判 - 智能引导 - 精准转化 " 链路,解决了导购能力参差 - 齐、线索转化率低的问题。

多模态数据湖:构筑 AI 时代的数据新基建

Agent 的规模化落地,离不开强大的数据底座。火山引擎数智产品总监王彦辉指出,Agent 时代的数据平台面临非结构化数据存储、多模态数据处理、统一管理以及 AI 处理效率低下等多重挑战。

为此,火山引擎推出了以 LAS Processing Agent 为核心的多模态数据湖解决方案,旨在构建处理与推理一体化的 AI 时代数据新基建。该方案在关键技术上实现了全面革新:

· 湖存储: 引入新一代多模存储格式 Lance,原生支持多模态数据,提供高性能随机访问和零成本加列能力,解决 AI 场景下大字段和高频打标难题。

· 湖处理: 采用 Daft、Ray 等新一代多模态处理引擎,原生支持 CPU 与 GPU 异构计算,火山引擎还与 Daft 创始团队 Eventual.Inc 携手共建 Daft 中文社区。

· 湖管理: 拥抱开源 Apache Gravitino,构建开放的 AI MetaLake;并推出 "AI 算子广场 ",提供超 200 种预训练算子,覆盖文档解析、图像 OCR、音视频处理等,实现全链路自动化。

实践成果:GPU 利用率提至 96%,加速 AI 创新落地

火山引擎的多模态数据湖架构已在多个前沿行业得到验证。王彦辉分享,某智驾公司将其 PB 级数据架构升级至火山引擎新方案后,其单机 8*A100 GPU 的利用率从原先的 60% 大幅提升至 96%,训练任务交付时间缩短了 40%。此外,该方案还帮助国内某头部大模型公司将其训练数据从 WebDataset 迁移至 Lance,彻底解决了数据检索时的读放大和 Shuffle 瓶颈问题。

展望未来,火山引擎表示将持续深耕 Daft、Ray、Lance 等新技术社区,强化多模态数据管理,深化处理与推理一体化,迈向全面的 Agent 驱动。火山引擎与 NVIDIA 在 Data+AI 领域的持续合作,将共同加速高性能 AI 计算在各行业的规模化落地,帮助企业在智能化浪潮中找到最务实的增长路径。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

新基建 ai ai时代 准确 公式
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论