爱分析 07-02
从人工取数到智能归因,Data Agent如何破解企业数据分析痛点
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

6 月 25 日,数势科技数据智能产品总经理岑润哲在爱分析第三届 AI 大模型高峰论坛中出席分享,以金融、央国企连锁零售行业为例,带来数据智能决策 Agent 的最新实践。

随着国家推动 AI 渗透率与智能决策化率提升,国央企及金融机构对数据分析的需求愈发迫切。Data Agent 通过构建指标体系与语义层,让大模型理解自然语言需求,从被动取数升级为智能归因分析与报告生成,推动数据消费范式从 " 人找数据 " 向 " 数据找人 " 转变。本文将深入解析 Data Agent 的技术突破、行业实践案例及未来演进方向,展现其如何为企业决策提供高阶价值,成为智能时代的决策中枢。

分享嘉宾|数势科技数据智能产品总经理   岑润哲

内容已做精简,如需获取专家完整版视频实录和课件,请扫码领取。

01

行业范式革命,从被动分析到智能决策中枢

近两年众多国央企及金融机构积极开展数据分析智能体项目建设,希望落地数据分析智能体,其原因可以由以下图表进行说明。

1. 首先数据分析领域存在不同层次,许多企业已有数据仓库及 BI 工具,却仍需落地 Data Agent。目前大部分企业的现有数据仓库加 BI 工具,更多满足的是 L1 级别的数据提取,仅这一层就有很多机构招聘数百名分析师,以人工方式低效地进行数据提取与报表分析。而在更高层次,没有精力开展指标归因、报告生成等工作。大模型与企业现有数据的融合是重大机遇,因为这能提升数据提取效率,使指标归因更智能,且行业化报告也可通过大模型生成。

2. 从宏观层面来看,国家计划在 2027 年之前实现 AI 渗透率超过 40%、智能决策化率超过 30%,这是大趋势。许多央国企领导在交流中表示,在所有 AI Agent 的落地场景中,他们会优先选择数据分析,原因在于数据分析与决策的关联性最强。例如,AI Coding 及各类创意场景虽可落地,但与企业经营决策、财务等领域并非直接相关,而数据分析恰恰是与企业经营决策最相关的落地场景,这也是众多国企优先选择落地数据分析相关领的原因。

3.Data Agent 能够改变企业的数据消费范式。目前众多央国企及金融机构,其现状如上图所示:招聘一批专业数据分析师及数据工程团队,为业务方及领导提供服务。业务方或领导提出报表等需求,交由工程师和分析师处理,这一流程相对较长。但是当企业内部构建好指标的数据语义层后,大模型能更好地理解自然语言需求,无论是撰写报告还是开展分析。这种方式能极大地推动企业内部的数据民主化进程,提升数据消费的效率与价值。

当前许多企业的需求是希望通过大模型查询企业内部的财务指标,但实际上仅能查询数据的价值很低,原因在于,当企业内部有几百张报表时,对业务方而言,查询到数据本身并不代表价值;更大的价值在于明确数据背后指标变化的原因,以及能采取哪些措施提升这些指标。目前数势科技开发了 AI 报告能力,可将企业内不同指标转化为行业化报告,呈现给领导和业务方。这样能从数据本身的 " 是什么 " 迁移到 " 为什么 " 和 " 怎么做 ",为业务方带来更高层次的价值。

02

技术突破与行业场景解构

近两年头部国央企及金融机构落地 Data Agent 时面临着诸多挑战,数势科技与甲方共同实践总结出解决方法,主要包括三个方面:

第一,许多企业的内部技术团队尝试开展 ChatBI,但存在数据取不准的问题;

第二,如何从数据基础提取跃迁到智能归因分析;

第三,如何通过报告能力解决汇报最后一公里的问题。

很多企业原有技术团队在尝试利用大模型能力与已有数据仓库进行 NL2SQL 尝试,但尝试后发现,直接将底表交给大模型生成 SQL 不仅难度大,还存在数据准确性问题。数势科技的技术路线是先构建指标体系,通过 NL2Semantics 技术让大模型将用户请求转译为指标与维度的语义,再与底层数据库交互,从而更准确地实现数据分析查询能力。

具体技术路线如下:不让大模型直接穿透到底表,而是先让其理解用户意图。例如用户想查询公司利润率趋势,大模型需先提取这句话中的时间要素、指标要素,此时大模型只需完成类似语文题的任务。至于底层指标体系对应的 SQL 片段,更多采用召回逻辑。通过这种方式,能确保像国央企 CFO 等查询财务指标时,每次查询都稳定输出准确结果,而非让大模型即时生成随机的 SQL 片段。

解决指标准确性问题后,另一个问题随之而来:领导认为提取数据这一工作 BI 工具也能完成,AI 并未带来增益价值,对指标进行更高阶的预测、归因,才是相比传统 BI 工具的提升之处。

例如,若想查询企业内部利润下降的原因,系统会通过指标归因、因子归因、维度归因等算法能力,解释指标变化的原因。这一能力是企业内部领导真正需要的——不仅要呈现财务数据,还需解释某省份分公司利润下降的原因、外部事件对指标下降的影响,并结合企业内部知识给出建议,如通过何种策略或 SOP 进行优化。

数势科技为某国央企性质的金融机构打造的场景:该机构使用数势科技的工具,既可进行指标提取分析,又能结合行内指标开展智能归因洞察。作为银行,其关注贷款余额、信用卡等指标,业务方通过前端输入自然语言查询指标增长情况,在具备基础提数能力后,可在前端快速查看 SQL 代码并保存为卡片供未来使用。

对该行领导而言,最重要的模块是对指标本身进行解释。例如,若某分行指标下降,可通过大模型调用归因小模型算法,明确指标变化的核心原因,如某分支行、某类产品、客户或贷款出现异常。通过大小模型协同,直接向用户呈现指标背后的原因,使用户不仅知晓指标数值,还能了解可能是哪些分支行的指标存在问题,从而开展针对性优化。这是该机构的核心使用场景。

在解释清楚数据的 " 是什么 " 和 " 为什么 " 之后,还需解决最后一步问题:终端用户多为业务分析师,完成数据分析后需向领导汇报或在内部复盘会中使用。因此希望借助大模型的生成式能力,解决这最后一公里的问题——将数据表格及归因分析结论转化为领导可读的业务报告。目前这一步骤多依赖人工,数势科技近期开发了名为 "AI Report" 的新功能,可通过深度研究机制持续挖掘数据异常原因并进行总结,生成完整报告供领导使用。

例如,以往仅能提取数据,但几千行数据对领导而言难以直接阅读。现在通过大模型的深度研究机制,使其理解企业内部指标体系,生成完整架构,并将报告以图表、文字等清晰形式呈现,便于开展深度归因复盘。

具体方法是撰写完整的数据复盘报告,在数势科技产品体系内包含五个核心要素,第一个模块是结构化指标及指标间的关系,这一层面至关重要,还需为其设计行业化提示词及提供半截化信息。例如,企业内部报告的撰写方式,以及报告中会用到的同环比分析、趋势分析等算法算子库,让大模型理解这些背景信息后,自行组合技能、指标及元信息生成报告,这是底层核心要素。

其实现效果是,用户在前端无需详述细节,只需说明需求(如零售行业的利润情况),系统会通过类似 DeepSeek R1 的思维链,明确呈现思考过程,并提供可编辑大纲。用户可从趋势等角度编辑大纲,向大模型传递分析思路。底层由大模型执行异步任务,花费 5 分钟深度思考推理报告生成需求,最终在后台自动生成销售趋势、占比等相关图形及结论。

以某国央企为例,其以往人工撰写报告需两天,且效果不及系统生成;如今 15 分钟内即可完成,财务部门得以从冗余的查数、写报告工作中释放出来。只要模板设定完成,15 分钟内即可生成报告,且可导出为 Word 或 Excel 进行编辑。其优势在于适配汇报场景,能融合指标体系、挖掘数据洞察并呈现给用户,这是解决业务最后一公里的核心功能。

03

多行业实践案例

案例一:某大型国央企银行面临的主要问题是数据团队难以支撑众多业务部门的需求:其数据分析团队有 200 人,而业务方达上千人,无法通过招聘等量分析师满足需求,且指标混乱。

针对这些问题,数势科技提出相应解决方案:

技术架构层面,做好指标口径管理,这属于业务知识沉淀,是大模型无法完成的工作,包括明确财务指标数量及分析维度等;完成统一指标管理后,可借助 DeepSeek R1 等模型理解指标,实现自动化报告生成及交互式指标问询。

场景层面,数势科技为该银行服务了多个场景,其中客户最关注的有三个:财务分析、风险评估、分支行业绩对比。当领导想了解各分支行的贷款增速情况,可通过前端自然语言询问实现快速查询。

银行领导使用产品的方式是:系统会主动推送信息,例如提示北京某分支行网点出现问题需关注,领导通过自然语言交互查询数据明细、对数据异常原因进行归因分析总结并生成报告。这种使用流程与传统 BI 工具完全不同,以往培训领导使用 BI 工具可能需要一个月,且对方未必愿意使用,而现在的交互如同微信聊天,以纯自然语言形式提供数据洞察能力。

案例二:某国央企性质车企,其痛点在于车型试制场景涉及 10 万个指标,需通过指标分析组合辅助新车型研发。数势科技搭建指标体系并提供智能问数功能后,试制工程师的日常取数及计算时间减少 80%,工作效率提升 5 倍以上,同时加快了该车企新车版本的迭代速度。

04

Data Agent领域未来演进方向:

第一,从被动响应向主动洞察跃迁。当前工具如 DeepSeek、豆包等,均为被动响应模式,需用户主动提问才给出答案。但企业内部财务、市场营销、供应链等指标繁多,用户难以提前预判哪些指标出现问题。因此,需要大模型主动扫描数据库,提示可能存在问题的指标,实现主动式洞察。  

第二,提升通用 Agent 的个性化能力。使用记忆(memory)机制,增强 Data Agent 对用户个性化需求的理解,例如记录用户当天关注的问题,次日可基于该主题提供相关信息,这也是今年的主流趋势。  

第三,从同步化向异步化转变。今年以来,随着 DeepSeek、Manus 等的兴起,人们逐渐认识到,并非所有需求都需大模型在 5 秒内响应,用户可接受其花费 5-10 分钟生成报告。未来将有更多异步化复杂任务支持企业业务方及领导开展高阶工作,这对价值提升将更为显著。

若仅将大模型应用于简单的 Chat Data 层面,并无实际价值。必须将业务方关注的报告、归因等内容,以更高级的形式呈现给终端用户,才能整体提升 Data Agent 项目的价值。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

数据分析 ai 金融机构 国企 渗透率
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论