链载Ai

标题: 高效融合结构化与非结构化数据——大模型智能分析 Agent 推动经营分析与洞察的创新突破 [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 高效融合结构化与非结构化数据——大模型智能分析 Agent 推动经营分析与洞察的创新突破

导读大模型时代为智能数据分析带来了机遇与挑战。结合 LLM 和语义层可有效解决当前数据分析的痛点,推动其普及和民主化。未来技术将进一步强化大模型 Agent 在数据分析中的作用,成为企业决策和业务流程的重要组成部分。高效融合结构化与非结构化数据,通过大模型智能分析 Agent 实现创新突破,已成为企业数字化转型的关键。借助该技术,企业能充分挖掘数据价值,提升决策科学性和精准度,从而在竞争中占据优势。

本次分享题目为“高效融合结构化与非结构化数据——大模型智能分析 Agent 推动经营分析与洞察的创新突破”,主要涵盖以下四个方面:

1.大模型时代的智能数据分析背景

2.痛点与解决思路

3.成功案例

4.未来展望

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;">分享嘉宾|岑润哲 数势科技 数据智能产品总经理

编辑整理|杨峰
内容校对|李瑶

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin-top: 8px;margin-bottom: 16px;">出品社区|DataFun


01


大模型时代的智能数据分析背景:LLM 如何推动数据分析的普及


在大模型时代,尤其是大型语言模型(LLM)的推动下,数据分析的普及和自动化显著加速。LLM 通过自然语言处理能力,使非技术用户能够用自然语言与数据互动,从而降低分析门槛。数势科技提出的智能分析 Agent 架构结合指标语义层,为数据民主化提供了有效技术解决方案,提升了数据的可访问性和理解性,使数据分析师和其他角色更高效地工作,推动数据驱动的决策文化。


上图展示了现代化企业中,业务团队和管理团队的数据消费 pipeline。尽管企业已建设现代化的 BI 工具和数据中台,业务团队仍面临诸多挑战,如 BI 工具灵活但学习成本高,管理者难以有效利用分析视图。因此,需要将数据语义层作为桥梁,使大模型更好理解用户需求,智能提供数据和报告。


数据民主化:即推广数据的平等访问和使用,使各角色员工能直接参与数据分析和决策。强调数据的易获取性、易理解性和易用性。


未来的数据使用模式


技术实现


目前,企业中能有效解读数据的人员不足 5%。提升非技术人员的数据分析能力至关重要。通过将数据仓库底表转化为数据语义层,非技术人员也能获得良好服务,支持数据驱动决策。


最终目标是将能消费数据的群体比例从 10%-15% 提升至 95% 以上。数势科技的“民主式数据分析”理念,通过降低数据使用门槛,使每个人都能获取洞察并做出决策。实施需构建用户体验层、数据语义层和数据平台底座的多层架构,促进数据透明度和可访问性,推动数据驱动文化,实现数据民主化。


02


痛点与解决思路:如何结合 LLM 与 Semantic Layer 助力数据获取、数据分析与数据洞察


企业在数据分析中面临的痛点影响了效率和从数据中获取价值的能力。为解决这些问题,企业需简化数据提取流程、降低 BI 工具的使用门槛,并优化数据洞察和总结工作流程。通过这些改进,企业可提高数据分析效率,快速获得洞察,更有效地支持业务决策。


1. 常见痛点


在数据分析场景中,许多企业面临数据提取、BI 工具学习和结论缺失等痛点。


数据提取的痛点:SQL 学习难度高。SQL 是从数据库提取数据的主要工具,但其复杂性对非技术员工构成显著障碍,导致学习曲线陡峭、效率低下和对技术团队的依赖。


数据分析的痛点:BI 报表配置难度高。BI 工具需专业配置,增加技术依赖和复杂性,影响用户上手和数据分析效率,并增加维护成本。


数据洞察与总结的痛点:大量时间花费在导出数据到 Excel。分析团队需花费时间在数据导入和整理上,降低工作效率,限制快速反馈能力,且用户技能限制了分析深度。


2. 针对数据提取的解决方案


虽然自然语言处理和 NL2SQL 可以部分解决数据提取问题,但在企业级分析中,由于数据量大、复杂性高和安全性要求,这些方法常难以提供准确结果。此外,即使 SQL 查询语句正确,面对百亿级数据量时查询也可能无法及时完成。因此,需要探索更先进的解决方案,如结合大模型和数据语义层来优化数据提取过程。上图展示了一种基于大型语言模型(LLM)的自然语言到 SQL(NL2SQL)转换方法,旨在通过对话式查询简化数据提取,降低对专业 SQL 知识的依赖。

标准 NL2SQL 方案:

NL2SQL方案技术挑战与痛点:


在数势科技的实践中,我们倾向于结合语义层(Semantic Layer)与大模型进行数据分析,因为企业内部的指标体系蕴含复杂的业务逻辑,构建稳固的语义层至关重要。良好的语义层与底层数据模式(Schema)映射能够更准确地解析用户需求。


业务语义层是智能分析产品的基础,能够将复杂数据结构转化为易于理解的业务概念,使非技术用户也能有效进行数据交互和分析。它为大模型提供必要的上下文,帮助更好地理解企业数据。


在构建语义层过程中,我们总结了七个核心要素:


业务语义层的构建是智能分析 Agent 成功的关键,通过这七个核心要素,企业能创建灵活强大的数据层,支持复杂分析需求,并提供易于理解的业务视图,提升数据分析效率,使更多非技术用户能够从数据中获得洞察。


数势科技通过构建企业级统一语义层(Semantics Layer),显著提升了数据查询的准确率和性能,补充了大模型的能力,具体优势包括:


数据可信,准确率提升


性能提升且稳定


学习成本低


数据安全可保障


能力覆盖更全


技术架构关键组件


与市面上常见的 NL2SQL 技术相比,我们提出的 NL2Semantics 结合了 Agent 技术,更适合处理复杂任务。在企业应用中,用户常需进行跨表查询和撰写报告等高阶任务,这些任务涉及数据提取及结果解释。通过 Agent 机制,复杂任务可以拆解为多个子任务依次执行,并最终以报告形式呈现,准确满足用户的高级需求。


尽管 NL2Semantics 和 NL2SQL 都是将自然语言查询转为数据库查询的技术,但两者在实现和效果上有差异。NL2Semantics 通过构建语义层提高查询准确性,而 NL2SQL 则直接转为 SQL 查询。NL2Semantics 在复杂数据分析场景中展现出更高的准确性和实现度,能够更好地处理自然语言中的模糊语义,提供精确的数据分析结果。


示例:关于“华东区XX商品的下单金额周环比下降”的问题:


针对数据分析的解决方案:不同层次的数据分析对业务的价值不同,低层次的数据检索和可视化价值较低,而高层次分析如指标变化原因和业务复盘则更具价值,常需依赖非结构化信息的输入(如外部行情、天气、政策等)。因此,我们需在数据提取基础上融合这些知识,以输出更有价值的信息和智慧。


如图所示,数据分析领域的四层金字塔结构根据请求数量和分析深度分为四个层次:


事实层(Facts)


洞察层(Insight)


知识层(Knowledge)


智慧层(Wisdom)


通过这一结构,企业可以更好地理解数据分析的需求和价值,逐步构建数据分析能力,从基础查询发展到高级分析与决策支持。


为实现复杂任务的拆解和执行,我们采用了 Agent 架构。以金融客户为例,当客户提出“近7天哪个基金的申购人数最多,哪个渠道跌幅最大,并撰写总结报告”的需求时,我们通过专家雇佣机制将任务拆解为数据提取、归因分析和报告生成等子任务,每个子任务由相应的 API 或算法执行,最终整合为完整的分析报告。这种方法提高了分析准确性和用户体验。


Agent 架构模拟人类专家的协作,提供灵活强大的解决方案,其关键组成部分包括:


通过动态雇佣和协调专家,Agent 架构提供灵活可扩展的解决方案,提高分析准确性和效率,使结果更符合业务需求和用户期望。正负反馈循环有助于持续优化数据分析的质量与价值。


数势科技的大模型 Agent 架构结合数据语义层,提供全面高效的数据分析解决方案,具备任务规划、数据理解和高效计算三大核心能力,自动化处理复杂数据分析任务,提升分析效率和深度。


以零售行业为例,面对模糊复杂的“经营复盘”需求,传统查询工具难以满足,而 Agent 架构通过 Feelshot 管理机制,结合历史分析和当前需求,自动生成决策流和执行计划,并以报告形式呈现,帮助业务方理解和决策。


3. 针对数据洞察的解决方案


在数据分析中,归因分析至关重要,支持因子、维度和相关性等多种归因方式,同时结合企业内部的非结构化知识,提高分析准确性和可读性。高级用户关注概览和建议,因此报告需将非结构化知识与结构化数据结合,简明呈现结果。


高质量数据报告依赖五个核心要素,强调“大模型擅语文,小模型精数学”,充分利用大模型的归纳总结能力和小模型的统计能力。


数据报告的五大构成要素包括:


大模型与小模型在数据分析中各有优势:大模型擅长归纳总结,小模型精于统计计算。结合两者能提高分析效率。例如,在客户订单量分析中,传统方法需 4 小时手动提取数据和编写报告,而新方法利用大模型调度小模型进行数据处理,提升了效率并确保报告的准确性和深度。输出的可视化图表和详细分析由两者共同完成,结合企业知识库和 SOP,生成更具业务洞察力的报告。通过协同工作,小模型确保统计准确性,大模型提供深入洞察,使数据分析报告更全面、实用,助力企业决策。


03


成功案例:某头部金融机构智能分析助手落地案例


上述图片是我们服务的一家头部金融机构,应用数势科技 SwiftAgent 产品的实践成果。该项目主要服务于总行和分支行领导,关注银行的关键数据指标,如净收入和存贷款情况。


该金融机构选择我们的技术,主要是由于两个痛点:一是缺乏人力和预算来支持大量分析师服务;二是指标不一致导致分析结果难以统一。


为解决这些问题,我们实施了两个架构方案:一是构建语义层(Semantic Layer),确保指标定义和血缘关系清晰;二是提供智能分析产品(SwiftAgent),支持自然语言交互、报告生成和自动化归因分析。该解决方案旨在通过智能化工具提升银行在企业经营分析、营销复盘和日常数据使用等方面的能力。


在一期项目中,我们优先落地了分支行领导的业绩对比场景。目前,我们正在推荐二期项目,计划针对财富管理代销、信用卡业务和对公风险评估等场景进行落地。


SwiftAgent在城商行的核心应用场景:


SwiftAgent的技术优势:


实施效果:


为提升系统性能和用户体验,我们在后端设置了专门的 bad case 优化与收集模块。当用户提出问题并得到不满意的答案时,我们记录反馈并将其作为新需求进行优化。这一用户反馈循环机制使系统不断改进,实现数据飞轮效应:用户使用越多,系统越能理解并满足其需求。


数势科技 SwiftAgent 在智能分析领域有四大核心优势:


综合这些优势,SwiftAgent 为金融等行业提供高效、易用且安全的智能分析解决方案,支持复杂的数据分析需求,帮助用户提取有价值的洞察,同时确保数据的安全和合规性,降低分析门槛,让更多非技术背景的用户参与数据分析。


04


技术总结与未来展望


1.技术总结


我们通过 autosymatics 技术连接了数据语言与业务语言,确保用户能够准确理解数据。利用大模型的反问与追问功能,引导用户逐步成为专业分析师。通过我们的架构,用户可以用简单的语言提出需求,而系统则将其拆解为复杂的思维链,逐步完成复杂问题的回答。我们已经在金融机构成功落地了私有化部署,并满足了金融级的安全和合规性要求。


2.未来展望


未来,将增强系统的主动思考能力,使其自动推送预警和问题,降低用户思考成本,并加强归因分析,整合非结构化数据报告,以提升产品活跃度和用户体验。


目前许多工具仍按需提供报告,而 Data Agent 应具备更强的主动性,尤其针对领导层用户。未来的 Data Agent 将能自动分析指标,并在发现问题时主动推送信息,使用户在提出问题前已有明确的询问动机,从而更高效利用数据资源。数势科技的智能分析系统将主动帮助银行领导识别和分析潜在数据问题,而非被动等待提问。


主要策略包括:


技术实现:







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5