链载Ai

标题: 小米商品助手、汽车问答垂直领域问答 Agent 建设 [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 小米商品助手、汽车问答垂直领域问答 Agent 建设

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;color: rgb(0, 0, 0);font-size: 14px;text-align: justify;visibility: visible;line-height: 2em;">导读本次主要围绕小米商品助手、汽车问答垂直领域问答 Agent 的建设展开。如何打造技术方案并克服挑战,为小米的商品助手和汽车问答助手等典型场景实现落地和赋能。

本文将围绕以下展开:

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;visibility: visible;">1. 业务背景

2. 技术方案

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;visibility: visible;">3.落地难点

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">4. 小结

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 1.5px;line-height: 2em;">5. Q&A

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">分享嘉宾|明振南 北京小米移动软件有限公司 高级算法工程师

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">编辑整理|王丽燕

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">内容校对|郭慧敏

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: normal;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;text-align: left;line-height: 1.75em;">出品社区|DataFun


01


业务背景


在小米的众多产品中,语音交互是重要的用户交互方式之一。用户通过小爱语音助手提出各种需求,这些需求可分为通用问答和垂直领域问答。通用问答包括内容类需求(如音乐、视频资源查询)和闲聊、百科知识问答;而垂直领域问答则依赖私有领域知识,无法通过大模型的世界知识直接回复用户。

小米垂直领域问答的业务背景涵盖小米百科内容、小米生态链产品,涉及手机、汽车、音响、电视等商品,用户会针对这些商品产生各类查询需求。具体分为商品助手和汽车问答助手两大版块具体场景:


在大模型技术兴起之前,针对商品助手和汽车问答等不同垂域,采用意图识别模型(如Bert)进行语义理解和槽位抽取,再通过编写策略来满足用户需求。但这种做法需要为每个垂域和场景定义大量的意图和策略。随着大模型技术的发展,特别是RAG技术的出现,团队希望打造一个统一的垂直领域问答助手(Agent),基于RAG + LLM的统一架构方案来解决这些垂直领域问答场景,减少为每个业务场景定制细化功能和槽位的工作量,同时删除线上许多旧规则模块。

以上图所示终端设备交互场景为例:在手机端,用户问小米15等机型怎么样时,通过大模型垂直领域Agent把机型参数、功能亮点等信息,以自然语言生成结构化回答,并同步推荐商品卡片。在车载场景中,用户高频询问“当前驾驶模式”“远光灯开启方式”等操作类问题。Agent通过车机系统实时数据接口获取车辆状态,针对“如何打开远光灯”的查询,系统可快速定位用户手册中的操作指南,以图文混排形式展示出来,解决新车用户对汽车功能的使用困惑。这就是我们要打造的垂直领域问答助手。


02


技术方案


为了满足小米垂直领域问答的业务需求,同时考虑到小爱作为线上实时语音交互入口对服务性能响应耗时的严格要求,技术方案遵循简洁原则,将整体架构分为四大核心模块:


在垂直领域问答的意图理解方面,传统做法使用Bert模型,但大模型具有更广泛的世界知识。通过实验对比发现,大模型的性能远高于Bert模型,特别在长尾复杂query的意图理解上。因此,我们最终选择将模型升级为大模型,且其量级一般在1-3B左右即可满足线上业务需求,而且耗时能控制在一两百毫秒以内。


为了降低GPU和资源的使用,提高效率,在AgentParser模块中设置了Agent意图预识别。对于小爱线上高频的简单查询需求,通过判断是否需要大模型理解,若不需要则直接生成function code;对于需要大模型理解的query,则输入包含系统人设要求、领域知识、多轮上下文和端上上下文信息的prompt。


在小米的业务场景中,端上的上下文信息非常关键。以汽车载端为例,用户查询设置项操作时,设置项依赖于端上的实时状态,而静态知识库无法跟上端上的实时变化。因此,需要将端上的实时动态信息(如开关状态、玻璃水状态等)通过context提供给大模型,以帮助其更好地理解用户意图并输出正确的function code。

AgentSkill模块主要负责根据function code进行执行操作,具体包括以下方面:


RAG框架与业界上大致相似,但在细节上有一些小模块的替换。用户Query首先进入粗召回阶段,通过大模型改写、HyDE改写等模块优化查询语义,随后通过向量检索、实体检索及Web搜索实现多路召回。之后进入精排环节,早期采用bge reranker模型,现升级为大模型进行排序,再根据一些策略和技术进行结果重排,完成对多路召回结果的综合排序,最终生成大模型所需的Prompt。


RAG检索模块的核心在于通用RAG平台,其整合了售后客服QA、小米商品百科、用户手册、说明书、米车销服QA等多源领域数据。我们将更多精力投入到这类底层数据如何接入RAG库和如何切片上。


如上图通用RAG平台主要分为三大模块:


通用RAG平台之所以强调“通用”,核心在于其需兼容多业务场景的差异化需求。实践表明,RAG系统的效果高度依赖知识切片策略与数据结构化处理,而单纯采用通用切片方案(如固定长度切分、标点符号切分)难以满足细分场景需求。以垂直领域为例,即使通过开源工具或自研组件将PDF、Excel等原始数据解析为Markdown格式,切片策略仍决定着检索质量。当前主流切片方式包括:固定长度切分、标点符号切分、层级索引切分、语义切分;尽管平台提供通用切片能力,但在实际应用中,各领域场景仍需定制化策略,对提升垂域检索效果具有显著作用。


因此,通用RAG平台仅能提供基础检索能力,难以直接满足线上业务高水平需求,若要将系统可用性从90分提升至95分,需结合业务理解与用户Query分布特征,针对性设计大量自定义切片策略,这正是各垂直领域RAG系统核心竞争力所在。


03


落地难点


下面聚焦小爱落地过程中的技术难点。首先是知识库向量化挑战。在小米业务场景中,数据源规模庞大且结构复杂,包含:商品百科数据:涵盖手机、电视等全品类商品的参数表格,包含价格、性能指标等海量数据。还有客服QA与运营QA等数据。面临的难题是如何用最快速高效的手段把这些数据接进来,同时保证线上业务的效果。


以商品知识为例,其典型数据包括百科信息与商城信息,主要为网页上的参数数据。该场景的首要任务是数据收集,需先爬取网页数据,再进行合并更新。此环节尤为关键,因商城信息中价格、库存等均为实时数据,需要保障知识库的时效性。若用户询问手机库存时,系统反馈与商城实际情况不符,会影响用户体验,因此确保知识库实时性是关键。


数据更新后,我们将开展两项工作。其一,进行向量文本生成,为构建RAG库奠定基础。其二,对静态知识进行深度处理,不仅生成向量文本,还需完整保留数据中的层级索引关系。将商品名称、属性归属、品类层级等结构化数据,以JSON格式存入专用Schema库。这种结构化存储与向量检索相辅相成,能辅助提高线上业务检索效果。


此外,我们还构建了别名自动化模块。在实际业务中,商品别名是无法回避的问题,比如用户用简称、俗称询问产品,因此我们专门建设了别名知识库。总而言之,构建商品知识体系,需要一套高效的离线实时更新合并流程,以此确保知识库的时效性,完整性和准确性。除构建基础向量文本外,还需对层级索引、属性归属等结构化数据进行Schema存储,并通过独立数据库管理。检索时,需综合多库数据完成知识整合。


以商品知识向量化为例,以红米Turbo 4手机参数页面为例,其品类层级、参数取值等信息均呈现于网页中。得益于内部API接口,我们可直接获取格式化的JSON数据,规避了文档解析、Markdown处理等前期预处理难题,获得高度结构化的原始数据。在构建知识向量化时,尝试多种方案后发现,最简且有效的方式是对结构化数据进行字段拼接:即goods + attr + value的形式,对各种键值对进行组合,生成多组文本并向量化,能有效辅助召回。


在汽车场景中,典型场景可分为静态知识与动态知识两类。静态知识指可通过离线建设的固定信息,与需实时获取的动态信号形成区分。尽管业界有成熟和开源工具提供文档解析、检索模型等能力,但实践发现,直接复用开源工具往往难以满足业务需求,仍需结合业务特性进行适配:


在汽车静态知识场景的实践中,我们验证了上述策略的有效性:一个RAG系统的效果中,约80%来自于Chunk切片策略与定制化索引构建。


在汽车问答场景中,动态信号处理是另一核心挑战。这类信号可分为三类:


完成信号梳理后,其向量数据将分流至两大平台:一是小爱信号平台,专为车机商用场景设计,支持实车环境下的动态信号实时检索;二是静态知识库平台,通过大模型增强手段构建文本检索体系。针对开关类信号的字段或英文字符串形式,直接检索难以匹配用户自然语言Query,因此需借助大模型生成辅助增强检索Query。


针对语义不完整(指代问题、信息缺失)和语义不匹配(因果推理问题、用户表述gap、纠错问题)的情况,基于LLM做SFT任务实现query改写,包括多轮rewrite语义补全和HyDE生成潜在query,以增强检索效果。


在领域知识检索环节,切片策略可将系统效果提升至80-90分,而从90分到更高水平则需依赖算法与模型层面的优化。


在垂直领域模型构建中,回复对齐是关键环节,核心涉及SFT(监督微调)与DPO等后训练工程实践。首先,我们对大模型能力做了抽象能力,总结出7项基础能力:


通过这一层能力定义,再结合线上业务总结划分出16种细分能力,完成能力维度归类后,进入SFT数据构建阶段。我们采用轻量化迭代策略:针对每个细分能力场景,先构建少量标注数据,逐能力验证效果后再逐步扩展,避免一次性全量建设带来的成本压力。数据构建完成后需进行加权整合,这一环节需结合业务经验设定各类数据比例。整合后通过全量微调提升模型拟合度,实践表明全量微调可使准确率提升2-3个百分点。若需进一步优化回复风格,可叠加DPO模块,但SFT本身已能满足大部分线上需求,DPO通常仅带来1-2个点的效果增益。模型选型上,考虑到线上推理耗时限制,我们采用7B轻量级模型,通过知识蒸馏+精标SFT数据混合训练,使轻量级模型效果接近千亿级大模型。还有对比全参微调与LoRa微调,全参微调的效果优于LoRa微调,尽量建议采用全参微调。


针对回复对齐任务的经验总结有以下几点:


在垂直领域问答场景中,品牌舆情管理是不可忽视的环节,核心挑战集中在两点:在信息回复方面,要求信息准确不杜撰,以官方发布为准,不编造事实;价值观对齐,回复内容相对客观,对小米正向。 解决方案包括自研AI联网搜索,控制信源质量,以及通过后训练对齐优化(SFT + DPO)。


04


小结


本次分享围绕小米垂域问答助手(如商品助手、汽车业务助手)的核心问题与解决方案展开,核心内容可归纳为以下四方面:


05


Q&A


Q1:定制化分块策略在通用RAG平台如何兼容或支持?


A1:通用RAG平台需具备兼容与自定义能力。在平台建设阶段,团队提前与RAG平台开发方约定接口协议,确保平台支持自定义切片策略。实际操作中,开发者只需按既定协议封装切片逻辑,即可将策略无缝移植至平台,实现通用能力与定制化需求的结合。


Q2:如何前置评估query改写的质量?


A2:评估query改写质量可采用量化指标与业务导向指标两种方法:


量化评估:比如ROUGE-l这类辅助指标,可以衡量生成文本与参考文本的匹配度,可作为辅助定量观测指标,对比改写前后query的语义匹配度,适用于语义补全改写场景;


业务导向评估:结合具体业务目标设计评测集。例如,若改写query用于多轮检索召回,可通过对比改写前后检索任务的召回率、准确率等指标,直接衡量改写对业务效果的提升,更直观反映改写质量的实际价值。

以上就是本次分享的内容,谢谢大家。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5