人民大学与清华大学研究团队突破：让AI像数据科学家一样思考和工作

显示全部楼层

还记得那些熬夜赶报告的日子吗？一堆乱七八糟的Excel表格、CSV文件和数据库，老板要你"从数据里找出点有价值的东西"。你盯着屏幕，不知从何下手——先清洗数据？还是先做可视化？做到一半发现数据格式不对，又得推倒重来。这样的场景，每个做过数据分析的人都不陌生。

现在，这个让无数数据分析师头疼的问题，可能有了新的解决方案。

中国人民大学和清华大学的研究团队介绍了他们开发的DeepAnalyze-8B系统。这个AI不只是会回答问题或写代码，它能像一个真正的数据科学家那样工作——自己规划分析思路，自己写代码测试，看到结果不对还会自己调整方案，最后输出一份专业的研究报告。

更让人惊讶的是，这个系统只有80亿个参数，体积相当于一些中型语言模型，却在性能上超过了许多基于GPT-4o这样的超大模型构建的数据分析工具。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">数据科学的困境与突破

数据科学一直是人工智能领域的一个特殊挑战。设想你是一家企业的数据分析师,老板给你一个模糊的问题:"从我们的支付数据中找出能降低成本的机会。"这个看似简单的任务,实际上包含了一系列复杂的步骤。你需要理解数据结构,清洗不一致的记录,进行统计分析,建立预测模型,创建可视化图表,最后将发现整理成一份有说服力的报告。每个步骤都可能遇到意外情况,需要根据实际结果调整策略。

传统的人工智能系统在处理这类任务时面临两大核心难题。首先是"自主编排"能力的缺失。现有的数据智能体通常依赖预先设计好的工作流程,就像按照固定食谱做菜一样。当遇到配方中没有的情况时,它们就束手无策了。其次是"自适应优化"能力的不足。真正的数据科学家会根据中间结果不断调整方案,而大多数AI系统缺乏这种在真实环境中通过反馈进行迭代改进的能力。

研究团队发现,要解决这些问题,关键在于让模型像人类数据科学家一样在真实环境中学习和成长。人类数据科学家的成长路径是有规律的:从掌握单项技能开始,比如学习编程、理解统计学、掌握数据库操作,然后逐步整合这些能力,最终能够独立完成复杂的数据研究项目。DeepAnalyze正是模仿了这个学习路径,通过"课程式智能体训练"范式,让模型从简单到复杂地逐步掌握数据科学的各项能力。

更具体地说,研究团队设计了一个两阶段的训练过程。第一阶段专注于强化单项能力,包括推理能力、结构化数据理解能力和代码生成能力。这就像一个初学者先分别学习如何烹饪、如何调味、如何摆盘。第二阶段则通过在真实数据环境中的强化学习,让模型学会如何综合运用这些能力解决复杂问题。这个阶段相当于让厨师在真实厨房中反复实践,根据食客反馈不断改进。

训练过程中还有两个关键创新。一是"数据驱动的轨迹合成"框架,它能够自动构建高质量的训练数据。由于高质量的数据科学交互轨迹数据非常稀缺,研究团队开发了一套多智能体系统来自动生成这些数据。另一个是混合奖励建模机制,针对数据科学任务的开放性特点,将基于规则的奖励和基于大语言模型评判的奖励结合起来,确保模型不仅能完成任务,还能生成高质量的研究报告。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">DeepAnalyze的独特设计

DeepAnalyze的核心创新在于它的交互架构设计。不同于传统大语言模型只能处理文本,DeepAnalyze能够直接与数据环境交互。研究团队为模型定义了五种基本动作,每种动作都有特定的XML标签来标识。

首先是分析动作,用标签<Analyze>包裹。当模型需要进行规划、推理或反思时,就会生成这种动作。比如在面对一个复杂的数据分析任务时,模型可能会先分析:"要完成这个任务,我需要先查看数据结构,然后选择合适的统计模型,接着进行数据清洗..."这个过程完全由模型自主完成,不需要人工指定步骤。

第二种是理解动作,标签为<Understand>。这个动作专门用于理解结构化数据的内容,比如数据库表格、CSV文件等。研究团队特别将这个动作与推理过程分离,是因为他们发现,对结构化数据的理解需要与一般推理不同的认知模式。就像人类在读表格和读文章时使用不同的思维方式一样。

第三种是代码动作,用<Code>标签包裹。模型会生成Python代码来操作环境中的数据,比如读取文件、进行数据转换、创建可视化图表等。这些代码会被实际执行,不是纸上谈兵。

第四种是执行动作,标签为<Execute>。这个动作用于收集代码执行后的反馈。当模型生成代码后,环境会自动执行这些代码,并将结果放入<Execute>标签中返回给模型。模型根据这些反馈决定下一步行动,形成真正的交互循环。

最后是回答动作,用<Answer>标签包裹。这是模型完成任务的标志,通常包含最终的分析报告或问题答案。

这种设计的巧妙之处在于,所有动作都是模型自主生成的,没有任何人工预定义的工作流程或规则。模型完全根据当前情况和任务目标,自主决定何时进行哪种动作。这种自主性是DeepAnalyze能够处理开放式数据研究任务的关键。

此外,DeepAnalyze在处理大规模数据时采用了一种混合策略。对于小型数据,模型可以将其转换为文本直接放入上下文中理解。但对于大型数据集,模型会主动探索外部数据源,根据需要逐步加载和检查数据。这种设计借鉴了人类数据科学家的工作方式——他们不会试图一次性记住所有数据,而是根据分析需要有针对性地查看相关部分。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">课程式训练如何让AI成长

DeepAnalyze的训练过程最有趣的地方,就是它模仿了人类数据科学家的成长路径。这个过程被研究团队称为"课程式智能体训练",分为两个渐进的阶段。

第一阶段是单能力微调。基础大语言模型通常没有经过数据科学领域的专门训练,所以首先需要增强它的各项基础能力。研究团队重点强化了三个核心能力:推理能力、结构化数据理解能力和代码生成能力。这三个能力分别对应DeepAnalyze的三种基本动作——分析、理解和编码。

推理能力的训练使用了包含长推理链的数据,让模型学会如何进行复杂的逻辑推理。结构化数据理解能力的训练则专注于表格数据,让模型学会如何解读和分析各种格式的结构化信息。代码生成能力的训练涵盖了数据科学常用的各种Python库,如Pandas、NumPy、Matplotlib等。这个阶段使用了约47万个样本,序列长度为8K tokens,确保模型在各个单项能力上都达到了较高水平。

然而,单纯掌握这些独立技能还不足以完成复杂的数据科学任务。就像一个人会炒菜、会调味、会摆盘,但不一定能做出一桌好菜一样。第二阶段的多能力智能体训练就是要让模型学会如何综合运用这些能力。

这个阶段又分为两个子阶段。首先是冷启动微调,使用约2万个合成的交互轨迹数据,让模型学会基本的交互格式和动作编排。这就像给新手厨师一些标准食谱,让他们熟悉烹饪的基本流程。

接下来是强化学习阶段,这是整个训练过程的核心。研究团队使用了GRPO(Group Relative Policy Optimization)算法,让模型在真实数据环境中通过试错来学习。每个任务会采样多个输出,根据它们的质量计算奖励,然后更新模型参数。这个过程就像厨师在真实厨房中不断实践,根据食客反馈改进技艺。

奖励机制的设计非常巧妙,针对不同类型的任务采用不同的评估标准。对于有标准答案的数据问答和特定分析任务,奖励综合考虑答案的准确性和交互轨迹的质量。对于开放式研究任务,奖励则评估最终报告的五个维度:有用性、丰富性、严谨性、可解释性和可读性,同时也考虑交互过程的成功率和交互轮次。这种设计鼓励模型不仅要得出正确答案,还要生成高质量、易理解的报告。

整个第二阶段使用了约1.5万个样本,序列长度扩展到32K tokens,以支持更复杂的多轮交互。训练数据覆盖了三大类任务:数据问答、特定数据任务(如数据准备、分析、建模、可视化和洞察提取)以及开放式数据研究。通过这种从简单到复杂的渐进式训练,DeepAnalyze逐步具备了处理各种数据科学任务的能力。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">突破数据稀缺的轨迹合成技术

训练DeepAnalyze面临的一个重大挑战是高质量训练数据的稀缺。与文本生成或代码补全等任务不同,数据科学领域缺乏大量的推理轨迹和交互过程记录。即使有一些数据集,也往往只包含指令和最终答案,缺少中间的推理和交互过程。

为了解决这个问题,研究团队开发了一套"数据驱动的轨迹合成"框架,包括两个互补的部分:推理轨迹合成和交互轨迹合成。

推理轨迹合成针对现有的结构化数据指令数据集。这些数据集包含大量的任务指令和答案对,但缺少推理过程。研究团队采用了两步策略来增强这些数据。首先是蒸馏步骤,使用先进的闭源大语言模型作为"教师",提取它们的推理轨迹。当教师模型回答一个数据科学问题时,研究团队会记录它的思考过程,然后验证其答案的正确性。

然而,直接蒸馏得到的推理轨迹质量还不够理想。研究团队发现,即使是最先进的闭源模型,在数据科学领域也没有经过专门训练,它们的推理过程往往忽略了对结构化数据本身的仔细检查。为了强化对数据的关注,研究团队引入了关键词引导的精炼步骤。

这个精炼过程的核心思想是在推理轨迹中插入一些关键性的提示词,引导模型更关注数据本身。研究团队构建了一个关键推理词汇表,包含诸如"但是"、"等等"、"看每一行"、"重新审视结构化数据"这样的词语。在精炼时,系统会随机抽取几个关键词,要求教师模型基于这些词重新组织推理过程。

实验结果显示,这种关键词引导的精炼确实显著提升了推理轨迹的质量。精炼后的轨迹对结构化数据的关注度明显提高,推理过程中会反复检查和验证数据,而不是匆忙得出结论。在消融实验中,使用精炼后数据训练的模型在多个基准测试上的表现都有明显提升。

交互轨迹合成则解决了另一个更困难的问题:如何构建完整的多轮数据交互过程。研究团队设计了一个多智能体系统,包含三个角色:提问者、求解者和检查者。

提问者的任务是观察环境中的数据源,然后根据指定的任务类型(如数据准备、数据分析、数据建模等)生成一个数据科学问题。同时,提问者还会生成一个检查清单,包含交互层面的约束(如交互轮次、使用的代码库)和环境层面的约束(如是否生成了新文件、文件的具体名称等)。

求解者接收到问题和数据源后,使用DeepAnalyze定义的五种动作与环境交互,尝试完成任务。求解者的行为会被完整记录下来,形成一个交互轨迹。

检查者的作用是质量控制。它会根据检查清单,验证求解者的交互过程和环境变化是否符合要求。只有通过检查者验证的轨迹才会被保留作为训练数据。研究团队发现,同时检查交互细节和环境变化能够大幅提升合成数据的质量。

通过这套轨迹合成框架,研究团队构建了一个名为DataScience-Instruct-500K的大规模数据集,总计约50万个样本。这个数据集涵盖了从基础能力训练到复杂交互学习的各个阶段,为DeepAnalyze的训练提供了坚实的数据基础。更重要的是,这个数据集已经完全开源,其他研究者可以直接使用或在此基础上进一步扩展。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">实验验证与性能表现

研究团队在12个不同的数据科学基准测试上全面评估了DeepAnalyze-8B的性能,结果令人印象深刻。

在DataSciBench这个评估端到端数据科学能力的最新基准上,DeepAnalyze-8B达到了61.11的总分,超过了包括GPT-4o-mini(54.18分)、Claude-3.5-Sonnet(52.29分)和GPT-4-Turbo(54.65分)在内的多个先进专有模型。虽然与GPT-4o(64.51分)还有一定差距,但考虑到DeepAnalyze只有80亿参数,这个表现已经非常出色。特别值得注意的是,在数据探索子任务上,DeepAnalyze达到了58.62分,显著超过GPT-4o的57.67分。

在数据分析能力测试(DSBench)上,DeepAnalyze展现了更强的优势。在数据分析任务中,它达到了30.04%的准确率,不仅超过了所有开源模型,还超过了Code Interpreter(GPT-4o)的26.39%。在数据建模任务上,DeepAnalyze的成功率达到90.63%,表现达到45.52分,接近使用GPT-4构建的AutoGen智能体(87.84%成功率,45.52分),而成本为零。

DABStep基准测试评估模型的多步推理能力,DeepAnalyze-8B在这个测试上达到了38.88%的总体准确率,超过了包括Claude-3.5-Sonnet(36.44%)在内的所有对比系统。特别令人印象深刻的是,在困难级别的任务上,DeepAnalyze达到了32.80%的准确率,远超其他系统在这个类别上的表现。这表明DeepAnalyze在处理需要长链推理的复杂任务时具有明显优势。

研究团队还专门构建了DABStep-Research基准来评估数据导向的深度研究能力。这个基准包含五个类别的任务:数据准备、数据分析、数据洞察、报告生成和开放式数据研究。结果显示,DeepAnalyze-8B在所有任务类别上都持续优于对比系统,总分达到3.29分(内容)和3.69分(格式),显著高于GPT-4o、o3-mini等模型。

特别值得关注的是DeepAnalyze在开放式数据研究任务上的表现。这类任务完全没有预定义的研究方向或方法,要求模型完全自主地进行数据研究并生成报告。基于专有模型的智能体系统在这类任务上的表现明显下降,而DeepAnalyze保持了稳定的高水平表现。这证明了智能体训练范式相比传统的工作流方法具有本质优势。

在与数据科学相关的其他能力测试中,DeepAnalyze同样表现出色。在DS-1000代码生成基准上,它达到了61.7%的准确率,超过GPT-4-Turbo的53.9%。在TableQA系列基准测试(评估结构化数据理解能力)上,DeepAnalyze的平均得分为64.47%,超过了之前的最佳模型Reasoning-Table的62.62%。

消融实验进一步验证了DeepAnalyze设计的合理性。移除专门的<Understand>动作会导致在WikiTQ、MultiHiertt和DABStep等任务上的性能下降。课程式训练的对比实验显示,只进行单能力微调或只进行多能力智能体训练都无法达到最佳效果,证明了渐进式训练策略的重要性。关键词引导的推理轨迹精炼也被证明能够提升模型在结构化数据理解任务上的表现。

至顶AI实验室洞见

DeepAnalyze代表了自主数据科学领域的一次重大突破。它首次实现了从数据源到分析师级研究报告的完全自动化流程,不依赖任何预定义的工作流程或规则。这种能力源于研究团队提出的课程式智能体训练范式和数据驱动的轨迹合成框架,这两项创新共同解决了数据科学任务的高复杂性带来的奖励稀疏和轨迹稀缺问题。

从技术层面看,DeepAnalyze的成功验证了几个重要观点。首先,对于需要多种能力的复杂任务,渐进式的课程训练比一步到位的训练更有效。其次,在真实环境中通过强化学习进行智能体训练,能够赋予模型自主编排和自适应优化的能力,这是单纯依赖监督学习或工作流设计无法实现的。第三,针对特定领域的数据合成技术(如关键词引导的精炼)可以显著提升训练数据的质量。

DeepAnalyze的开源发布具有重要意义。模型权重、完整代码和50万规模的训练数据集的公开,为研究社区提供了宝贵的资源。其他研究者可以在此基础上进行改进,或者将相关技术应用到其他需要自主规划和交互的任务中,如数据发现、数据治理、数据生态系统管理等。

当然,DeepAnalyze也还有改进空间。虽然在很多任务上表现出色,但在某些特定任务(如数据建模)上与最强的专有模型还有差距。此外,模型的推理速度和资源消耗也是未来优化的方向。随着基础模型能力的不断提升和训练数据的进一步扩充,DeepAnalyze的能力还有很大的提升潜力。

这项研究标志着数据科学从基于工作流的智能体向智能体模型的范式转变,为下一代智能数据系统铺平了道路。在不久的将来,我们或许能够看到更多类似的系统应用于实际生产环境,真正实现从原始数据到可操作洞察的自动化提取,让数据科学的力量惠及更广泛的人群。

论文地址：

https://arxiv.org/pdf/2510.16872

END

本文来自至顶AI实验室，一个专注于探索生成式AI前沿技术及其应用的实验室。致力于推动生成式AI在各个领域的创新与突破，挖掘其潜在的应用场景，为企业和个人提供切实可行的解决方案。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);">

Q&A

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">Q1eepAnalyze-8B与传统的数据分析工具或基于GPT的智能体有什么根本区别?

AeepAnalyze-8B的根本区别在于它是一个经过智能体训练的模型,而不是基于预定义工作流程的系统。传统工具和基于GPT的智能体通常依赖人工设计的固定流程,遇到预料之外的情况时无法灵活应对。DeepAnalyze则通过在真实数据环境中的强化学习,学会了自主编排行动和根据反馈优化策略的能力。它能够处理从简单问答到完全开放式研究的各种任务,而无需为每种任务设计专门的工作流程。此外,DeepAnalyze只有80亿参数,却能在多个基准测试上超越基于GPT-4o等大型模型构建的系统,证明了智能体训练范式的效率优势。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">Q2:课程式智能体训练是如何工作的,为什么它比直接训练更有效?

A:课程式智能体训练模仿了人类数据科学家的学习路径,分为两个渐进阶段。第一阶段通过单能力微调,分别强化模型的推理、结构化数据理解和代码生成能力,就像学生先学习单项技能。第二阶段通过多能力智能体训练,让模型在真实环境中学习如何综合运用这些能力,类似于实践操作。这种方法比直接训练更有效的原因在于:数据科学任务的复杂性导致基础模型在初期很难成功完成任务,造成严重的奖励稀疏问题。通过先建立坚实的单项能力基础,再进行综合能力训练,模型可以获得更多正向反馈,学习效率大幅提升。实验证明,只进行单能力训练或只进行多能力训练都无法达到课程式训练的效果。

ingFang SC", system-ui, -apple-system, BlinkMacSystemFont, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 17px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;letter-spacing: 0.544px;orphans: 2;text-align: justify;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">Q3:普通用户或企业如何使用DeepAnalyze-8B,它能解决哪些实际问题?

AeepAnalyze-8B已经完全开源,包括模型权重、代码和训练数据,用户可以从GitHub和HuggingFace下载使用。它能解决的实际问题非常广泛:企业可以用它自动生成数据分析报告,从原始交易数据中提取商业洞察;数据分析师可以用它快速完成数据清洗、探索性分析和可视化工作;研究人员可以用它进行开放式数据研究,自动发现数据中的模式和趋势。论文展示的案例包括支付处理费用分析、企鹅种群数据分析等,涵盖数据准备、分析、建模、可视化和报告生成的全流程。对于技术能力较强的用户,还可以基于开源的训练框架和数据集,针对特定领域进行定制化训练,或者通过提示词工程进一步适配特定场景。