|
随着 AI 技术的快速发展,用户对以算法驱动的 AI 搜索相关能力需求日益增长。AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建 AI 搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。
1.文档解析服务支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标等信息,以结构化的格式输出。 2.图片解析服务针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。 3.文档切片服务提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。 4.多语言向量模型文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。 文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。 向量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。
5.查询分析服务提供 Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。 6.搜索引擎提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的 API 服务组合使用。 7.排序服务提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。 8.大模型内容生成服务提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo(https://x.sm.cn/BYoxwgv)、通义千问-Plus(https://x.sm.cn/6yuEbHj)、通义千问-Max(https://x.sm.cn/EGjIvp5)大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。
1.丰富的 AI 搜索能力:2.灵活的调用方式:3.开箱即用:4.最佳实践:1.创建服务开发实例详情见:https://x.sm.cn/DBrVnDj 2.服务开发 当创建的服务开发实例状态为运行中时,可通过以下入口进入 Notebook 开发环境: 


服务开发能力根据购买的 CPU/GPU 机型,消耗的计算资源计费,CU 单价为1.07元/CU/小时 若完成开发或调试可随时停止开发实例,停止后将暂停计费 对外透出机型: 机型 | 单台机器消耗CU数量 | 单台机器单价(元/小时) | gpu.t4.16g.x1 | 16.07 | 17.193 | ops.basic1.gi.large | 0.61 | 0.65 |
部署服务的价格为:CU 单价*机型消耗的 CU 数量*购买机器个数 如:1台ops.basic1.gi.large 部署开发服务的价格=1.07元/CU/小时*0.61*1=0.65元/小时 本次阿里云 AI 搜索开放平台服务开发能力的发布,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。
|