链载Ai

标题: 通信工程CAD图纸智能化,PaddleOCR-VL ERNIE-4.5联手凯通科技实现“感知-决策-知识”闭环 [打印本页]

作者: 链载Ai    时间: 昨天 17:13
标题: 通信工程CAD图纸智能化,PaddleOCR-VL ERNIE-4.5联手凯通科技实现“感知-决策-知识”闭环

ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);text-align: center;visibility: visible;">

行业背景&痛点

计算机辅助设计(CAD)作为工业软件的重要组成部分,支撑着从产品设计到制造的全流程数字化,被广泛应用于航空、航天、汽车等多个领域。近年来,随着AI技术的发展,CAD与AI的融合成为趋势。国外厂商在这方面已经取得了显著成就,而国内厂商也在迅速追赶,尤其是在AI解决方案和实际应用方面展现出了独特的优势。然而,在CAD图纸智能审查领域仍普遍面临“图纸解析精度低、业务关联难”的技术瓶颈:

场景难点

CAD图纸的结构化特性(方框、列表栏、连接线、拓扑图、说明区域、标题栏)导致智能解析需解决三大核心挑战

方案设计

凯通科技是一家拥有25年通信行业数字化服务经验的国家级专精特新企业,总部位于广州,公司起源于原邮电部电信技术科学研究院,是国内最早参与通信行业软件标准化建设的骨干企业之一。多年来,凯通在通信OSS领域多项产品市场占有率位居前列,并持续拓展智慧能源、智慧城市等场景,积极将百度飞桨与文心大模型技术落地于行业实践。

在长期服务过程中,凯通积累了大量通信工程CAD图纸及深厚的领域知识。面对图纸信息难以结构化、人工审图效率低等共性难题,公司基于自身业务场景,构建了一套“感知–决策–知识”三层智能解析架构。

架构概述

实现过程拆解

阶段1:视觉切割——子图逻辑分离

通过凯通科技自研CV模块对原始CAD图像进行语义分割,输出逻辑独立的子区域,包括系统拓扑图、设备表、局部详图、标题栏等。此步骤确保后续解析聚焦于语义完整的单元,避免跨区域干扰。

阶段2:AI解析与提取——结构化信息抽取

针对不同类型的子图(如拓扑图、图例、表格、图片和标题栏等),系统应用分层协同策略进行解析,并结合PaddleOCR-VL进行结构化信息提取。

阶段3:知识融合与提取——构建可推理知识库

阶段4:智能问答与业务应用——释放数据价值

基于构建完成的知识层,系统以文心大模型ERNIE-4.5-VL为核心调度引擎,驱动多个专业化智能体(Multi-Agent)协同工作,实现从用户提问到答案生成的端到端自动化闭环。ERNIE-4.5-VL不仅承担最终的自然语言生成任务,更在流程中动态调度各 Agent,高效协调语义理解、知识检索、规则校验、信息整合等环节,全面支撑以下智能服务:

效果展示







欢迎光临 链载Ai (http://www.lianzai.com/) Powered by Discuz! X3.5