商汤科技的人工智能技术具有多模态、多任务、通用化的特点,涵盖感知智能、自然语言处理、智能内容生成等原创技术领域。
感知智能:在计算机视觉的卷积神经网络领域,商汤科技的AI 框架 senseparrots 支持 50 亿参数超大视觉模型的训练,能够推动整个视觉领域的性能边界突破。商汤的 SenseAutoCabin 智能车舱方案包括驾驶员感知系统、座舱感知系统、智能进入等功能,驾驶员感知系统基于优秀的视觉感知技术,能够隔空感知驾驶员的注视区域及视线方向,提供无接触式的车舱交互,减少点触操作频率。
自然语言处理:商汤科技的千亿大模型 “商量(SenseChat)”,能进行自然语言对话、回答问题、文本生成等。“商量” 5.0 版本在数理逻辑上能够更深入理解和处理复杂的逻辑结构及问题,在知识储备上具备时效性的知识库,可实时更新并补充知识。在 SuperCLUE 中文基准测试中,该版本首次超越 GPT-4 Turbo 实现登顶,尤其在长文本、生成创作、角色扮演、安全能力、工具使用上处于全球领先位置。此外还有医疗健康大语言模型 “大医(SenseChat-Medical)”,可实现检验检查问答、电子病历生成、线上问诊、导诊、随访、辅助诊断等多项医疗任务。
智能内容生成:商汤科技的 “秒画(SenseMirage)”AI 文生图平台,可根据输入的描述生成图片;“VIMI 可控人物视频生成” 技术,能生成人物视频;“如影(SenseAvatar)” 数字人生成技术打造数字人;“办公小浣熊(Raccoon)” 智能办公助手,自动实现数据清洗和筛选。
计算机视觉:商汤的算法创新基石 “SenseParrots” 是其领先的视觉算法训练框架,能高效利用 GPU 集群算力。如 “琼宇SenseSpace”3D 大场景重建技术、“格物(SenseThings)”3D 小物品重建技术等。
智能遥感解译:例如 “地界(SenseEarth)” 智能遥感解译技术,可实现地物分类、作物识别等功能。