返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

中医大模型 ,开源!

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 15:10 |阅读模式 打印 上一主题 下一主题

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);visibility: visible;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);visibility: visible;">团队围绕“望闻问切”的核心理念,结合医学专家的深厚知识、多模态技术的创新应用,以及多生理信号的精准计算,推进模型的精准化和智能化。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);visibility: visible;">源代码:

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);visibility: visible;">http://www.gitpp.com/yxw/bianque

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);visibility: visible;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", "Source Han Sans CN", sans-serif, "Apple Color Emoji", "Segoe UI Emoji";font-size: 15px;line-height: 1.75;color: rgb(5, 7, 59);letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(253, 253, 254);">大模型BianQue(扁鹊)是一个专注于医疗对话的大型语言模型,以下是对其的详细介绍:

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", "Source Han Sans CN", sans-serif, "Apple Color Emoji", "Segoe UI Emoji";font-size: 15px;line-height: 1.75;color: rgb(5, 7, 59);letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(253, 253, 254);" class="list-paddingleft-2">
  1. 模型特点:

  • BianQue是一个经过指令与多轮问询对话联合微调的医疗对话大模型。

  • 该模型旨在强化AI系统的问询能力,模拟医生问诊的过程,特别注重“问”的能力,以更贴近真实医疗场景中的多轮问询。

  • 技术细节:

    • BianQue基于ClueAI/ChatYuan-large-v2作为基准模型进行微调。

    • 微调过程在8张NVIDIA RTX 4090显卡上进行,使用了包含超过900万条样本的中文医疗问答指令与多轮问询对话混合数据集。

    • 微调一个epoch花费了大约16天的时间。

  • 应用场景与目标:

    • BianQue旨在通过模拟医生的多轮问诊过程,提供更准确、个性化的医疗建议。

    • 该模型未来计划围绕“望闻问切”的中医诊疗方法,结合医学专家知识、多模态技术等进行多个版本的模型迭代研究,以提升其在医疗领域的应用效果。

  • 开源与协作:

    • BianQue项目已经开源,便于医疗界、学术界、相关企业等科研力量共同推进模型的专业能力与创新应用。

    • 通过开源和协作,期望BianQue能够成为推动医疗AI发展的重要力量。

  • 版本更新与迭代:

    • 自2023年4月首次发布以来,BianQue团队不断对模型进行迭代和优化,以提升其性能和实用性。

    • 未来,团队将继续围绕医疗领域的需求,推动BianQue模型的进一步发展和完善。

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", "Source Han Sans CN", sans-serif, "Apple Color Emoji", "Segoe UI Emoji";font-size: 15px;line-height: 1.75;color: rgb(5, 7, 59);letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(253, 253, 254);">BianQue作为一个专注于医疗对话的大模型,通过结合指令与多轮问询对话进行微调,旨在提供更贴近真实医疗场景的问诊体验。其开源性质和持续的迭代研究将有望推动医疗AI的发展和应用。

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", "Source Han Sans CN", sans-serif, "Apple Color Emoji", "Segoe UI Emoji";font-size: 15px;line-height: 1.75;color: rgb(5, 7, 59);letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(253, 253, 254);">

    ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;text-wrap: wrap;background-color: rgb(255, 255, 255);visibility: visible;">以下摘自github

    经过调研发现,在健康领域,用户通常不会在一轮交互当中清晰地描述自己的问题,而当前常见的开源医疗问答模型(例如:ChatDoctor、本草(HuaTuo,原名华驼)、DoctorGLM、MedicalGPT-zh)侧重于解决单轮用户描述问题,而忽略了“用户描述可能存在不足”情况。哪怕是当前大火的ChatGPT也会存在类似的问题:如果用户不强制通过文本描述让ChatGPT采用一问一答的形式,ChatGPT也倾向于于针对用户描述,迅速给出它认为合适的建议和方案。然而实际的医生与用户交谈往往会存在“医生根据用户提出的描述进行持续多轮的询问”。并且医生在最后根据用户提供的信息综合给出建议,如下图所示。我们把医生不断问询的过程定义为询问链(CoQ, Chain of Questioning),当模型处于询问链阶段,其次下一个问题通常由对话上下文历史决定。

    结合当前开源的中文医疗问答数据集(MedDialog-CN、IMCS-V2、CHIP-MDCFNPC、MedDG、cMedQA2、Chinese-medical-dialogue-data),分析其中的单轮/多轮特性以及医生问询特性,结合实验室长期自建的生活空间健康对话大数据,构建了千万级别规模的健康大数据BianQueCorpus。对话数据通过“病人:xxx\n医生:xxx\n病人:xxx\n医生:”的形式统一为一种指令格式,如下图所示。

    input: "病人:六岁宝宝拉大便都是一个礼拜或者10天才一次正常吗,要去医院检查什么项目\n医生:您好\n病人:六岁宝宝拉大便都是一个礼拜或者10天才一次正常吗,要去医院检查什么项目\n医生:宝宝之前大便什么样呢?多久一次呢\n病人:一般都是一个礼拜,最近这几个月都是10多天\n医生:大便干吗?\n病人:每次10多天拉的很多\n医生:"
    target: "成形还是不成形呢?孩子吃饭怎么样呢?"

    训练数据当中大量目标文本为医生问询的内容而非仅限于建议,这有助于提升AI模型的问询能力。

    扁鹊-2.0

    基于扁鹊健康大数据BianQueCorpus,选择了ChatGLM-6B作为初始化模型,经过全量参数的指令微调训练得到了新一代BianQue【BianQue-2.0】。与扁鹊-1.0模型不同的是,扁鹊-2.0扩充了药品说明书指令、医学百科知识指令以及ChatGPT蒸馏指令等数据,强化了模型建议与知识能力。以下为两个测试样例。

    • 例1:宝宝特别喜欢打嗝,是什么原因啊,该怎么预防啊

    • 样例2:我外婆近来身体越来越差,带她去医院检查,医生说她得了肾静脉血栓,我们全家都很担心,医生开了不少疫苗用低分子量的肝素钙,我想问它的药理毒理?

    声明:BianQue模型不能替代医疗专业人士的建议和诊断。用户在使用模型时,应保持理性判断,不应过分依赖或轻信模型的输出内容,更不能将其与专业医生的意见相提并论。健康事关重大,请用户谨慎对待。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ