“医疗”遇见大模型,
创新点咋把握?
专利咋布局?
【摘要】随着AI大模型,尤其是DeepSeek的出现,使得低成本、高性能的大模型部署成为可能,并开始在医疗行业广泛使用。基于医疗行业的特殊性,在医疗大模型的训练、医疗数据的处理、医疗知识库的建立,尤其是医疗领域的多种细分场景的“AI智能体”,都有很多技术创新的地方,需要认真做好评估,做好专利保护。
随着AI大模型,尤其是DeepSeek的出现,使得低成本、高性能的大模型部署成为可能,并在各个领域(例如:影视行业、医疗行业、金融行业、教育行业、自动驾驶)开始广泛使用,例如:影视行业和大模型的结合,使得“自动剧本生成”、“智能剪辑”成为现实,大大提升了创作效率并降低了成本;医疗行业和大模型的结合,使得“高精度医学影像分析”、“个性化健康预测”成为现实。
大模型在医疗行业的应用效果,取决于用于训练的数据质量的高低,及高质量训练数据的种类多少及数量大小,尤其体现在“稀缺性应用场景”中,这在医疗领域中体现得尤其明显。例如,甲医院遇到A种类疾病比较多,当然也积累了大量的A种类疾病的各种数据,包括:文字数据、视频数据、音频数据等;而乙医院可能一年就遇到几个A种类病例,当然这方面积累的数据就比较少。如果乙医院部署医疗大模型,用于疾病诊断,那么由于“A种类疾病的病例”数据比较少,导致训练出的医疗大模型在疾病诊断结果的准确性上存在一定的问题。
解决这一问题的办法,是实现医院数据的流通。但是,由于信任机制缺失,导致数据“不敢”共享;价值牵引缺失,导致数据“不愿”共享;互通机制不畅,导致数据“不能”流通,因此,需要建立以数据为枢纽的协同创新机制。
有个可信的第三方,且第三方具有AI数据加工及安全管理能力,是医疗机构数据需求各方的客观需求,而 “北电数智”就是这样的第三方。
“北电数智”即北京电子数智科技有限责任公司,是北京国资委旗下的国企,因此,医院把医疗数据交给“北电数智”,信任还是有的,减少了数据“不敢”共享的顾虑;同时,“北电数智”拥有一批优秀的AI算法人才,对各个医院托管的医疗数据进行“数据清洗”,并将清洗后的数据部署在一个“安全”、“可信”的环境中,对外提供训练数据的服务,将获取的收益分配给各个托管方(医疗机构),从而使得各个医疗机构“愿意共享”,也实现了医疗数据的“自由”流通。
医疗训练数据的问题解决以后,有AI能力的医疗机构,自己就可以训练自己的“医疗大模型”并建立医疗知识库,同时搭建多种智能体用于各个医疗细分场景中。而缺乏AI能力的医疗机构,往往依靠第三方(例如:AI大模型公司、类似“北电数智”的机构)来帮助自己训练“医疗大模型”,建立医疗知识库,并搭建多种智能体供自己使用。
那么,围绕“医疗大模型”、医疗知识库、搭建的多种智能体,都有哪些技术创新点,如何进行专利布局呢?
“医疗大模型”训练前的数据处理环节,包括医疗数据标注、医疗数据增强等技术,往往会涉及特有的技术创新手段,结合技术创新的特点,可以考虑以专利或商业秘密的方式进行保护;“医疗大模型”训练算法的技术创新,往往以技术秘密的方式进行保护,但一些在医疗行业中,较为通用的算法,宜以专利的方式进行保护。
医疗知识库的建立,包括数据清洗、知识更新、表格内容提取等技术,涉及的创新手段,结合技术创新的特点,可以考虑以专利或商业秘密的方式进行保护。
在这里,我们重点讨论关于“医疗智能体”的专利布局策略。
所谓的“医疗智能体”,相当于医生或患者的AI助手,用于医疗细分场景中,帮助医生或患者处理特定的业务。
例如:
在“口腔矫治”领域,医生可以借助“AI智能体”,基于获取的口腔图像,通过大模型图像分析,进行口腔疾病识别,并输出“治疗方案”以及“矫正器设计/调整方案”,供医生参考。更为重要的是,还可以进行“用户矫治效果预测”(例如:排牙后面型预测、排牙后图像预测、效果评价等)、“矫治器预测”(例如:矫治器形变预测、质量检测;矫治器是否合适判断、舒适度预测)、“矫治器力学分析”等。围绕上述细分场景的技术创新,友商使用的话,比较容易发现侵权,因此,宜以专利的方式进行保护。
同样,在“口腔矫治”领域,患者可以借助“AI智能体”,通过多模态信息的输入(例如:通过患者语音信息的输入),基于医疗大模型,结合医疗知识库(RAG),对患者所问的问题进行智能问答。例如:牙齿/矫治器护理指导。
在这个过程中,涉及很多的有创新点的技术方案,如图1所示:

在图1中,用户基于“AI智能体”询问相关的问题时,问的问题本身可能存在某种瑕疵(例如:问题过长、上下文缺失等),有可能导致最终的回复很难令用户满意。这个时候,如何将用户问的原始问题转化为符合用户意图的“新的问题”,在这个问题转化过程中,有很多的技术创新手段,而这些技术创新手段,宜以专利的方式进行保护。
“新的问题”获得后,通过向量数据库(“医疗知识库”中的知识,是以“向量”的形式进行存储的),进行检索后,获得与“新的问题”相关的多个知识片段,并根据与“新的问题”的关联度,进行排序。在这个过程中,检索/排序策略的优化,也有很多的技术创新手段,而这些技术创新手段,宜以专利的方式进行保护。
当然,在“医疗知识库”的构建过程中,各种文档的处理,例如:文档切分策略,文档切分后在向量数据库中的存储策略、向量数据库的结构构建等等,都有可能有技术创新的地方,而这些技术创新手段,宜以专利的方式进行保护。
基于“新的问题”获取的相关的多个知识片段,和“新的问题”组合在一起,填写在提示词模版Prompt中,查询大语言模型LLM,获得回复。查询大语言模型的过程中,有可能需要进一步调用外部的API(例如:外部医学期刊库、3D打印设备)。在调用外部API的过程中,对返回的数据如何加工处理,也是有可能存在技术创新的地方,而这些技术创新手段,宜以专利的方式进行保护。
又如:
医生可以借助 “AI智能体”进行个性化学习,如图2所示:

图2
在图2中,基于大模型技术,可以产生多种类型的学习材料(素材库),并以知识图谱的形式进行组织。另外,结合医生的个人能力情况,构建医生个人能力模型(用户模型)。
医生可以通过搭建的“AI智能体”,结合医生的个人能力情况,推荐医生需要学习的个性化素材,通过交互界面,医生可以进行个性化学习,并根据医生的学习结果,更新医生个人能力模型。如此循环下去,医生的个性化学习成为可能。
上述医生“个性化学习”场景中,在实现的过程中,存在很多技术创新点,例如:学习素材的产生逻辑、推荐优化策略、特有的交互方式、个人能力模型的更新逻辑等等。而这些技术创新手段,宜以专利的方式进行保护。
基于医疗行业的特殊性,“AI +医疗”,尤其是AI大模型和医疗领域的结合,在医疗大模型的训练、医疗数据的处理、医疗知识库的建立,尤其是医疗领域的多种细分场景的“AI智能体”,都有很多的技术创新的地方,需要做好评估,做好知识产权保护。

