新风系统

【AI新星系列报道之三】王本友:让通用医疗AI惠及全球

时间: 2025-04-07 07:01:48 |   作者: 南宫体育

2025年,香港中文大学(深圳)站在了新十年的起点上,作为中国高等教育综合改

  

【AI新星系列报道之三】王本友:让通用医疗人工智能惠及全球

  2025年,香港中文大学(深圳)站在了新十年的起点上,作为中国高等教育综合改革的先锋,这座扎根大湾区,面向世界的年轻学府,在人工智能(AI)领域积累了深厚的科研实力与实践经验,自2014年建校之初,香港中文大学(深圳)便将AI列为战略核心,建立了“基础研究+技术攻关+成果产业化+人才支撑”的创新生态链,目前已打造国际一流科研平台100多个。2016年,大学率先成立机器人和AI制造国家地方联合工程实验室和深圳市大数据研究院。2019年,该实验室升级为深圳市AI与机器人研究院,与深圳市大数据研究院被正式授牌成为深圳市十大基础研究机构,这些科研平台的建立为学校在AI领域的持续创新奠定了坚实基础;十年间,大学在AI领域引进了包括全球高被引科学家和全球2%顶级科学家在内的全球顶级科学家团队,推动了AI领域的跨越式发展;与此同时,学校承担了多项国家重点研发计划和国家自然科学基金项目,并在国际科学技术领域斩获重要奖项,大学的机器人学科在CSRankings机器人领域连续十年被评为中国第一。

  在这片创新沃土之上,一批在AI领域崭露头角的青年学者脱颖而出,他们在多个前沿研究方向取得了重大突破。例如:可以跨尺度微无创介入的手术机器人——微纳机器人;可以自主适应复杂未知环境、智能应对多样化任务场景的通用变形机器人;化学材料领域的AI导师系统;中国首个医疗领域的大型语言模型华佗GPT,成为首个通过国家药剂师资格考试的医疗大型语言模型;融合卫星遥感与企业数据,为“双碳”战略提供高精度决策支持的国内首个碳数据库……

  除此之外,这些青年学者的研究领域涵盖了机器人学、人工智能、计算机视觉、物联网等多个学科,具体涉及多机器人系统、模块化机器人、群体智能、智能低碳、微/纳米机器人、医疗机器人、软体机器人、智能材料、生物特征识别、特种机器人、无人驾驶、海洋机器人、机器人控制等前沿研究方向。

  即日起,我们将推出“AI新星”系列专访,深入报道这些青年学者的研究经历与核心成果,讲述他们如何以创新思维应对国家重大需求与行业挑战。“AI新星”系列不仅是大学创新基因的缩影,更是中国AI迈向世界舞台中央的生动注脚。

  与通用人工智能(AGI)类似,通用医疗AI(Generalist Medical AI - GMAI)致力于构建一个通用的医疗基础模型,该模型无需依赖大量任务特定数据,仅需少量数据即可适配多种医疗下游任务。GMAI的应用场景广泛,涵盖医疗咨询、老人康养陪伴、家庭医生、健康管理、医生助理、临床决策支持、医疗搜索引擎、辅助诊断等。

  面对国家老龄化趋势带来的医疗压力方面,通用医疗AI展现出巨大潜力。当前,国内医务工作者负担沉重,而民众对医疗服务的期待与日俱增。通用医疗AI的应用,有望通过智能化手段提升效率和质量,缓解这一矛盾。

  此外,GMAI的普及有望解决医疗资源分布不均问题。通过人工智能技术辅助改善落后地区的医疗条件,有望使非洲等地区的居民也能享受到与香港、日本等地相当的医疗服务,从而促进全球人口的医疗平权。

  王教授团队敏锐地捕捉到医疗行业中需求和资源分配的矛盾,将目光投向医疗领域。王教授指出,许多领域的专家精通某一专业,常常要上万小时的实践,这种“经验积累”对于人类来说是有限的。但大模型却能够最终靠计算能力和数据处理来“模拟”无数小时的经验积累,并实现知识的快速迭代。

  这种优势使得大模型在医疗等领域的应用前景广阔。它能快速处理和分析海量数据,为医生和患者提供更精准的决策支持。2023年2月,王教授团队在深圳市大数据研究院和香港中文大学(深圳)的支持下,发布了全球首个垂直领域类ChatGPT大模型——华佗GPT。香港中文大学(深圳)副校长罗智泉院士在中华医院信息网络大会(CHINC)上正式对外发布这一成果,在国内外引起强烈反响,标志着医疗领域大模型应用的序幕正式拉开。

  华佗大模型以其技术创新和卓越表现成为医疗AI领域的标杆。这些技术优势不仅重塑了医疗AI的边界,也为未来智能医疗的发展奠定了坚实基础。

  由深圳市大数据研究院和香港中文大学(深圳)联合开发的第二代华佗GPT成功通过了2023年十月份的国家执业药师考试。二代华佗GPT将海量医学数据整合到通用语言模型中,以提升其在医疗领域的专业性。通过统一数据格式和领域适应,模型(如HuatuoGPT-II)在中医等复杂领域表现优异,甚至超越ChatGPT等主流模型,展现了强大的专业能力和泛化性能。

  在医疗场景中,CT、MRI等影像理解至关重要,诊断皮肤病等情况也需要视觉能力。然而,现有医疗大模型普遍缺乏影像解决能力,限制了其在诊断中的应用。华佗GPT-Vision的发布填补了这一空白。其具备了卓越的视觉理解能力,不仅仅可以理解和分析医疗影像,还能完成自动生成影像报告、辅助医生发现潜在病症等任务。这使得它在医疗影像处理上具备了更大的应用潜力。

  开源版本的华佗GPT多模态医疗大模型在Huggingface平台上的每月下载量最高值已突破20万次。值得一提的是,从王本友团队毕业的博士生陈志鸿,在斯坦福大学博士后的工作经历之后,于硅谷获得一笔不菲的融资,开启了他在大模型医疗影像领域的创业之路,深圳播种的医疗大模型种子也在太平洋对岸的硅谷开枝散叶。

  2024年七月份,华佗GPT的多模态版本在主流的MMMU多模态评测集的健康医疗赛道(MMMU Health & Medicine)上,华佗GPT在所有35个模型中取得了总排名第二(仅次于GPT-4v),开源模型中排名第一的优异表现

  HautuoGPT-o1首次将o1技术深度应用于医疗场景,明显提升了医学问题解答的准确性和可靠性,同时展示了o1技术在多领域大范围的应用的潜力。其独特的“慢思考”能力,模拟了医生在真实问诊中的思维方法,通过不断反思和修正诊断结论,为患者提供尽可能准确的诊断意见。此外,该模型实现了思维过程可视化,增强了模型可解释性,帮助医生在处理复杂病例时获取更多诊断信息和灵感。

  在深圳市龙岗区政府的全力支持下,王本友教授联合龙岗区卫健局、国家健康医疗大数据研究院(深圳)、深圳市大数据研究院,成功将华佗GPT应用于导诊场景。该应用不涉及具体的处方或诊断,具有更加好的容错性,有效提升了患者就医体验和医疗资源利用效率。

  华佗GPT通过线上对话形式,为患者提供个性化导诊服务,明显降低了挂错号、找错医生的发生率。其创新的语音输入功能使老年群体也能便捷使用。

  目前,华佗GPT已在龙岗区12家医院上线使用,实现了龙岗各大区属公立医院区域全覆盖。该系统面向龙岗区500万人口12家公立医院提供院前就诊综合性服务,截至目前使用人次达30万,交互次数达52万余次。是全国首个实现的全域多家医院大模型部署联调应用落地,是率先实现基于医院本地知识库与医疗大模型的深层次地融合,率先实现大模型在区域平台快速应用落地的典型方案。华佗GPT还被纳入《深圳市龙岗区创建人工智能全域全时应用示范区的行动方案(2024—2025年)》。

  王本友教授指出,面对人口老龄化和医疗资源紧张的双重挑战,华佗GPT等AI医疗模型的应用将有效缓解医疗压力。通过大模型的智能调控,可实现医疗资源的优化配置,提升诊疗效率,为患者提供更精准、及时的医疗服务。这一实践不仅推动了医疗服务的智能化转型,也为AI技术在医疗领域的深度应用提供了宝贵经验。

  目前医疗大模型的开发大多分布在在中文和英文等主流语言。但在不使用这一些语言的欠发达地区,其应用依然受限。针对这一问题,王本友教授团队发布了Apollo系列多语言医疗大模型。Apollo通过收集不同语言的医疗语料,注入不同语言特定的医疗知识。值得一提的是,Apollo-2模型采用混合专家架构,成功将特定语言的医疗文化知识隔离于特定参数内,这一创新成果已获得ICLR 2025的认可并收录于相关论文中。

  王本友教授开发的医疗大模型Apollo 2覆盖到全球50中语言,可以惠及全球八十亿人口

  2023年8月,王教授的团队与沙特阿拉伯的阿卜杜拉国王科技大学(KAUST)开启了深度合作,携手打造了专为阿拉伯语量身定制的大语言模型——AceGPT。AceGPT凭借其卓越的性能,迅速在全世界内崭露头角,成为目前全球最顶尖的阿拉伯语大模型。

  华佗GPT和Apollo的问世犹如在医疗行业厚重的大门上轻轻撕开了一道小口,透出了一丝变革的曙光。随技术的持续精进与应用场景的不断拓展,通用医疗AI将在未来对医疗行业掀起一场意义深远的变革浪潮。应用场景将从龙岗区起步,逐步扩展至整个深圳,进而辐射至全国乃至全球,成为推动医疗行业变革的关键力量,为全球医疗事业的发展注入强大动力。

  当前,通用医疗AI的发展面临两大主要挑战:一是数据壁垒问题,医疗机构之间的数据难以共享,跨医院、跨区域的数据流通渠道尚未建立;二是应用场景对准确率的高要求,尤其是在处理复杂或罕见病例时,任何小错误都可能会引起系统无法在实际医疗中应用。针对这些挑战,王教授提出,通过医疗教育可能是实现通用医疗AI的关键途径。具体来说,可以构建一个以AI模拟患者为核心的循环系统。AI首先应扮演“患者”的角色,而不是医生。通过让医生或医学生与AI患者进行交互诊断,积累经验,再用这些经验来训练AI医生。逐步在各个科室和医院中建立标准化患者模型和评估体系,形成完整的数据集。同时,医疗教育带来的医生社区能够给大家提供大量可靠的反馈和标注,形成一个持续优化的数据闭环。

  通过这样的形式积累的高质量医患交互数据、评估标准和大量标注,能够在一定程度上帮助训练更加可靠的医疗AI模型。这些模型将深度整合医疗专业相关知识和大模型的智能策略,并建立严格的质量控制体系。通过密集的人工标注和验证,确保大模型输出的可靠性和可信度。这种将专业相关知识与人工智能技术相结合的策略,不仅能让AI更好地理解复杂的医疗情况,还能在实际应用中更加可靠和安全,为通用医疗AI的实用化提供一条稳健的发展路径。简而言之,通过让AI先当“患者”,帮助医生积累经验,再用这些经验训练AI医生,逐步建立起一个高质量的数据循环系统,推动医疗AI的落地和应用。

  王本友,香港中文大学(深圳)助理教授和校长青年教授。主要研究方向为大语言模型和自然语言处理(NLP)。迄今为止,他曾获得了SIGIR 2017最佳论文提名奖、NAACL 2019最佳可解释NLP论文、NLPCC 2022最佳论文和欧盟玛丽居里奖学金,担任了EMNLP 2023的Website Chair和NLPCC 2023的Publicity Chair。其团队开发了华佗GPT大模型,华佗GPT是首个垂直大语言模型,也是首个通过当年国家药剂师考试的大模型,迄今有超过40万次访问,已部署在龙岗区全部12家公立医院。在HuggingFace的累计模型下载量近百万,GitHub的star数量逾万次。

  王本友教授的研究还得到了国内头部企业的支持,包括华为火花奖、华为AI百校计划、腾讯犀牛鸟计划、滴滴盖亚学者计划等。相关研究工作得到了国内外诸多机构包括Meta、Google、微软、AIlen AI、IBM、CMU、耶鲁、UC Berkeley、商汤、字节、华为、阿里等使用或借鉴。

  凭借在大模型领域的卓越贡献,王本友教授团队在全世界内获得了广泛认可。根据大模型权威网站Huggingface的排名,香港中文大学(深圳)王本友教授团队在全球高校中排名第14位。

首页
产品
新闻
联系