Skip to the content.

LHS智能医学系统实用指南

陈安均博士,LHS 技术论坛项目 联合主席,国际 LHS 社区(非营利),加州硅谷

[1/2/2023 更新。英文原文]

目录

  1. LHS 智能医学系统的愿景
  2. 医学证据和知识的生成
  3. 医学知识和模型的传播
  4. 构建 LHS 智能医学系统
  5. 机器学习赋能的 LHS 模拟研究
  6. 机器学习赋能的 LHS 项目实例
  7. 医疗健康数据
  8. 合成患者病历数据
  9. LHS 作为医疗人工智能框架
  10. LHS 相关资源

参考资料

概述

《LHS 智能医学系统实用指南》专注于为软件开发人员和医疗健康机构临床团队提供技术实用信息,帮助您快速启动对未来 Learning Health System (LHS) 智能医学系统的研发和应用。

指南内容基于我对美国医学科学院 (US National Academy of Medicine, NAM) 发表的 LHS 系列报告的理解和解读,以及 LHS 这一新领域迄今为止取得的进展。NAM 提出的 LHS 愿景和制定的 LHS 顶层框架不仅将引导美国整个医疗健康系统向智能医学循环学习和传播系统转型,而且会影响全球各国医疗健康系统的更新。

本指南首先总结了 NAM LHS 系列报告,以期回答 LHS 基本问题:我们为什么需要 LHS?什么是 LHS?谁在搭建 LHS?

然后指南简要描述了应用机器学习 (machine learning, ML) 构建 LHS 小型单元的最新技术发展。亮点是首次使用合成患者数据模拟的机器学习赋能的 LHS (即 ML-LHS),所用数据可在 GitHub 上的 “开放合成患者数据” (Open Synthetic Patient Data) 项目获取。出于示范目的,指南分享了来自不同医院或医疗系统的 LHS 项目实例,这些项目正在为疾病风险预测和精准医疗等不同临床任务构建真实患者的 ML-LHS 单元。为加速 LHS 发展,我提出了一个“合成+真实”数据的新策略,有助于更有效地构建 ML-LHS 单元。

随后的章节提供了有关 ML-LHS 不可或缺的电子病历数据(electronic medical record, EMR 或 electronic health record, EHR)、合成患者数据、数据驱动的机器学习以及其他技术组件的更多详细信息。

指南主要目标:

  1. 为软件开发者和医疗健康机构临床团队提供实用技术信息,帮助快速了解 LHS 的优点并开始研发 LHS。
  2. 解释为什么构建小型 ML-LHS 单元更切实可行,而不应被另一种大而全的 LHS 构想所束缚。
  3. 提出“合成+真实”新策略:首先利用合成患者数据模拟 ML-LHS 单元,然后应用模拟流程帮助构建真实病历数据的 ML-LHS 单元。

指南还对 ML-LHS 提出以下假设:

  1. ML-LHS 性能假设:因其内在的以数据为核心的机器学习方法,ML-LHS 最终可以为大多数疾病和健康状况实现高性能的预测 (>95%) 。
  2. ML-LHS 平等假设:由大医院主导的临床研究网络 ML-LHS 可以有效地用机器学习模型为小型医疗机构赋能,从而减小在医疗服务不足人群中的医疗服务差异 (health care disparities)。
  3. ML-LHS AI 假设:因为 LHS 具有数据驱动和部署导向的特征,大部分基于电子病历数据的 AI 将以 LHS 形式更有效地实现和传播。

LHS 实用指南 是 GitHub 上开放 LHS 项目 (Open LHS) 的一部分,旨在智能医学系统新兴领域,促进全球范围的研究、开发和实施等方面的分享和协作。作为 LHS 的动态技术文档,本指南发布在 GitHub 平台,将在 LHS 新信息出现时进行更新,及时为 LHS 社区提供最新进展。


下一步:

在阅读本快速实用指南后,如果您想尝试病历机器学习或 ML-LHS 研究,可先在 GitHub 上的 开放合成数据项目 查看已有数据。如果您需要新的合成数据,可email我 (ajchen(at) web2express.org) 讨论如何产生新数据。合成数据有望加速您的项目进程,开源 Synthea 技术能够模拟各种疾病或健康状况,可能是您所需的合成数据的起点


【关于 LHS 名称翻译】

LHS 作为新的专业技术术语,本指南采用美国医学科学院发表的 LHS 系列报告中的定义。因为中文直译不能反映 LHS 的核心含义,我这里给出有助于理解的意译。


1. LHS 智能医学系统的愿景

NAM 的 LHS 愿景

“In a learning health system, science, informatics, incentives, and culture are aligned for continuous improvement and innovation, with best practices seamlessly embedded in the delivery process and new knowledge captured as an integral by-product of the delivery experience.” (Source: NAM website - The Learning Health System Series)

LHS 愿景由美国医学科学院(前身为 US Institute of Medicine, IOM, 美国医学研究院)在一系列报告中提出和描述。下面我将总结报告中的相关信息,说明为什么需要 LHS,以及 LHS 是什么,并选出一些实例。如需详细信息,请参阅 NAM 网站上的 智能医学系统报告系列

我们为什么需要 LHS?

NAM report

2006 年,IOM 循证医学圆桌会议召开了一次题为“LHS 智能医疗系统”的研讨会,第一份 NAM 《LHS 智能医疗系统》报告于 2007 年发表。该报告指出美国医疗保健系统的表现仍然不尽人意。在剖析了临床证据的生成和应用过程之后,该报告设想了一个新的医疗健康服务系统,临床证据的产生及应用在医疗服务过程中持续不停地交互发生,即智能医疗保健系统。

在重新评估医疗服务如何产生及应用临床证据后,报告发现当前医疗系统存在以下问题:

医疗失误问题:医学研究院 2001 年的报告《跨越医疗质量鸿沟》发现,每年约有 44,000 至 98,000 名美国人可能死于医疗失误。这个令人担忧的问题说明了重新设计医疗系统关键方面的需求,包括安全性、有效性、以患者为中心、及时性、效率和公平性。

目前广受依赖的随机对照临床试验 (RCT) 虽然在一定情况下很有用,但太耗时、太昂贵,并且普遍适用性可质疑。

临床证据缺乏普遍适用性:临床研究通常不能可靠地产生能普遍适用于现实世界患者群体临床决策的证据。临床研究使用严格的患者纳入和排除标准,限制了大部分临床人群的参与。因此,即使完成了冗长的临床试验,临床医生仍然可能认为研究结果无法应用于自己的更加复杂的患者群体。例如,Masoudi 和同事发现,只有少数 (13-25%) 现实中的心力衰竭患者符合参加临床试验的入选条件 (Masoudi 2003) 。

需要在全系统范围内更加注重临床证据,需要新的临床研究范式,可以更好地利用医疗服务过程中生成的数据,从而加快和改进能支持现实世界临床决策的证据研发。

一份报告表明,一些好的研究结果需要长达 17 年时间才开始用于服务患者 (Balas, Boren 2000)。从创新到临床应用之间的滞后时间亟待缩短。

在系统层面,临床研究与临床服务过程很明显是分离的。该 LHS 报告提出,将临床研究嵌入临床服务过程中可能会解决医疗系统中的这一基本缺陷。

简而言之,如果能够同时开展临床研究和临床服务,就可能提高持续学习和传播的效率和效果,从而大大提高医疗质量并同时降低费用。这就是为什么我们需要 LHS 智能医学系统。

什么是 LHS?

【资料来源:NAM 2007 报告《LHS 智能医疗系统》】

通过重新设计临床研究和医疗健康服务,《LHS 智能医疗系统》报告希望产生和应用最佳证据的过程可成为医疗服务过程本身的有机组成部分,这样就可以使智能医疗健康系统比当前更有效果、更有效率。

智能医学系统的特点:

美国卫生部医疗信息改革协调办公室 (ONC) 设想了一个全国性的智能医学系统 (Friedman 2010)。

重新定义 LHS

【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】

IOM 2013 年报告《低成本的最佳医疗服务:美国通往持续学习的医疗服务系统的途径》重申了 LHS 的愿景。 该报告探索了变革的必要性、使转型成为可能的所需新兴工具、可持续学习的医疗服务系统的愿景、以及实现这一愿景的途径。

NAM report

该报告重新定义了将当前“破碎的”医疗系统转变为智能医学系统的需求:

目前产生新医学知识的方法存在不足,难以提供支持优质医疗服务所需的证据。临床证据不足,并且产生医学知识的方法有明显的局限性。

可能的证据与实际产生的证据之间的差距继续扩大。研究表明,指南中有证据支持的陈述的数量没有达到应有的水平。在某些情况下,40-50% 的指南推荐是基于专家意见、案例研究或医疗服务标准,而不是基于多项临床试验或元数据分析。

目前的研究知识库只能为回答重要类型临床问题提供有限的支持,包括效果比较和长期患者结果相关的问题。

临床指南证据不足会影响医疗服务的证据。在美国,基于临床研究获得的正式证据所做出的临床决策的占比,不同研究有不同的估算,有些研究发现仅占 10-20%。

心脏病发作后 β 受体阻滞剂的广泛使用在各方面来说都是一个成功案例:高质量临床证据生成;治疗方案被纳入临床指南、质量改进计划和医疗质量评价;还有些健康保险计划为提高该治疗方案的采用提供了经济激励。然而,即使做出这么大努力,从该治疗方案最初结果的发表到在临床实践中获得普遍应用,也经历了 25 年的时间。这个例子说明,有必要建设新基础设施,使临床学习和方案改进的过程更容易,争取下一个发现不再需要 25 年的持续努力才能广泛用于服务患者。

为了提高质量、控制成本,需从目前不可持续且有缺陷的医疗系统组织架构,转变为一个可在每个医疗服务环节获取知识并促进持续改善的系统。简而言之,国家需要一个可不断学习的医疗服务系统,这个系统现在既是可能的,也是必要的。

智能医疗服务系统的定义:

“智能医疗服务系统是一种将试验科学、信息学、激励措施和文化有效结合,以达到持续改进和创新的系统,它将最佳临床实践嵌入医疗服务流程中,由患者和家庭在各方面积极参与,并且在临床服务中产生新知识。”(资料来源:NAM 2013 年报告《低成本的最佳医疗服务》)

智能医学系统示意图:

LHSpic

(资料来源:NAM 2013 年报告《低成本的最佳医疗服务》)


不断学习的医疗服务系统的特征

【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】

实验科学与信息学:

患者-医生合作:

激励措施:

持续学习的文化:

谁在建造 LHS?

LHS实例:

临床研究网络LHS实例:

适合软件开发者的 LHS 定义

为了让开发者更容易理解 LHS,本指南提供一个更为简洁的技术性定义:

智能医学系统中的“学习”,是指在人正常学习之外的机器学习、持续学习,最终是系统自我学习。当临床研究和医疗实践无缝有机结合时,传统的知识传播大问题就开始自然地减轻。

从本质上讲,LHS 是关于医学知识产生和使用的基础性变革。接下来的两个章节将深入探讨这类“知识业务”。


2. 医学证据和知识的生成

研究方法

【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】

随机临床试验 (RCT) 是当前临床研究生成医学证据和知识的“金标准”。尽管科学发现的步伐在加快,但临床研究目前并不能充分解决紧迫的临床问题,结果是患者和临床医生都在证据不足的情况下做决定。

即使以目前的知识产生速度,知识库也仅仅能为回答许多最重要临床问题提供有限的支持。一项针对九种最常见慢性病临床指南的研究发现,只有不到一半的指南为患有多种合并症的患者提供治疗指南。

当前大型临床研究方法的成本平均为 1,500-2,000 万美元,有些甚至更高,但这些研究还不能反映许多医疗服务机构的实际情况。

需要新的方法来解决当前临床研究的局限性。替代研究方法包括:

替代方法还需要不同的统计分析:例如

实验性研究与观察性研究

实验性研究方法:

观察性研究方法:

适用于 LHS 的观察性研究方法

NAM 2013 年研讨会总结报告《智能医学系统中的观察性研究》 (OS-LHS) ,回顾了观察性研究的主要方法、如何处理偏差、如何评估治疗异质性,以及在LHS中使用观察性研究方法的其他重要方面。观察性研究可以提供在真实世界临床实践中治疗方法有效性的信息。观察性研究方法是随机临床试验方法的补充,具有以下特点:

观察性研究方法的问题:

关于观察性研究的偏差:

适用于LHS 的大型简单试验研究方法 (LST)

NAM 2013 年的研讨会总结报告《智能医学系统中的大型简单试验和知识生成》 (LST-LHS) ,描述了在 LHS 背景下的 LST 研究方法,并提供了成功的例子。 与随机临床试验相比,大型简单试验能回答有关药物和其他干预措施有效性的一些问题,成本更低、时间更短、或两者兼具。 该报告描述了进行大型简单试验所需的基础设施。使用电子病历是收集和管理大量患者数据必需的,电子病历可让临床试验在临床服务过程中开展。

从许多医疗机构招募足够数量的患者可能需要临床研究网络 (CRN) 或机构联盟。这些网络正朝智能医疗系统模式发展。在 CRN 中,临床医生和研究人员可以从更大的患者群体中学习,检查结果各异的诊断和治疗,找出可产生更好结果的因素。CRN 可以开展更大人群的临床试验,这对研究罕见病或不常见疾病尤为重要。

现在已有数据标准,如 FDA 项目发展出来的临床数据采集协调标准 (CDASH),也有可从多元化的电子病历系统采集数据的电子工具。

详情请见报告中以下专家的介绍:

挑战与新机遇

2016 年,NAM 组织了“加速临床知识的生成和使用”会议,并发表了一篇讨论报告《从最佳医疗服务中生成知识:推进持续的智能医学系统》 (Abraham 2016)。根据报告,尽管嵌入式学习活动大有前景,但临床运作和研究合作的障碍依然存在。

NAM LHS 系列报告发布后,EMR 已迅速在医疗机构中普及开来。同时,随着最近几年计算能力和算法研发的快速发展,NAM LHS 报告中尚未充分讨论的机器学习和人工智能 (AI) 技术出人意料地成为任何临床研究人员皆可运用的常见研究工具。

在我看来,这种前所未有的数字健康数据加之机器学习的环境正在为 LHS 背景下的医学知识生成带来不可估量的可能性。一方面,大量机器学习研究直接使用常规 EMR 数据,已学习和构建了有关诊断和治疗等临床事件的知识库。另一方面,从电子病历数据建造机器学习模型,既不需要先验知识,也不产生传统形式的知识。 机器学习模型,尤其是那些无法解释的模型,将把 LHS 中学习和传播新知识的传统概念推向一个未知领域——在不了解模型的知识来源和知识产物情况下传播机器学习模型。(在这种情况下,我们只知道模型有效,但不知为什么。)


3. 医学知识和模型的传播

通过基于知识的临床决策支持系统传播

【资料来源:NAM 2013 年报告《低成本的最佳医疗服务》】

当前产生和应用新临床知识的系统在很大程度上是相互脱节的,且协调不佳。虽然每年临床数据帮助开发了许多有效的循证临床实践、治疗方法和干预措施,但其中只有一部分被广泛使用。其他许多临床实际仅是在有限范围内使用,未能发挥其改善医疗服务的革新式潜力。

有证据表明,仅仅提供信息尽管速度更快,但很少能改变临床实践。因此,挑战在于如何能够以让临床医生采纳的方式传播知识。

将研究结果用于临床服务的一种技术工具是临床决策支持系统。临床决策支持系统将患者信息与包含临床研究结果和临床指南的数据库集成在一起。该系统生成个性化患者建议,指导临床医生和患者做临床决策。

随着知识生成速度的加快,需要新的方法将正确的信息以清晰易懂的格式传达给患者和临床医生,帮助他们共同做临床决策。报告的相关发现有:

通过预测模型传播

电子病历数据尽管不完美,但可以产出相当准确的统计预测模型,这些模型通常比目前用于预测风险的、基于简单分期策略的模型更好(NAM 2013 OS-LHS 报告)。

正如之前的知识生成部分所述,机器学习模型可以从整个 EMR 或多个 EMR 构建。根据所使用的算法,有些模型是可解释的,有些则不可解释。无法解释的 ML 模型即使是高性能的,它们的传播也将面临挑战。


4. 构建 LHS 智能医学系统

NAM 报告的方法

NAM 2011 年的报告《智能医学系统的数字基础设施:持续改善健康和医疗系统的基础》探讨了利用现有技术及选择创新重点的已有努力和机遇,以确保在一个系统中收集的数据可以跨系统用于各种不同的用途。然而,LHS 基础设施的完整连贯图景仍不明朗。

NAM 2011 年研讨会总结报告《工程设计智能医疗服务系统的未来展望》,回顾了持续反馈和改进医疗服务的质量、安全性、知识和价值的工程方法。智能医疗系统的目标是每次都提供最好的诊疗,并在每次医疗服务中学习和改进。目前,美国在组织、管理和提供医疗服务方面都没能做到令人满意的可靠性、一贯性和可承受性。该报告盘点了可能适用于健康领域的工程学经验教训。然而,它没有提供构建实际 LHS 的指导。

NAM 2013 年的《低成本的最佳医疗服务》报告展示了一个复杂的 LHS,并得出结论:“鉴于系统的复杂性和各个部分的相互关联性,任何一个部分都无法单独达到开发一个不断学习和改进的医疗系统所必需的变革范围和规模。”(第 10 章 281 页)

本指南自下而上的方法

如果仅将 LHS 定义为最终的全国范围的智能医学系统,NAM 报告的上述结论可能是正确的。但这可能不是一个有效的方法 —— LHS 是如此复杂,以至于无人能够开始构建它。

我认为,为了系统实施的可行性目的,我们应该分不同阶段、在不同层面上定义和建造智能医学系统。最重要的是,LHS 的起点应该是现在就可以由一家医院、一个科室或一个小组建立的那种 LHS,无需依赖任何没必要的外部因素。

因此,本 LHS 快速指南采用自下而上的实用方法:将大型复杂的 LHS 分解为小型 LHS 单元;先设计和构建 LHS 单元,用于执行解决问题的具体任务;然后将功能性 LHS 单元连接成子系统。当多个子系统顺利运行后,再将子系统集成更大的智能医学系统。

由于我们仍处于构建智能医学系统的初期阶段,我们应该首先专注于构建足够数量的小型 LHS 单元作为示范。 在现阶段,LHS 领域最容易出成果的是什么?可能是基于 EMR 数据的预测型 LHS。例如,用于提高疾病早期诊断的智能风险预测系统,或个性化用药智能预测系统,都对医院有很强的商业价值,最有可能立项。

焦点:构建机器学习赋能的小型 LHS 单元

本指南侧重于为构建 ML 赋能的小型 LHS 单元 (ML-LHS) 提供实用指导和实例。通过应用机器学习模型,预测型或其他功能性的 ML-LHS 单元有望为医疗服务或公共卫生服务的许多具体任务提高效果和效率。

ML-LHS 单元的主要特性:

  1. 数据驱动。
  2. 机器学习。
  3. 持续学习。
  4. 快速传播。
  5. 自动流程。

现在,相关的开放数据和开源软件使得研发小型但有效的 ML-LHS 变得更加容易,这些技术在 NAM 编写 LHS 报告时还不存在,包括大量可供选择的免费和开源的机器学习算法和工具。在患者数据得到保护的情况下,有些共享的脱敏 EHR 患者数据在数据源网站上申请授权后可获得。对于任何疾病和健康状况,也可以通过 Synthea 等最新技术产生合成的患者病历数据,以补充真实 EHR 数据的缺失。合成数据可方便地用于研发 ML 算法和 LHS 流程、测试或培训。

以下章节将先描述应用合成患者病历首次模拟风险预测 LHS,随后是正在进行中的使用真实 EHR 数据的 ML-LHS 项目实例。基于这些研究的初步结果,我提出一个新的“合成+真实”策略,可更有效地用来构建小型 ML-LHS 单元:首先使用合成病历数据模拟 ML-LHS,然后将其流程应用于真实病历数据。


5. 机器学习赋能的 LHS 模拟研究

通过合成患者病历的新技术,现在已经能够合成病历模拟 EMR,然后用此虚拟数据模拟机器学习赋能的 LHS,探索 ML-LHS 的作用。LHS 模拟是一种研究 ML 算法和 LHS 流程的有效方法,研究结果可用于帮助使用真实患者数据构建 ML-LHS 单元。由于基于公共数据而合成的患者数据不存在隐私问题,LHS 模拟研究可跨机构大规模共享数据和协作研发算法和流程。这个模拟步骤有可能为整体 LHS 项目进度节约大量时间。

我们使用 Synthea 技术合成患者病历,进行了首次 ML-LHS 模拟研究,研究结果发表在《自然科学报告》杂志 (Nature Science Reports) (Chen 2022)。下面是该研究总结。

ML-LHS 核心单元的基本设计

用于风险预测任务的 ML-LHS 核心单元的简化设计如下图所示。该设计着重于模拟两个机器学习核心步骤:(1)从现有的 EHR 数据构建初始 ML 模型,(2)持续机器学习新增数据以改进 ML 模型。这种 LHS 设计利用了 LHS 内在的数据为驱动的 ML 方法。因此,ML-LHS 流程主要侧重于提高 ML 可用数据的质量和数量,以达到改进风险预测 ML 模型的目的。

design

图示:风险预测 ML-LHS 核心单元的设计示意图。1. 先由现有病历数据构建 ML 模型。2. LHS 学习循环持续使用更新的患者数据改进 ML 模型,并将新模型快速应用到风险预测服务中。

肺癌风险预测模拟 ML-LHS 单元

为了模拟一个有 100 万患者规模的真实医院 EHR 的肺癌风险预测 LHS,模拟 LHS 需包含大约 5,000 名肺癌患者。Synthea患者合成软件 共合成了约 150,000 名患者的病历,其中约有 5,500 名患有肺癌。这些 Synthea 患者的 1,300 多万次就诊中有超过 1.75 亿数据点,包括 800 万个诊断、1.11 亿个观察、2,400 万个手术和 1,500 万个药物治疗。

模拟 ML-LHS 的持续学习和改进过程从 30,000 名 Synthea 患者开始,共模拟四次学习循环,每次增添 30,000 名 Synthea 患者。每次更新数据集后,重建新的 XGBoost 预测模型。随着数据集规模从 30,000 名患者增加到 150,000 名患者,肺癌风险预测模型效果逐步提高:肺癌召回率 (recall) 从 0.849 增加到 0.936,精确率 (precision) 从 0.944 增加到 0.962, AUC 从 0.913 增加到 0.963,准确度 (accuracy) 从 0.938 增加到 0.975。如下图,与随机森林算法 (RF)、支持向量机算法 (SVM) 和 K 最邻近算法 (KNN) 的基础模型相比较,Synthea 患者的 XGBoost 肺癌模型的风险预测能力最好。

design

图示:随着数据量增加,肺癌风险预测 ML 模型在不断改进。比较四种算法的召回率 (recall): XGBoost、RF、SVM 和 KNN。初始数据集:30,000 名患者;有四次数据更新,每次增加 30,000 名患者。

以脑梗模型验证 LHS 流程

为了验证模拟研究建立的新型数据驱动的 ML-LHS 流程的可复制性,它应该可以为任何目标疾病(如脑梗)建立高效风险预测ML模型:在相同数量的数据更新迭代后,可达到高召回率和精确率。

Synthea 合成患者的脑梗发生率高于肺癌。每 30,000 患者中约有 4,000 名脑梗患者。与肺癌模型相似,脑梗模型的性能指标也随着每次数据更新而提高。在第四次学习和改进周期中,更新的 150,000 名患者中有 20,000 名脑梗患者,XGBoost 基础模型的关键指标提高到:召回率 0.908、精确率 0.964、AUC 0.948、准确度 0.969 (见下图)。

脑梗模型的结果证实,建立的LHS过程在构建脑梗风险预测的高性能模型方面同样有效。我们预计这种 LHS 过程也将适用于其他疾病。

design

图示:脑梗风险预测 XGBoost 基础模型随着数据量增加而不断改进。 模型性能用召回率、精确度和 AUC 来衡量。含有 10 个变量的基础模型的召回率是基线。

ML-LHS 模拟研究结论

这项模拟研究创建了第一个合成 ML-LHS 单元,并示范了它能够用现有电子病历数据构建肺癌和脑梗等目标疾病的风险预测 XGBoost 基础模型。凭借它固有的数据驱动的机器学习方法,ML-LHS 可以不断从新的患者数据中学习和提高 ML 模型的性能。

合成 ML-LHS 流程可用于帮助使用真实患者数据构建疾病风险预测 ML-LHS。此外,还可以通过超参数 (hyperparameter) 调整进一步优化真实数据 ML 模型。

注:LHS 模拟中的 ML 模型仅能用于研究,不能用于实际医疗服务。

ML-LHS 假设

基于 ML-LHS 模拟研究,我提出两个假设:


6. 机器学习赋能的 LHS 项目实例

ML-LHS 非常有希望将医疗服务和公共卫生服务系统转变为更有效和更高质量的系统。我想在这里着重探讨一个我特别关心的应用领域:健康公平性。

减轻全球医疗服务不公平的潜在解决方案

ML-LHS 平等假设提出,ML-LHS 具有减轻农村及弱势群体的医疗不公平问题的潜力。尽管农村诊所和城市社区卫生中心 (CHC) 没有足够数量的患者来独自构建可完成各种临床任务的高精度 ML 模型,但 ML-LHS 设计可以扩展到临床研究网络 LHS (CRN-LHS), 覆盖 CRN 内的小型诊所。借助 CRN,教学医院或三级医院负责使用包含农村诊所和城市 CHC 的患者数据构建 ML 模型。由此产生的 ML 模型和 AI 工具可在 LHS 内迅速传播,结果是诊所和 CHC 也能使用大医院用的 ML 和 AI 工具。我预计,CRN-LHS 设计提供了一个有前景的解决方案,不仅可减少医疗服务不平等问题,还可以避免小型诊所在医疗 AI 革命中越来越落后。

ML-LHS 挑战

ML-LHS 的概念很有前景,但也面临着巨大的挑战。由于 LHS 同时开展系统层面的研究和临床实践,它对初始 ML 模型的要求明显更高,大多数报道的基于 EHR 数据的 ML 模型可能无法满足这样的 LHS 要求。此外,由于患者数据出于隐私原因无法公开共享,能开放获取的 ML-LHS 研发所需的患者数据集极为不足,开发者缺乏数据的问题严重限制了在新兴 LHS 领域广泛开展机器学习研究的可能性。

自从 2012 年 第一届全美智能医学系统峰会 以来(我有幸受邀参加),几乎没有看到医院临床流程实施和运营 ML- LHS 的文献报告,我期望看到的报告应该展现几个关键的 LHS 特征,包括自动数据收集、连续机器学习、新知识和最佳实践的快速传播等。尽管一些研究已经报告了应用 LHS 概念在医院服务流程中改善质量的成功案例,但这些实例并未采用电子病历数据进行持续机器学习 (Bravata 2020, Horwitz 2019),因此它们不属于 ML-LHS 一类的。

临床正在运营的 ML-LHS 实例

非常可惜,仍未见严格意义的 ML-LHS 原创文献报道。

UCSD El-Kareh 等在 LHS 杂志描述了加州大学圣地亚哥分校医疗系统的 LHS 现状 (El-Kareh 2022),其要点是:


(期待更多成功 LHS 案例……)

构建 ML-LHS 的新策略

由于 LHS 面临的挑战和进展缓慢,国际 LHS 社区 (global LHS community) 需要找到新途径来促进 ML-LHS 的研究和实施。

上述 LHS 模拟研究就是一个新尝试,试图用合成数据帮助医院或其他医疗机构更容易开始 ML-LHS 的研究探索。参照肺癌风险预测 ML-LHS 模拟的流程,华西医院 LHS 团队和桂林医学院附属医院的临床团队对研究人员和学生进行培训,然后使用真实病历数据快速研发出几种疾病的风险预测 ML 模型。该团队正在创建临床研究网络,以实施可提高疾病早期筛查和诊断的 ML-LHS。

根据合成数据模拟对加速医院启动 ML-LHS 研究项目的初步影响,我在这里提出一个新的加速 LHS 研究的策略,即“合成+真实”策略。它将构建 ML-LHS 的艰巨任务分解为两个阶段:

  1. 第一阶段:使用合成患者数据模拟 ML-LHS 的 ML 核心及流程,包括数据流程、ML 算法和团队培训。如果本阶段进行顺利,临床团队将更有信心实现 ML-LHS。
  2. 第二阶段:将模拟流程应用于真实 EHR 病历数据,进行标准数据收集、模型构建和临床验证。然后将研究的循环学习流程嵌入临床服务流程中,再使用医院已有质量评价方法对运行的 LHS 进行严格监控和科学评价。

征集 ML-LHS 实例

促进 ML-LHS 领域的发展需要成功案例,证明 ML-LHS 确实能为患者和医院带来益处和价值。如果您正在开展 ML-LHS 项目,可以通过 Learning Health Community的 LHS 技术论坛计划与我们联系。我们正在联系全球 LHS 社区的专家,收集 LHS 项目实例,了解 LHS 研究和实施面临的挑战,并组织国际 LHS 技术论坛,让产业界和学术界的创新者汇聚在一起,开展对话或合作。LHS 技术论坛计划的网页展示了论坛信息、LHS 资源和发表论文,还有成功 ML-LHS 案例。本指南也将分享更多 ML-LHS 实例。

在以下章节中,我将提供更多有关医疗健康数据、合成患者数据、数据驱动的机器学习等 ML-LHS 所需关键技术的详细信息。


7. 医疗健康数据

NAM 有关临床数据的报告

NAM 2010 研讨会总结报告《临床数据作为医疗系统学习进步的要素 —— 创造和保护一项公共利益》回顾了电子病历在知识产生中的整合和使用。报告讨论了为了调查前沿数据挖掘技术所作的努力,这些技术旨在生成有关医疗健康服务和研究的证据。

项目示例:癌症生物医学信息网格 (caBIG):连接多各生物医学研究和临床试验的参与系统,为癌症研究社区提供共享数据。

NAM 有关系统学习的数据报告

NAM 2013 研讨会总结报告《支持健康和医疗系统持续学习的数据改进的重要性》探讨了数据质量问题以及为知识产生而提高数字健康数据采集和应用的核心战略。

健康数据收集和共享的增加正迅速将医疗系统带入“大数据”时代。数字健康数据在各种不同的环境中产生:

尽管大量健康及健康相关数据的收集有望支持医疗系统大规模和多类型的学习,但仅是数据还不够,还必需共享、整合、分析以及持续管理和提升这些数据,才能实现向持续学习的智能医学系统转型。

电子病历的数据内容

MIMIC-IV 医院数据 为例,信息包括:

患者数据的隐私安全

电子病历的患者数据必须得到隐私和安全的保护。尽管这意味着放慢研发速度,但我们使用患者数据必须遵守当地法律并符合产业标准 (McGraw 2021) 。

开放共享健康数据

适当开放共享部分脱敏的患者健康数据也很必要,因而有少数医疗机构开放了少量数据,这类开放数据要求使用者申请,被授权后才可得到脱敏患者数据。

共享 EHR 数据:

MIMIC-IV 是一个数据库,包含美国马萨诸塞州波士顿的一个三级教学医疗中心收治的患者的真实住院数据。每位患者的综合信息有:实验室数据、用药情况、生命体征记录等。该数据库旨在支持广泛的医疗服务研究。

MIMIC-III(重症病房数据集 III)是一个免费的大型数据库,包含 2001-2012 年间“贝斯以色列女执事医疗中心”重症监护病房的四万多名患者的脱敏健康数据。该数据库包括个人数据、床旁生命体征数值(每小时 1 个数据点)、实验室数据、手术、药物、护理人员记录、影像报告和死亡率(院内及院外)等信息。

CPRD 是一项真实世界临床数据的研究服务,支持回顾性和前瞻性的公共卫生和临床研究。CPRD 从全英国的全科医师服务网络收集匿名患者数据,涵盖 6,000 万患者,其中包括 1,600 万当前登记在册的患者。

PhysioNet Resource 的任务是开展和促进生物医学研究和教育,其中包括免费提供大规模生理和临床数据,以及相关开源软件。

临床研究数据共享:

政府和其他健康数据来源:


8. 合成患者病历数据

由于真实患者数据受到保护,为医疗系统研究和开发提供合成患者数据变得至关重要。完全从公开数据合成的患者数据应该不存在任何隐私问题。例如,Synthea 合成患者数据是根据公共数据合成的,因此最近被广泛用于研发和测试新的医疗服务信息流程。

Synthea 合成患者数据

Synthea 是一个开源的产生合成患者数据的软件,通过模拟虚构患者的病史,它可产生高质量、合成的、逼真但不真实的患者数据,而不受成本、隐私和安全性的限制。它使需要患者数据但却不能合法或实际取得数据的研究得以进行 (Walonoski 2018) 。

Synthea 开源软件:

Synthea 软件源代码 在 GitHub 上的 Synthea 项目网页。按照软件说明,您可以自己运行 Synthea 软件合成患者数据。更多信息见 Synthea wiki

Synthea 系统设计:

Synthea 系统采用基于代理的方法产生合成患者病历记录。每个合成患者都是独立生成的,从出生到死亡的过程中经历各种模块化表达的疾病或健康状况。每个患者都使用系统的所有疾病模块。

Synthea 疾病模块基于 通用模块框架,该框架使用一组预定义的状态、转换和条件逻辑,创建代表常见疾病的进展和诊疗标准的状态机 (state machines) 。模块是根据公开可用的健康数据构建的,包括疾病发病率和患病率统计数据,以及临床服务指南。

Synthea系统覆盖的疾病:

Synthea 目前有 90 多个不同的疾病模块,每个模块都模拟一种疾病或健康状态。模块构建工具页面列出了当前支持的所有疾病模块。模块库只列出一些常用疾病模块。

表格:Synthea 覆盖的最常见疾病和健康状况

患者看全科医生 (PCP) 的前十位原因 致死的前十位疾病和健康状况
婴幼儿定期健康检查 缺血性心脏病
原发性高血压 肺癌
糖尿病 阿尔茨海默病
正常妊娠 慢性阻塞性肺病
呼吸道感染(咽炎、支气管炎、鼻窦炎) 脑血管疾病
一般成人体检 交通事故受伤
类脂代谢障碍 自残
耳部感染(中耳炎) 糖尿病
哮喘 结直肠癌
尿路感染 药物使用障碍(仅限于大麻类控制药物)


Synthea软件的可扩展性

Synthea 的模块设计很巧妙,您可以添加新模块来涵盖您感兴趣但 Synthea 软件尚未包含的疾病或健康状况。详情见以下功能页面:

Synthea 患者病历格式

Synthea 患者病历格式有标准的 FHIR 格式或简单的 CSV 格式。为了更方便地查看不同专项记录中的数据元素,请参阅 病历CSV文档列表 和每个文档中的数据字段。

表格:Synthea 患者病历文件

病历文档 解释
allergies.csv 患者过敏数据
careplans.csv 患者健康计划数据,包括目标
claims.csv 患者医保账单数据
claims_transactions.csv 患者医保账单项目明细数据
conditions.csv 患者诊断或健康状况
devices.csv 患者携带的永久性和半永久性医疗器械
encounters.csv 患者就诊数据
imaging_studies.csv 患者影像元数据
immunizations.csv 患者免疫接种数据
medications.csv 患者用药数据
observations.csv 患者观察结果数据,包括生命体征和实验室报告
organizations.csv 医院等医疗机构
patients.csv 患者个人数据
payer_transitions.csv 付费明细数据(即健康保险付费)
payers.csv 支付机构数据
procedures.csv 手术等医疗流程数据
providers.csv 提供医疗服务的临床医生
supplies.csv 医用品数据


Synthea 数据验证

请参阅 Synthea 患者数据的外部验证研究文献 (Chen 2019)。

开放 Synthea 合成患者数据

Synthea 软件开发者 Mitre Corp(非营利机构)开放一个 100 万 Synthea 合成患者病历数据集,可从其 网站下载。Synthea 数据也可从 FHIR API 获取。

开放 LHS 项目在 GitHub 上启动了一个 “开放合成患者数据项目”,开放了以上 ML-LHS 模拟研究所用的肺癌和脑梗合成患者数据。因为数据量大,全部开放的合成患者数据发布在哈佛大学数据空间 (Dataverse) 上的 “机器学习用合成患者数据空间”。开放 LHS 项目今后陆续会在哈佛数据空间分享更多的合成患者数据。任何人可下载数据,无需申请。

其他合成患者数据

MDClone 平台从真实患者队列数据产生完全合成的患者数据集,而没有暴露患者隐私的危险,并且能够安全地共享数据。MDClone 合成数据是不可逆的、人工合成的数据,它复制了真实世界原始数据的统计学特征和相关性。合成数据利用了关注的离散和非离散变量,使用了统计方法产生全新的数据集,因而不包含可识别真实患者身份的信息。例如,NIH N3C 项目使用 MDClone 从新冠患者数据生成了合成数据集,用于更广泛的研究。

英国的临床实践研究数据链 (CPRD) 使用全科医疗服务的患者数据产生高保真合成数据集,在复制了真实全科患者数据中的复杂临床关系的同时保护了患者隐私。CPRD 合成数据 可以代替真实患者数据,用于复杂的统计分析以及机器学习和人工智能研究应用。通过将异常值分析与图形建模和重采样相结合,CPRD 的方法可以产生合成数据集。在推断机器学习分类器时,合成数据在特征分布、特征依赖性和敏感性分析的统计结果方面与原始真实数据不存在显著差异。 CPRD 合成数据集可用于训练目的或改进算法或机器学习流程 (Tucker 2020) 。

基于来自 NCI 监测流行病学和最终结果 (SEER) 项目的公开癌症登记数据,Goncalves 等人生成并评估了合成癌症患者数据 (Goncalves 2020)。 他们比较了现有的产生合成电子病历的几种方法,每种方法的流程如下:给定一组隐私和真实的 EHR 样本,拟合模型,然后用模型生成新的合成 EHR 样本。结果发现,多项式乘积混合 (MPoM) 方法和分类潜在高斯过程 (CLGP) 方法可以提供具有以下两个特征的合成 EHR 样本:(1)合成数据与隐私真实数据的统计学特性相当,(2)模型的隐私信息泄露并不显著。

使用合成患者数据的机器学习

Synthea合成患者数据的局限

Synthea 患者数据属于符合现实但并不是真实的数据。事实证明,Synthea 数据在开发和测试 ML 方法或流程方面很有用,但 Synthea 和真实患者数据之间的差异决定了 ML 模型的适用范围。Synthea 数据存在多种局限性,包括:疾病种类有限,一些数据偏向于特定患者人群,以及一些健康因素缺失,比如症状。由于这些差异,任何从合成数据构建的 ML 模型都不能用于实际临床服务。


9. LHS作为医疗人工智能框架

医疗服务人工智能

【资料来源:NAM 2019 特别人工智能报告】

NAM 2019 特别报告《医疗服务人工智能:希望、炒作、前途和危险》列出了当前和短期内的人工智能解决方案;强调 AI 在研发、应用和维护方面的挑战、局限和最佳实践;概述了为医疗应用设计的人工智能工具相关的法律和监管环境;优先考虑医疗人工智能对公平、包容和人权的需求;并提出向前推进的关键考虑因素 (NAM 2019,Matheny 2020) 。详情见网络研讨会 视频

人工智能最早在 1950 年代提出并经历了两次“AI 寒冬”。 此次人工智能兴起,大约从 2010 年左右开始,得益于机器学习和数据科技的成功,以及计算存储和能力的显著增加。它推动了像谷歌、亚马逊和苹果等大型消费企业的发展。除了梯度提升、随机森林、支持向量机、人工神经网络等常见的机器学习技术外,基于各种神经网络的深度学习系统也将人工智能发展推向了新的高度。

人工智能有望在医疗健康领域取得变革性甚至颠覆性的进展。下表列出 NAM 报告中提到的机器学习在医疗健康领域的一些应用。

表格:机器学习的一些医疗健康服务应用

用户组 医疗健康服务应用
患者及家属 健康状况监测
患者及家属 疾病风险评估
患者及家属 疾病预防与管理
临床医生护理团队 早期检测、预测和诊断工具
临床医生护理团队 精准医疗和个性化医疗
公共卫生 发现高风险人群
公共卫生 人群健康


然而,在医疗服务中部署和使用 AI 的例子很少,并且鲜有证据表明部署 AI 工具后日常医疗服务结果得到了改善。例如,在机器学习风险预测模型研究邻域,有大量关于模型研发和验证的文献,但只有稀少文献数据描述这些模型在医疗临床服务中成功部署和日常应用,对比鲜明!

尽管如此,该报告描述了一个医疗服务系统和医院对临床 AI 应用进行评估、决策和采用的框架。它强调医疗人工智能应该在LHS智能医学系统的框架下部署和应用。 针对 NAM 2013《低成本的最佳医疗服务》报告中概述的十个推荐领域,它还描绘了该如何在 LHS 系统中考虑每个领域的人工智能问题。

【我的解读】

数据驱动的机器学习

现有的 ML/AI 研究通常缺乏以数据为中心的焦点。然而,近来人们认识到,以数据为中心的 ML/AI 与以模型为中心的 ML/AI 同样重要。

在以模型为中心的 ML 开发中,数据集通常是固定的,重点在于迭代模型架构或优化训练,以提高模型性能。

与此相反,以数据为中心的 ML 专注于系统方法,以评估、整合、清理和注释用于训练和测试 AI 模型的数据,这个流程有可能采用“交钥匙”模型构建器。

斯坦福大学研究人员在《自然机器智能》 (Nature Machine Intelligence) 杂志发表的最新论文讨论了为数据驱动的 AI 建立数据流的最新进展、最佳实践和相关资源 (Liang 2022)。这篇论文源自斯坦福 HAI中心举办的数据驱动 AI 研讨会(详见 报告回放录像)。

在《麻省理工学院管理》杂志 2022 年的采访中,吴恩达博士描述了为什么现在已经是时候侧重 数据驱动AI 的研究和应用了。如需了解他清晰的问题陈述和建议的解决方案,可观看吴博士关于以数据为中心 AI 的线上报告。您还可以在 https://datacentricai.org/ 加入由吴博士推动的数据驱动 AI 运动。

数据驱动和部署导向的 ML-LHS

我认为 LHS 本质上是一种以数据为中心的 (data-centric) ML 方法,这是由 LHS 的学习循环特征决定的。同时,LHS 还是以部署为导向的 (deployment-oriented) AI 策略。为解决医学知识的系统学习和传播问题,NAM 专家组在重新设计未来 LHS 智能医疗系统时已确认数据驱动和部署导向这两个必要特征,并提出 LHS 框架,把临床研究嵌入临床服务流程中,有机地结合数据驱动和部署导向。可见,这些年 LHS 的有关 ML 和 AI 策略的超前设计一直被忽略了,希望今后 LHS 社区能够把 LHS 的潜能发挥出来。

LHS = 医疗 AI 框架?

在 LHS 框架下,数据驱动与模型渠道并不互相排斥,而是互相补充。我在《自然科学报告》发表的模拟 ML-LHS 文章中提出,有必要在未来开展研究,探索结合以数据为中心和以算法为中心的两种方法的最佳策略。作为一般性建议,临床团队应当考虑首先使用ML基础模型开展数据驱动的学习循环,部署和运行起 ML-LHS,然后通过调整超参数或修改底层算法来进一步优化 ML 模型性能。

基于这个推理,我提出 ML-LHS 第 3 个新假设:

电子病历范围的机器学习

电子病历范围的机器学习 (EMR-wide ML) 指的是使用 EMR 中所有可得的健康因素和数据进行机器学习,这与仅限于使用少数预先选择的健康因素的传统建模不同。由于大量电子病历数据呈非结构化形式,因此全电子病历范围的机器学习通常使用自然语言处理 (NLP) 技术从文本中提取数据并进行标准化。

根据目标任务的不同,可以采用两大类机器学习算法来构建预测模型:

以下文献报道的研究是 EMR 范围 ML 代表性实例:


10. LHS相关资源

更多 LHS 项目实例

研究和开发

医疗系统

社区

教育

政策


参考资料


鸣谢

感谢韩若冰女士帮助翻译本指南。感谢 Joshua C. Rubin, JD, MBA, MPH, MPP 审阅和编辑本指南。特别感谢美国医学科学院发表 LHS 系列报告,如果没有他们开创性的研究,就不可能有 LHS 的方向。感谢所有引用的参考资料。


©2022-2023 陈安均,版权所有。