将医疗AI推向真实世界：启动全国性虚拟护理随机对照研究

摘要

1) 一句话总结 谷歌与Included Health合作启动了一项全国性随机对照试验（RCT），旨在真实世界的虚拟护理工作流中，前瞻性地评估对话式医疗AI的实际表现与安全性。

2) 关键要点

合作与立项：在获得机构审查委员会（IRB）批准后，谷歌与美国医疗服务提供商Included Health合作启动了这项全国性、前瞻性且需知情同意的随机对照试验。
研究目标：在真实的虚拟护理工作流中，针对真实患者的健康问题评估AI的能力，并将其表现与标准临床实践进行对照比较。
前期可行性验证：此前已与贝斯以色列女执事医疗中心（BIDMC）合作完成了单中心可行性研究，观察到了强有力的安全迹象。
核心技术基础一（AMIE）：系统具备诊断与管理推理能力，其底层技术在模拟问诊中的诊断准确性和对话质量曾被验证可媲美甚至超越初级保健医生。
核心技术基础二（PHA）：整合了“个人健康智能体”（PHA）能力，可分析可穿戴设备（如Fitbit实验项目）的睡眠和活动指标，提供个性化健康洞察。
核心技术基础三（寻路AI）：应用了“寻路（Wayfinding）”AI智能体技术，通过主动对话引导帮助患者进行在线健康信息导航。
研发原则：采用分阶段、循证的方法，主张医疗对话式AI应采用与其他医学干预措施同等高标准的证据生成要求。

3) 风险与缺口

AI的局限性：AI在处理真实患者和真实健康问题时存在局限性，明确这些局限性是本次全国性研究的核心评估目标之一。
潜在安全隐患：在真实临床环境的初步应用中存在安全风险，早期的单中心可行性研究需将“安全监督员因安全隐患而介入干预的次数”作为验证系统安全性的关键指标。

正文

我们即将与Included Health合作，启动一项首创的全国性研究，以评估对话式AI在真实世界虚拟护理工作流中的表现。这项研究将超越模拟测试和回顾性数据，旨在收集关于AI在临床环境中大规模应用表现的严谨前瞻性证据。

从模拟测试到真实临床环境

具备临床推理和对话能力的AI系统，有望大幅提升医疗专业知识与护理服务的可及性，同时把宝贵的时间还给医生，让他们能更专注地面对患者。然而，负责任地开发这些技术需要严谨且循证的方法。

过去几年，我们的团队在模拟环境中展示了AI达到临床医生水平的能力，探索了技术的“可能性边界”。我们研究的演进历程包括：

早期能力评估：在《自然》（Nature）杂志发表的研究中，我们首先评估了AI系统的诊断推理能力及其对医生的辅助效果。
模拟对话对比：在由演员扮演患者的模拟环境中，我们将AI的对话诊断能力与初级保健医生进行了对比（即AMIE系统）。
医生监督模式：除了理解AI的能力，我们还探索了以医生为中心、对AI进行异步监督的范式。
单中心可行性研究：作为迈向真实临床环境的第一步，我们与贝斯以色列女执事医疗中心（BIDMC）合作开展了可行性研究。该研究通过安全监督员因安全隐患而介入干预的次数等结果指标，来验证系统的安全性。目前，我们在这项初步研究中观察到了强有力的安全迹象。

大规模评估：全国性随机对照研究

今天，我们宣布在这一持续的研究旅程中迈出重要一步：在获得机构审查委员会（IRB）批准后，我们将与美国领先的医疗服务提供商Included Health合作，启动一项前瞻性、知情同意的全国性随机对照试验（RCT）。

这项新研究将超越初步的可行性测试，旨在：

在真实的虚拟护理工作流中，针对真实的患者和健康问题，评估AI管理患者互动的能力与局限性。
将AI的表现与标准临床实践进行对照比较。

这种分阶段研究医疗对话式AI的方法，确保了在研究推进的过程中，我们能获取越来越多关于患者和医生体验、系统安全性及实用性的数据，从而负责任地指导后续的创新。我们认为，医疗领域的对话式AI应采用与其他医学干预措施同样高标准的证据生成要求。这是确保AI在医疗保健领域安全部署、并与患者和护理团队建立信任的关键一步。

奠定严谨研究的基石

本次研究基于谷歌多年来的基础研究成果，我们系统性地探索了构建安全、有用的医疗AI所需的核心能力：

诊断与管理推理：我们从解决医疗问诊的核心挑战（AMIE）开始。研究表明，通过模拟自我博弈训练的AI系统，在模拟问诊中的诊断准确性和对话质量可以媲美甚至超越初级保健医生。随后，我们将这些能力扩展到纵向疾病管理，使系统能够结合临床指南、患者病史以及多模态证据来制定检查和治疗计划。
个性化健康洞察：健康不仅限于诊所。我们通过“个人健康智能体”（PHA）研究了多模态模型如何分析可穿戴设备的睡眠和活动指标，从而提供个性化的指导和洞察。通过协作式的多智能体架构，PHA展示了AI如何集数据科学家、领域专家和健康教练于一身，这对于全面了解患者的健康背景至关重要。这些洞察也应用于Fitbit Labs的实验项目中（如症状检查器和护理计划），帮助我们了解用户在家中评估症状及为就医做准备时，如何获取个性化支持。
健康信息导航：为了支持人们在网上搜索健康信息，我们展示了一种新型的“寻路（Wayfinding）”AI智能体，通过主动的对话引导、目标理解和量身定制的交流，帮助人们找到更优质的信息。这为如何构建清晰、有用且立足于实际健康旅程的AI交互提供了关键洞察。

结语

诊断与管理推理、个人健康洞察以及健康信息导航——这三个独立的研究方向，为我们在此次及未来研究中评估的AI系统奠定了基础。

与Included Health合作启动的这项全国性随机研究，标志着我们在评估医疗对话式AI方面迈出了重要一步。从实验室里的模拟环境和小规模可行性测试，走向大规模、真实世界的全国性随机研究，我们正在为医疗AI建立新的高标准证据生成体系。

我们的目标是严谨地了解，基于AMIE、PHA和寻路AI等基础研究构建的系统，如何能在虚拟护理工作流中安全、有效地服务于真实的患者。这种分阶段、循证的方法，对于安全负责地开发AI驱动的高质量护理、让所有人都能获得医疗专业服务至关重要。

(注：本项研究是谷歌内部多个团队共同努力的成果，包括Google Research、Google DeepMind、Google Platforms and Devices以及Google for Health，并特别感谢Included Health的合作支持。)

wsl-docs

探索

将医疗AI推向真实世界：启动全国性虚拟护理随机对照研究

摘要

正文

从模拟测试到真实临床环境

大规模评估：全国性随机对照研究

奠定严谨研究的基石

结语

关联主题

关系图谱

目录