药研导航整理
结论摘要:AI 正在进入药物临床试验的多个关键环节,包括患者招募与分层、试验设计优化、数据处理与分析、药物警戒和安全监测。真正影响注册质量的不是“是否使用 AI”,而是能否说明模型的使用场景、数据来源、性能验证、风险控制、人工监督和合规责任。
来源:《药学进展》综述《人工智能在药物临床试验中的应用与挑战》、FDA Artificial Intelligence for Drug Development、EMA 人用和兽用药品生命周期中 AI 应用相关反思文件及药研导航整理。
适用对象:临床开发、药物注册、医学事务、药物警戒、数据管理、统计编程、质量管理、数字化转型和临床运营相关人员。
为什么这篇综述值得药物研发企业关注
临床试验是药物研发中成本高、周期长、数据要求最严格的环节之一。AI 技术正在改变临床试验的信息处理方式:它可以帮助处理非结构化病历、影像、病理、可穿戴设备和真实世界数据,也可以用于患者筛选、风险识别、方案优化和安全信号监测。
但临床试验不是普通的数据分析场景。任何用于支持注册决策、受试者保护或关键研究结论的 AI 工具,都必须回答几个硬问题:数据是否可靠?模型是否可解释?输出能否被验证?错误风险如何控制?谁对结果负责?监管沟通如何开展?
《药学进展》发表的《人工智能在药物临床试验中的应用与挑战》对这些问题做了系统梳理。结合 FDA 和 EMA 近期公开资料,可以看出监管思路正在趋于一致:鼓励创新,但要求基于使用场景、风险等级、数据治理和模型可信度进行管理。
AI 在临床试验中的四类高频应用场景
1. 患者招募与分层
患者招募是临床试验效率的瓶颈。AI 可以通过自然语言处理、机器学习和多源数据匹配,从电子健康记录、既往诊疗信息、实验室检查、影像报告和基因检测结果中识别潜在受试者。
对企业而言,这类应用的价值不只是“招得更快”,还包括更早识别入排标准过窄、中心患者资源不足、特定亚组样本不足等问题。对于肿瘤、罕见病、慢性病和精准治疗项目,AI 辅助分层还可能帮助识别治疗反应差异更明显的人群。
风险点在于:患者数据来源复杂,病历文本不规范,算法可能放大既有偏倚。如果模型用于影响入组判断,企业需要保留人工复核机制,并明确模型输出不能替代研究者医学判断。
2. 试验设计优化
AI 可用于辅助方案设计,例如分析历史试验、真实世界数据和同类药物开发路径,帮助优化终点选择、入排标准、样本量假设、剂量探索和随访方案。
这类应用最适合放在立项、方案设计和关键方案修订阶段。它可以帮助研发团队发现“纸面上合理、执行中困难”的设计问题,比如入排标准导致筛败率过高、访视频率影响依从性、终点选择与真实临床获益之间存在距离。
需要注意的是,AI 给出的设计建议本质上仍是决策支持。用于注册性临床试验时,关键设计依据仍需结合疾病机制、临床意义、统计原则、监管沟通和伦理可接受性综合判断。
3. 数据处理与分析
临床试验数据正在从单一结构化 CRF 数据扩展到文本、图像、可穿戴设备、远程监测、患者报告结局和真实世界数据。AI 的优势在于处理非结构化和高维数据,提取传统人工流程难以及时处理的信息。
典型应用包括:自动医学编码、异常值识别、数据一致性检查、影像或病理图像辅助分析、受试者依从性预测、缺失数据风险预警等。
企业落地时要特别关注审计追踪。临床数据链路必须能回答:原始数据从哪里来?经过哪些算法处理?模型版本是什么?输出如何被人工确认?哪些结果进入统计分析?这些问题如果不能说清,AI 反而会制造新的合规风险。
4. 药物警戒与安全监测
AI 在药物警戒中的价值主要体现在主动信号检测和多源数据整合。自然语言处理可用于不良事件报告提取、医学术语标准化和文献/社交媒体文本筛查;知识图谱可用于构建疾病、药物、基因、不良反应之间的关联网络。
在临床试验阶段,AI 可帮助更快发现潜在安全风险,例如异常实验室指标组合、特定亚组不良事件增多、依从性下降与安全事件之间的关联。
但安全性场景容错率低。任何自动化信号都需要医学和药物警戒团队复核,不能让模型直接替代安全性判断。对外部提交材料而言,模型方法、数据来源、验证结果和人工审核流程都应保留记录。
四个关键挑战:不是技术问题那么简单
1. 技术可靠性与安全性
AI 模型可能受到训练数据质量、样本代表性、模型漂移、外部验证不足和黑箱机制影响。临床试验场景尤其需要关注模型在不同中心、不同人群、不同疾病阶段和不同数据采集方式下是否稳定。
企业应把 AI 工具当成受控系统,而不是一次性软件。模型上线前要验证,上线后要监测,版本变更要记录,关键输出要可追溯。
2. 数据标准化与质量
AI 的表现高度依赖数据。临床试验数据涉及 EDC、CTMS、ePRO、中心实验室、影像、病理、可穿戴设备和真实世界数据,不同系统之间的数据结构、术语、时间戳和缺失规则并不天然一致。
如果没有统一标准,AI 很容易把“数据格式差异”误判为“临床差异”。因此,数据标准、元数据管理、医学编码、数据清洗规则和缺失数据处理策略,是 AI 临床试验应用的前置条件。
3. 伦理与法律责任
AI 可能影响受试者招募、风险分层和研究决策,因此必须考虑知情同意、隐私保护、公平性、偏倚控制和责任归属。尤其在患者筛选和风险预测场景中,模型可能无意中排除某些人群,或者对少数群体表现不佳。
伦理审查不应只看“有没有 AI”,而应看 AI 用在什么决策点、影响多大、是否有人工复核、受试者权益如何保护。
4. 监管与合规
FDA 近年来围绕 AI 支持药品和生物制品监管决策提出风险基础的可信度评估思路,强调模型使用场景、风险、性能验证和生命周期管理。EMA 也强调以人为中心、遵守现有法律要求、考虑伦理和基本权利。
这些监管信号说明,企业不能只说“我们用了 AI”,而要说明“AI 用于什么场景、输出支持什么决策、风险等级如何、验证证据是什么、如何持续管理”。
研发企业落地清单
如果企业计划在临床试验中引入 AI,建议至少建立以下清单:
- 使用场景清单:明确 AI 用于招募、分层、方案设计、数据清洗、安全监测还是统计分析支持。
- 风险分级清单:区分探索性内部辅助、运营效率工具、影响关键试验决策和支持注册提交的不同风险等级。
- 数据治理清单:记录数据来源、数据标准、缺失处理、隐私保护、脱敏规则和跨系统映射关系。
- 模型验证清单:包括训练/验证数据、性能指标、外部验证、适用边界、失败模式和人工复核要求。
- 生命周期清单:记录模型版本、参数更新、性能漂移监测、变更控制和停用机制。
- 合规沟通清单:判断是否需要在方案、统计分析计划、数据管理计划、药物警戒计划或监管沟通材料中说明 AI 使用方式。
药研导航建议
AI 在临床试验中的价值不是把研究者、数据管理人员或药物警戒人员“替换掉”,而是把高重复、低效率、非结构化和高复杂度的信息处理工作前移,让团队更早识别风险,更快形成证据。
真正成熟的做法,是把 AI 纳入临床试验质量体系:明确适用场景,建立数据标准,设计验证流程,保留人工监督,形成可审计记录。这样 AI 才能从“工具尝鲜”变成“研发能力”。
信息来源
- 曹尚,王景朝,潘建红:人工智能在药物临床试验中的应用与挑战,《药学进展》,DOI: 10.20053/j.issn1001-5094.202508250658
- FDA:Artificial Intelligence for Drug Development
- FDA:Considerations for the Use of Artificial Intelligence to Support Regulatory Decision-Making for Drug and Biological Products
- EMA:Reflection paper on the use of artificial intelligence in the lifecycle of medicines


