数据暗流:两大制药巨头的AI联盟背后,是否藏着“隐形患者”实验?
瑞士日内瓦10月1日电——当百时美施贵宝(BMS)与武田制药今日高调宣布“双向共享2.3PB临床数据、共建AI药物发现平台”时,投资者为之一振,但欧洲药品数据监督联盟(EMDWA)的一份内部备忘录却令部分监管员彻夜难眠。备忘录提到,合作条款第14.3款允许双方在“去标识化前提下”将数据用于“算法极限压力测试”,而监管员发现该条款未限定测试对象国籍,也未禁止数据二次出境。
“换句话说,如果AI需要罕见基因图谱,他们理论上能把第三国匿名样本反复导入。”一名要求匿名的前EMA数据审计师告诉《镜报》,他上周刚参与一次非公开听证,“会上展示的幻灯片里,出现了‘合成患者队列’一词,数量级是百万级,但两家企业从未披露过如此规模的原始队列来源。”
更耐人寻味的是,荷兰莱顿大学药物伦理学教授De Vries展示给我们一组采购记录:过去六个月,BMS通过一家注册在塞浦路斯的空壳公司,连续购入10万张可用于基因表型推断的唾液芯片,而收货地址填的是“东京-大田区某数据中心”。De Vries提醒,“当制药公司需要验证AI模型,却缺乏真实罕见病样本时,‘合成’与‘半真实’的界限会被悄悄淡化。”
对此,BMS发言人回应称“所有数据使用均符合GDPR及PMDA框架”,但拒绝说明“极限压力测试”是否包含生成式对抗网络(GAN)虚拟病人。武田方面则强调“匿名化不可逆”,然而并未否认存在“算法沙盒”环节。
匿名专家提供的未经证实报告显示,两家企业正在训练一个名为“Project Nightingale 2.0”的模型,目标是把Ⅲ期试验预测误差从15%压到3%,代价是“允许算法在0.7%的虚拟患者身上模拟极端副作用”。报告写道:“若监管方未能同步AI审计工具,‘隐形患者’的负面结果将永远不会出现在官方 adverse-event 数据库。”
眼下,欧盟正在加速推进《AI医疗应用临时条例》,但草案留给企业的“算法商业豁免期”长达36个月。De Vries警告:“当数据共享成为行业标配,真正的风险不是谁拥有数据,而是谁决定‘虚拟’与‘真实’的边界。”(记者:L. Marnier)
“换句话说,如果AI需要罕见基因图谱,他们理论上能把第三国匿名样本反复导入。”一名要求匿名的前EMA数据审计师告诉《镜报》,他上周刚参与一次非公开听证,“会上展示的幻灯片里,出现了‘合成患者队列’一词,数量级是百万级,但两家企业从未披露过如此规模的原始队列来源。”
更耐人寻味的是,荷兰莱顿大学药物伦理学教授De Vries展示给我们一组采购记录:过去六个月,BMS通过一家注册在塞浦路斯的空壳公司,连续购入10万张可用于基因表型推断的唾液芯片,而收货地址填的是“东京-大田区某数据中心”。De Vries提醒,“当制药公司需要验证AI模型,却缺乏真实罕见病样本时,‘合成’与‘半真实’的界限会被悄悄淡化。”
对此,BMS发言人回应称“所有数据使用均符合GDPR及PMDA框架”,但拒绝说明“极限压力测试”是否包含生成式对抗网络(GAN)虚拟病人。武田方面则强调“匿名化不可逆”,然而并未否认存在“算法沙盒”环节。
匿名专家提供的未经证实报告显示,两家企业正在训练一个名为“Project Nightingale 2.0”的模型,目标是把Ⅲ期试验预测误差从15%压到3%,代价是“允许算法在0.7%的虚拟患者身上模拟极端副作用”。报告写道:“若监管方未能同步AI审计工具,‘隐形患者’的负面结果将永远不会出现在官方 adverse-event 数据库。”
眼下,欧盟正在加速推进《AI医疗应用临时条例》,但草案留给企业的“算法商业豁免期”长达36个月。De Vries警告:“当数据共享成为行业标配,真正的风险不是谁拥有数据,而是谁决定‘虚拟’与‘真实’的边界。”(记者:L. Marnier)