人工智能可以改善医疗技术吗?

                                                                       

要点

  • 在使用患者数据进行机器学习时保护隐私是一个关键因素.
  • 联邦学习使 AI 能够在分布式数据集上进行训练,而无需用户直接提供数据.
  • 科学家创建了一个开源 AI 框架,为多机构医疗影像数据的深度学习提供端到端隐私.

人工智能 (AI) 越来越多地用于医疗保健领域.在使用患者数据进行机器学习时维护隐私是影响医疗保健行业人工智能采用率的关键因素.最近,由慕尼黑工业大学 (TUM) 科学家领导的一项全球研究合作创建了一个开源 AI 框架,该框架为多机构医疗影像数据的深度学习提供端到端隐私,并发表了他们的同行评审研究在自然机器智能中.

人工智能机器学习在许多行业中越来越受欢迎,尤其是在医疗保健行业.根据斯坦福大学以人为中心的人工智能研究所 (HAI) 的2021 年人工智能指数报告,全球范围内,2020 年用于改善人类健康的人工智能私人投资总额为 138 亿美元,比上年增长 4.5 倍).在不需要数据传输的情况下训练机器学习时,医疗保健领域需要创新的解决方案来保护患者的隐私.

来自德国、英国、美国、法国和巴西的全球科学家团队联合创建了一个开源软件框架,用于使用多机构医学影像数据进行端到端隐私保护的去中心化深度学习.

为什么仅靠数据匿名化是不够的

“患者数据在原始机构进行匿名化或假名化,然后传输到分析和模型训练站点(称为集中式数据共享)并存储在那里是很常见的,"研究人员写道. “然而,事实证明,匿名化不能提供足够的保护来防止重新识别攻击.因此,从法律和道德的角度来看,大规模收集、汇总和传输患者数据至关重要.此外,控制个人健康数据的存储、传输和使用是患者的一项基本权利."

该团队的方法是一个名为 PriMIA(隐私保护医学图像分析)的框架.研究人员写道:“我们的框架将差异化私有联合模型训练与模型更新的加密聚合以及加密的远程推理相结合."

据研究人员称,PriMIA 可由用户轻松配置,支持多种医学成像数据格式,并改进了联邦学习训练,其功能包括多样化的数据增强、加权梯度下降/联邦平均、局部早期停止、差分隐私数据集统计信息交换和联邦范围内的超参数优化.

为什么要进行联邦学习

联邦学习是一种使 AI 模型能够在分布式数据集上训练而无需用户直接提供数据的方法.联邦学习的优势在于它提高了隐私性,减少了责任,并减少了上传海量数据集所需的带宽.另一个好处是训练数据驻留在用户的硬件上.

基于真实数据的深度卷积神经网络

超过 5,100 张图像的训练数据集是一个儿科肺炎数据集,放射科医师对其图像质量和代表性进行了审查.验证数据集包含 600 多张图像.

该团队使用联邦学习 (FL) 和 PriMIA(一种与多种医学成像格式兼容的框架)增强的儿科胸部 X 线摄影训练 ResNet-18 深度卷积神经网络 (CNN).

PriMIA 是 PySyft 和 PyGrid 开源隐私保护机器学习 (PPML​​) 工具的扩展. PySyft 是一个 Python 框架,支持加密深度学习和远程任务执行. PyGrid 是一个点对点平台,可让数据所有者管理自己的私有数据集群,用于私有数据科学和联合学习.

为了测试 AI 框架,该团队从两家大学医院收集了 490 多张胸片.该团队报告说,AI 模型的分类“与本地、非安全训练的模型相当."

根据科学家的说法,他们证明了“提供的保护措施不仅可以防止基于梯度的模型反演攻击重建可用数据",而且他们“成功地将经过训练的模型用于端到端的使用安全多方计算结束加密远程推理场景,防止数据和模型泄露."

Copyright © 2021 Cami Rosso 版权所有.

                                               
1
订阅评论
提醒
0 评论
内联反馈
查看所有评论