人工智能合成数据如何为神经科学加速

                                                                       

要点

  • 脑肿瘤可表现为伴有神经精神症状的.
  • 当数据集稀疏且存在隐私问题时,合成数据可用于提高 AI 准确性.
  • Michigan Medicine 展示了使用合成数据检测脑肿瘤的 AI 性能提高到 94% 以上.

合成数据是人工智能 (AI) 中的一个新兴领域,它是一种解决数据集稀少问题的创新方法.由于隐私合规性,一个用例涉及医疗保健和生命科学研究中的患者病历.最近,密歇根大学医院-密歇根医学院使用合成数据将其人工智能检测脑肿瘤的准确率提高到 94% 以上.

脑肿瘤的神经行为和神经精神症状

脑肿瘤可表现为具有神经精神症状的精神健康障碍,如焦虑、抑郁、困惑、、记忆力减退、深刻的人格改变、、愤怒、冲动、和其他常见的精神症状.美国脑肿瘤协会.根据美国临床肿瘤学会 (ASCO),通常在患者出现症状后才诊断出脑肿瘤.如果通过磁共振成像 (MRI) 等方法进行的脑成像显示肿瘤,通过活检或手术获得的组织样本将有助于医生确定肿瘤是否为恶性.

根据 GLOBOCAN 2020 报告,仅去年一年,全球就有超过 300,000 例新的脑和神经系统癌症病例.根据美国国家脑肿瘤协会的数据,在美国,估计有 700,000 名美国人患有原发性脑肿瘤,今年将有超过 84,000 人被确诊.

在人工智能中使用合成数据

合成数据之所以兴起,是因为在人工智能复兴期间,对训练深度学习算法的数据集的需求不断增加.根据 2020 年 5 月发布的一份报告,2020 年全球 AI 训练数据集市场规模为 11.6 亿美元,预计到 2027 年将达到 48 亿美元,2020-2027 年期间的复合年增长率 (CAGR) 为 22.5%.总部位于美国的 Grand View Research.合成数据是 AI 数据集市场中的一个新兴细分市场,可为 AI 机器学习提供高质量的预测建模.

“在开发计算机视觉系统、诊断系统和医学决策支持工具方面,罕见事件是一个常见的瓶颈,"专门研究脑肿瘤治疗的美国神经外科医生 Todd Hollon 博士说,他是首席研究员根据美国新闻最佳医院 2020-2021 排名,密歇根大学医院-密歇根医学院神经外科实验室机器学习 (MLiNS) 是全美 15 大医院之一,神经病学和神经外科排名前 20. “如果这是一种罕见的疾病,诊断就会困难得多,也更难知道最好的治疗方法是什么.所以这就是合成数据的使用非常重要的地方."

“我们有一个原发性中枢神经系统淋巴瘤数据集——我们总共只有 10 个病例——我们想对其中的两三个进行训练,并使用其他进行测试,"Hollon 博士说. “我们的表现并不好,但是当我们开始使用 Synthetaic 数据时,我们在这些情况下的准确率上升到了 90% 以上.我还要强调的是,我们选择了人类错误地将其归类为其他肿瘤类型的案例.因此,我们认为这是最难的数据集,既有罕见的案例,也有人类犯诊断错误的案例.当我们到我们开始获得远远超过人类表现的准确度时,我们知道我们正在做一些特别的事情,而且这项技术确实有机会在这个领域蓬勃发展."

“我们想出了一种方法,可以使用 GAN 生成复杂数据,因此我们可以在显微镜下创建这种真正的人体组织,"Synthetaic 的首席执行官兼创始人 Cory Jaskolski 说. Jaskolski 是国家地理研究员和劳力士国家地理年度探险家奖的获得者,他于 2020 年凭借开创性的图像技术创造帮助重新定义了探索和保护. Synthetaic 是一家总部位于威斯康星州德拉菲尔德的合成数据公司,得到了包括 TitletownTech(Green Bay Packers 和微软)、James Murdoch 的 Lupa Systems 和 Betawork Ventures 在内的风险资本投资者的支持.

“尽管它有细胞核和细胞,但与具有相似特征和对称性的人脸、汽车或猫相比,它非常非结构化,"Jaskolski 说. “我们基本上构建了这个可以构建更多非结构化数据的系统.最重要的是,我们现在可以生成逼真的全新数据,并且能够整体做到这一点."

生成对抗网络 (GAN)

Synthetaic 使用一种称为生成对抗网络 (GAN) 的技术. Synthetaic 的 MEGAN(大规模可扩展 GAN)使神经外科医生 Hollon 博士能够提高密歇根医学的 AI 机器学习在检测脑肿瘤方面的性能.生成对抗网络 (GAN) 是一种用于训练 AI 深度学习的 AI 神经网络,由 Ian Goodfellow、Yoshua Bengio 等人于 2014 年在神经信息处理系统会议上推出. GAN 由两个人工神经网络 (ANN) 组成,它们相互竞争,同时相互训练.生成网络的训练目标是创建其对手判别网络认为来自实际数据分布的样本.生成网络创建合成样本,另一个是判别网络,试图检测样本是创建的还是来自实际数据.

据 Jaskolski 称,Michigan Medicine 发现一种罕见类型肿瘤的准确率从 63% 提高到 94%,并将所有脑肿瘤类型的整体性能从 83% 始终提高到 94% 以上.

“在我的实验室中,确实强调了验证的强度,"Hollon 博士说. “Synthetaic 在开发可能的最佳产品以及更轻松地验证结果和在新数据集上进行测试方面发挥了非常重要的作用."

Copyright © 2021 Cami Rosso 版权所有.

                                               

大众心理健康网(www.dzxl120.com)
本文链接:https://www.dzxl120.com/post/74129.html

0
订阅评论
提醒
0 评论
内联反馈
查看所有评论