人工智能通过健康记录识别疾病
“Phe2vec 旨在为下一代临床系统做出贡献,这些系统使用机器学习来有效地支持临床医生的活动,"研究人员写道. “这些能够扩展到大量疾病、患者和健康数据的系统有望提供一种更全面的方法来检查疾病的复杂性并改善临床实践和医学研究."
在遗传学中,表型是生物体可观察到的物理特征.将表型数据与遗传信息相结合,可以更精确地诊断遗传疾病和病症.患者电子病历是临床研究表型数据的重要来源.
目前,表型算法由研究人员手动硬编码,需要对目标表型或疾病有深入的了解.此外,这些结果需要验证,这是一个耗时的过程.
为了改进现有流程,研究人员使用人工智能机器学习从训练数据中学习,而不是硬编码. Phe2vec 是一种可扩展的人工神经网络,它使用无监督学习框架进行基于 EHR 的表型分析.
“Phe2vec 使用嵌入空间中与种子概念(例如,ICD 代码)的语义接近度,推导出医学概念的基于向量的表示,即嵌入来定义疾病表型,"科学家们写道. “然后在患者级别汇总嵌入,以根据与嵌入空间中表型的距离来识别与特定疾病相关的人群."
在这项研究中,研究人员对西奈山卫生系统数据库中超过 190 万患者的电子健康记录进行了去识别化处理,并汇总了每位患者的一系列信息,例如生命体征、实验室测试、药物、程序代码、诊断和临床记录.
“这种方法的性能与其他广泛采用的 EHR 表型方法相当或优于其他方法,"研究人员报告说.
研究人员将 Phe2vec 与现有的称为 PheKB 的黄金标准进行了比较,适用于十种不同的疾病,包括腹主动脉瘤、心房颤动、注意力缺陷多动障碍 (ADHD)、自闭症 (ASD)、克罗恩病、痴呆、带状疱疹、多发性硬化症、镰状细胞病和 2 型糖尿病 (T2D).
据研究人员称,Phe2vec 的性能与 PheKB 算法一样好或更好,具有更高的总体阳性预测值 (PPV).
“Phe2vec 在九种疾病中获得了更好的 PPV,对带状疱疹和 T2D 的改善最高,显示出与手动表型相当的定性性能,"研究人员报告说. “总体而言,Phe2vec 和 PheKB 的平均 PPV 分别为 0.94 和 0.82."
通过应用 AI 深度学习从患者电子健康记录中学习疾病表型,研究人员已经实现了一种解决方案,该解决方案利用无监督学习以与现有方法相当或更好的方式发现任何目标疾病的队列.
“Phe2vec 旨在为下一代临床系统做出贡献,这些系统使用机器学习来有效地支持临床医生的活动,"研究人员总结道. “这些能够扩展到大量疾病、患者和健康数据的系统有望提供一种更全面的方法来检查疾病的复杂性并改善临床实践和医学研究."
Copyright © 2021 Cami Rosso 版权所有.